2013年5月5日星期日

Solidot: pdf2htmlEX: PDF至HTML的精确转换

Solidot

奇客的资讯,重要的东西

pdf2htmlEX: PDF至HTML的精确转换
http://solidot.org.feedsportal.com/c/33236/f/556826/s/2b85df74/l/0L0Ssolidot0Borg0Cstory0Dsid0F34576/story01.htm
May 5th 2013, 05:33

tezcat 写道 "PDF是个好东西,由于支持内嵌字体和丰富的绘图指令,是科学论文,排版印刷的不二之选。几乎任何文档都可以转化成PDF。
但是在线看PDF的体验通常比较糟糕。官方插件丑不说,抢夺鼠标键盘焦点,崩溃,安全问题无一不让人懊恼。现在有很多文库类网站,大多是使用基于Flash的插件;Firefox和Chrome都有了内置PDF阅读器,然而本质问题还是没有解决,比如说PDF文件一定是完全下载下来之后才能看,而网页通常是边下边看;比如说PDF页面通常独立于引用的网页,无法交互,而网页间可以很好地互动;再比如说PDF的页面不能跟网页融为一体,设计的再好的网页,嵌一个PDF进去形象立马打折。
这么说其实有点不公道,因为PDF本来就不是为了网页设计的。但是PDF如此流行在互联网如此发达今天,就没有什么好办法在线浏览PDF文档么?
那么来看看这几个链接
排版
论文
杂志
你花了多久意识到它们是HTML而不是PDF呢?
这几个HTML都是利用pdf2htmlEX从PDF转换而来,在保持显示准确的同时,加入了自定义主题,边下边看等功能。在Linux/Mac下,由于系统的字体渲染方式和PDF的比较接近,显示效果可以以假乱真。在Windows下,Firefox/IE的效果会不错,Chrome的效果尚可。
使用pdf2htmlEX,你可以用LaTeX精心设计个人简历,然后转换成HTML,加入自定义样式,甚至于Google Analytics,而后无缝嵌入个人主页里。
使用pdf2htmlEX,网盘类服务可以提供更好的文档预览界面,用户再也不用看到各种丑陋的插件了。
pdf2htmlEX基于GPLv3发布,项目主页是 https://github.com/coolwanglu/pdf2htmlEX 在那里可以找到上面几个原始PDF的链接,你可以点开比较一下显示效果和用户体验。当然这个界面只是pdf2htmlEX作为演示用,并没有仔细设计。网盘MediaFire目前利用pdf2htmlEX实现PDF的功能,比如这个链接。也可以自己上传PDF测试。 "
This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers. Five Filters recommends: Thatcher's Tyrants - The Tanks, The Guns, The Christmas Cards.



You are receiving this email because you subscribed to this feed at http://blogtrottr.com

If you no longer wish to receive these emails, you can unsubscribe here:
http://blogtrottr.com/unsubscribe/cz0/jPbdSR

没有评论:

发表评论

博客归档