日期:2014-05-20  浏览次数:20991 次

我想发帖写写PDF是怎么存储文字的,这有人支持么,有人支持的话,下周一出完整帖子。


研究略有所成。

------解决方案--------------------
支持!!!

------解决方案--------------------
支持发表论文!
------解决方案--------------------
你敢发我就敢学
------解决方案--------------------
必须支持。。。。
------解决方案--------------------
探讨
引用:

你敢发我就敢学


学吧,哈哈。我不保证研究的很对,但是确实有一部分能好用了。

------解决方案--------------------

------解决方案--------------------
[Quote=引用:]

引用:
引用:

你敢发我就敢学


学吧,哈哈。我不保证研究的很对,但是确实有一部分能好用了。


那就期待一下了!

------解决方案--------------------

------解决方案--------------------
下周一
------解决方案--------------------
这个要支持一下
------解决方案--------------------
坚决支持
------解决方案--------------------
你敢发我就敢学

哈哈哈,期待啊,正在愁这个呢,发帖了的话楼主能通知下大家吗?我一定去捧场哈哈哈
------解决方案--------------------
期待中
------解决方案--------------------
PDF 格式跟 PostScript 格式有点像,都是 Adobe 的杰作。

要抠出字来的话,如果不使用其他第三方类库,那需要了解 PDF 格式规范

http://www.adobe.com/devnet/pdf/pdf_reference.html
------解决方案--------------------

------解决方案--------------------
探讨

这些都已经分析完了。剩下的是Abode自己的编码mapping和解析效率的障碍。
如果只用zlib解压完了,还是一些自解释的格式。/F(n) (m) R来标识编码定义,直到下一个/F(n+1) (m) R。
/F(x) y R的定义在解压之前的直接打开PDF的那些文字中有自解释。

<<Font /F(x) y R /F(n) (m) R....>>

然后/F(x) y R的解释在……

------解决方案--------------------
支持共享
------解决方案--------------------
必须支持。。。。