日期:2014-05-18  浏览次数:20763 次

100分赠送:请问有没有办法从pdf文件中提取文本内容~~
iTextSharp不是很好用,很多时候那个框架都套不上去.

------解决方案--------------------
itextsharp.dll我就是用的这个
------解决方案--------------------
哈,据我所知,连pdf自己提取出来的文本都不完美,你还想用....
------解决方案--------------------
要看pdf是什么转的了
如果直接影像转的,你怎么也得不到萨
如果是用文本转的,还是可以的
------解决方案--------------------
http://www.51aspx.com/CV/PDFControls

Pdf文档在线编辑控件源码及演示

支持Pdf文档在线编辑,并可以进行另存管理。

PdfTestSite为演示文件夹
PdfViewer为控件源码控件
51aspx.pdf为模版文件

注意:服务器端需要安装Adobe Reader以便进行更好的支持
------解决方案--------------------
有API就行,没有API就一定不行

你可以截个图,采用ocr的方式,不过准确性很低

其实你应该说一下应用场景
------解决方案--------------------
http://www.51aspx.com/CV/PDFControls
------解决方案--------------------
比较好用的一个PDF阅读器控件,下载:http://www.nooog.com/down/pdfocx.zip