100分赠送:请问有没有办法从pdf文件中提取文本内容~~
iTextSharp不是很好用,很多时候那个框架都套不上去.
------解决方案--------------------itextsharp.dll我就是用的这个
------解决方案--------------------哈,据我所知,连pdf自己提取出来的文本都不完美,你还想用....
------解决方案--------------------要看pdf是什么转的了
如果直接影像转的,你怎么也得不到萨
如果是用文本转的,还是可以的
------解决方案--------------------http://www.51aspx.com/CV/PDFControls
Pdf文档在线编辑控件源码及演示
支持Pdf文档在线编辑,并可以进行另存管理。
PdfTestSite为演示文件夹
PdfViewer为控件源码控件
51aspx.pdf为模版文件
注意:服务器端需要安装Adobe Reader以便进行更好的支持
------解决方案--------------------有API就行,没有API就一定不行
你可以截个图,采用ocr的方式,不过准确性很低
其实你应该说一下应用场景
------解决方案--------------------http://www.51aspx.com/CV/PDFControls
------解决方案--------------------比较好用的一个PDF阅读器控件,下载:http://www.nooog.com/down/pdfocx.zip