C# 如何读取PDF文件内容-C#教程-爱易网页

C# 如何读取PDF文件内容

日期：2014-05-18　浏览次数：21313 次

C# 怎么读取PDF文件内容？
怎么能读取到PDF文件里的内容信息,PDF为全英文文本格式无图片类的东西..
我怎么才能读取到所有信息然后保存到字符串里面..?

------解决方案--------------------
下载 PDFBox-0.7.3.zip

PDFBox-0.7.3.dll
lucene-demos-2.0.0.dll
lucene-core-2.0.0.dll
bcmail-jdk14-132.dll
bcprov-jdk14-132.dll
FontBox-0.1.0-dev.dll
ICSharpCode.SharpZipLib.dll
IKVM.AWT.WinForms.dll
IKVM.GNU.Classpath.dll
IKVM.Runtime.dll
ikvm-native.dll
放入Bin中

C# code


<%@ Page Language="C#" %>
<%@ Import Namespace="System" %>
<%@ Import Namespace="org.pdfbox.pdmodel" %>
<%@ Import Namespace="org.pdfbox.util" %>
<script language="C#" runat="server">
protected void Page_Load(object sender, System.EventArgs e)
{
    string pdfPath = Server.MapPath("index.pdf");
    PDDocument doc = PDDocument.load(pdfPath);
    PDFTextStripper stripper = new PDFTextStripper();
    string txt = stripper.getText(doc);

    Response.Write(txt);
}
</script>

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

C# 如何读取PDF文件内容

相关资料更多>

推荐阅读更多>