日期:2014-05-17  浏览次数:20911 次

C#读取word文档
我现在要把word文档给读取出来,必须要原样输出,比如文档里有表格,必须输出的也是表格。。求高手帮忙,希望有源码,提供信息者又分。。拜托大家了

------解决方案--------------------
DSOframer 控件 可以读取 office 文件 包括word
------解决方案--------------------
http://luckyjaky.javaeye.com/blog/348789
------解决方案--------------------
不知道你要输出到什么地方?

------解决方案--------------------
我的思想:先转换成网页格式html,再读取,但是这样.html文件里面会有body等属性,你要把他们去掉。
------解决方案--------------------
Word.ApplicationClass wordApp=new ApplicationClass();
object file=path;
object nullobj=System.Reflection.Missing.Value;   
Word.Document doc = wordApp.Documents.Open(
ref file, ref nullobj, ref nullobj,   
ref nullobj, ref nullobj, ref nullobj,   
ref nullobj, ref nullobj, ref nullobj,   
ref nullobj, ref nullobj, ref nullobj);

doc.ActiveWindow.Selection.WholeStory();
doc.ActiveWindow.Selection.Copy();
IDataObject data=Clipboard.GetDataObject();
string str=data.GetData(DataFormats.Text).ToString();
doc.Close();
HTML格式正则获取
------解决方案--------------------
    namespace OfficeManager
    {
                   public WordClass()
            {
                m_WordApp = new ApplicationClass();
            }
                       #region 属性
            public int WordCount
            {
                get
                {
                    if (m_Document != null)
                    {
                        Range rng = m_Document.Content;
                        rng.Select();
                        return m_Document.Characters.Count;
                    }
                    else
                        return -1;