日期:2014-05-18  浏览次数:20779 次

java 如何解析RTF格式的 WORD文档
此贴不讨论需求合理不合理,只讨论技术。

需求是这样子的:1.生成word模板文件A 2.下载word文件A,并填写相关内容 3. 上传word文件A,要求对内容进行解析。

方法1:用itext生成rtf格式的文件,然后打算用poi来解析,但是poi只能解析ms格式的word文件
问题1:有什么好的方法解析rtf文件吗? 用java 自带的RTFEditorKit和lius.index.rtf.RTFIndexer只能读取纯文本内容,不能像poi那样对每行每列进行读取。
       或者有什么好的方法,可以将rtf格式的文件转换成ms格式的? (用office的另存为可以实现转换,可不是通过代码实现的)

方法2:用模板生成xml格式的word文件(可参考http://www.havenliu.com/java/514.html),然后把生成的word文件按照xml来解析。 这个没技术难点,但是解析起来很复杂。

大家有什么好的方法推荐推荐,一起学习。 (仅限java实现)
rtf解析

------解决方案--------------------
win下实现用jacob换掉poi即可实现linux下就不知道了
------解决方案--------------------
引用:
引用:win下实现用jacob换掉poi即可实现linux下就不知道了
你是说,jacob可以实现按行,按列解析rtf格式的word文档吗?
按行,按列 什么意思 jacob就是word的一个马甲 word能干的他都可以