日期:2014-05-20  浏览次数:20870 次

怎么实现Word文件 百度文档 那种预览效果
就是读 WORD文档  让他在网页上显示预览效果  不需要很多特殊效果  文件内容显示到   网页文本域里就可以

现在想简单的实现点就是把WORD文件内容读到页面上来:
看网上用的POI.JAR  tm-extractors-0.4.jar  处理代码如下
但是运行时有异常

package org.zhou.testFileRW;

import java.io.File;
import java.io.FileInputStream;

import org.textmining.text.extraction.WordExtractor;


public class WordReader {
public static String readDoc(String doc) throws Exception {
// 创建输入流读取DOC文件
FileInputStream in = new FileInputStream(new File(doc));
WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对DOC文件进行提取
text  =  extractor.extractText(in);
return text;

}

public static void main(String[] args) {
try {
String text = WordReader.readDoc("E:/other/00.doc");
System.out.println(text);
} catch (Exception e) {
e.printStackTrace();

}
}

}



异常如下:
Exception in thread "main" java.lang.NoSuchMethodError: org.apache.poi.poifs.filesystem.POIFSFileSystem.getRoot()Lorg/apache/poi/poifs/filesystem/DirectoryEntry;

大家帮忙看看~~~ (~ o ~)~zZ



------解决方案--------------------
楼主有以下方法可以实现你要的效果:
  1、可以直接利用dsoframer插件或者WebOffice插件(内核依然利用dsoframer),不需要读取远程服务器上的word以流的方式打开word而是通过open。。。方法加入访问word的链接地址参数即可在客户端页面打开。非常简单
  2、此方法比较笨,可将word转换成pdf再转换成swf格式,利用flexpaper打开。

------解决方案--------------------
引用:
但是我下的poi-bin-3.7-20101029.tar.gz 最新版本里没有
import org.apache.poi.hwpf.extractor.WordExtractor;
这个包

这个类在poi-scratchpad-3.7-20101029.jar文件中。
3.7挺好的,不用tm-extractors。