日期:2014-05-20  浏览次数:20690 次

About String and read word
我从网上 找了一个 读word的方法,网上 好像 大同小异,只有这种方法。 
import java.net.HttpURLConnection; 
import java.net.URL; 

import org.textmining.text.extraction.WordExtractor; 

public class ReadWord {  


public static String getWordStr(String file ) throws Exception{ 
  
  URL url = new URL(file); 
  HttpURLConnection con = (HttpURLConnection) url.openConnection(); 
  con.setDefaultUseCaches(false);  
  con.setUseCaches(false);  
   
  //指示应用程序要从 URL 连接读取数据 
  con.setDoOutput(true);  
  con.setDoInput(true); 
  String str =null; 
  con.connect(); 
  WordExtractor extractor = new WordExtractor();  
  str = extractor.extractText(con.getInputStream());//由于 对本构造函数 理解不是 很清晰,所以,读的时候是把整个文档全读出来了。 
  return str; 
  
  } 

现在 出现 的 问题 是 如果 那个 word文档 内容 太多的话, 就会 出现 异常,有没有什么 解决办法,extractor.extractText(con.getInputStream()).subString(什么的不行,因为 我不知道它的长度,如果 它长度太短,我这两个索引 就还是 不好取啊。 
  有什么方法可以 解决,有人 读过 么? 今天 就这么多分了,诸位老师 见谅啊。明天我有了 ,肯定加上,谢谢。

------解决方案--------------------

------解决方案--------------------
Java code

len = request.getContentLength();
            b = new byte[len];
            while (i < len) {
                t = in.readByte();
                b[i] = t;
                i++;
            }

------解决方案--------------------
JF
------解决方案--------------------
接点分~