日期:2014-05-20  浏览次数:21442 次

求教高人用apache poi读取WORD文档并保留完整格式的方法。。。
需求是这样的,读取WORD文档
要求保留图片、表格、还有文字的样式、段落等等。最终能在网页上显示出来。
在网上找了很多很多的资料了,jacob不错。但无法在linux下使用。
其他的除了POI还有点希望,基本都悲剧。
我也看到CSDN上有很多类似的帖子,最后都没有得到解决
虽然我知道希望不大,还是到这里来发帖试试。
有知道怎么弄的麻烦告知一下,谢谢!

------解决方案--------------------
我这里有  
可以读取表格 
不能读图片
  但是不能处理
------解决方案--------------------
我这里有加载图片的方法,你可以借鉴一下。

/**
 * 加载照片
 * @param patriarch 图片编辑对象
 * @param wb 文档
 * @param col 列号(从0开始)
 * @param row 行号(从0开始)
 * @param accessoryID
 */
private void loadPicture(HSSFPatriarch patriarch, HSSFWorkbook wb, short col, int row, String accessoryID) {
try{

BufferedImage bufferImg =null;
ByteArrayOutputStream byteArrayOut = new ByteArrayOutputStream();
bufferImg = ImageIO.read(Attachment.download(accessoryID));
ImageIO.write(bufferImg,"jpg",byteArrayOut);
    HSSFClientAnchor anchor = new HSSFClientAnchor(0,0,1000,255,col,row,col,row);
    patriarch.createPicture(anchor , wb.addPicture(byteArrayOut.toByteArray(),HSSFWorkbook.PICTURE_TYPE_JPEG)); //插入图片
    byteArrayOut.close();
}catch (IOException e) {
e.printStackTrace();
}
}