求教高人用apache poi读取WORD文档并保留完整格式的方法。。。
需求是这样的,读取WORD文档
要求保留图片、表格、还有文字的样式、段落等等。最终能在网页上显示出来。
在网上找了很多很多的资料了,jacob不错。但无法在linux下使用。
其他的除了POI还有点希望,基本都悲剧。
我也看到CSDN上有很多类似的帖子,最后都没有得到解决
虽然我知道希望不大,还是到这里来发帖试试。
有知道怎么弄的麻烦告知一下,谢谢!
              
              
------解决方案--------------------我这里有  
可以读取表格 
不能读图片
  但是不能处理
------解决方案--------------------我这里有加载图片的方法,你可以借鉴一下。
	/**
	 * 加载照片
	 * @param patriarch	图片编辑对象
	 * @param wb 文档
	 * @param col 列号(从0开始)
	 * @param row 行号(从0开始)
	 * @param accessoryID
	 */
	private void loadPicture(HSSFPatriarch patriarch, HSSFWorkbook wb, short col, int row, String accessoryID) {
		try{
			
			BufferedImage bufferImg =null;
			ByteArrayOutputStream byteArrayOut = new ByteArrayOutputStream();
			bufferImg = ImageIO.read(Attachment.download(accessoryID));
			ImageIO.write(bufferImg,"jpg",byteArrayOut);
		    HSSFClientAnchor anchor = new HSSFClientAnchor(0,0,1000,255,col,row,col,row);
		    patriarch.createPicture(anchor , wb.addPicture(byteArrayOut.toByteArray(),HSSFWorkbook.PICTURE_TYPE_JPEG));		//插入图片
		    byteArrayOut.close();
		}catch (
IOException e) {
			e.printStackTrace();
		}
	}