日期:2014-05-20  浏览次数:20950 次

使用POI的hwpf操作word乱码
Java code

public void testWord(String file,String newPath) {
        //File file = new File(fileString);
        try {
            FileInputStream in = new FileInputStream(file);
            POIFSFileSystem pfs = new POIFSFileSystem(in);
            HWPFDocument hwpf = new HWPFDocument(pfs);
            Range range = hwpf.getRange();
            StyleSheet styleSheet = hwpf.getStyleSheet();
            TableIterator it = new TableIterator(range);
            // 遍历一个DOC中的所有表格
            while (it.hasNext()) {
                Table tb = (Table) it.next();
                // 遍历表格的行
                for (int i = 0; i < tb.numRows(); i++) {
                    TableRow tr = tb.getRow(i);
                    // 遍历表格的列
                    for (int j = 0; j < tr.numCells(); j++) {
                        // 往表格中插入数据
                        TableCell td = tr.getCell(j);
                        String text = "哈哈,输入中文";
                        int p = td.numParagraphs();
                        Paragraph para = td.getParagraph(p);
                        ParagraphProperties pp = new ParagraphProperties();
                        if(j%2==0){
                            para.insertBefore(text);
                        }
                    }
                }
            }
            // 在表格外面插入内容
            CharacterProperties cp = new CharacterProperties();
            cp.setBold(true);
            cp.setCharacterSpacing(10);
            cp.setChse(cp.SPRM_CHARSCALE);
            cp.setCapitalized(true);
            File outputFile = new File(newPath);
            OutputStream output = new FileOutputStream(outputFile);
            hwpf.write(output);
            output.close();
            
        } catch (Exception ex) {
            ex.printStackTrace();
        }

    }



这是现在用的程序,我的需求是,先读取原来的word信息,包括文字、表格、样式等,然后再输入内容,再生成word文档。

可现在的问题很奇怪,我的原版word里有二个表,当第二个表中文多的话,生成的新word后面就会有乱码尾巴,第二个表中文越多,后面乱码就越多,汗死

为什么会有这个问题呢,不知道先辈们有没有遇到过

网上说,这个未解决中文问题,不知道为什么,我这个可以插入中文的

就是二个表或多个表了,就会有乱码,希望这里有哪位前辈遇到过类似的问题,与解决办法

------解决方案--------------------
晕,怎么不用iText来实现啊?iText提供的API比POI中提供的API好使多了,我就用iText完成了word报表的开发
------解决方案--------------------
探讨
晕,怎么不用iText来实现啊?iText提供的API比POI中提供的API好使多了,我就用iText完成了word报表的开发

------解决方案--------------------
乱码是因为word中特殊符号的使用吧?比如用了粗体,就多了几个口口。。。
------解决方案--------------------
编码问题
------解决方案--------------------
探讨
引用:
乱码是因为word中特殊符号的使用吧?比如用了粗体,就多了几个口口。。。


粗体什么的,当然会有咯,因为word是
标题
表格
标题
表格
这种形式
标题加粗,居中
可只有一个表格的时候,没有任何问题