急求:正则过滤WORD转换成的HTML的标签,该怎么处理-Java教程-爱易网页

急求:正则过滤WORD转换成的HTML的标签,该怎么处理

日期：2014-05-18　浏览次数：20725 次

急求:正则过滤WORD转换成的HTML的标签
用户发新闻时经常粘贴word里的东西,HTML代码见最下面
新闻列表页要取这样的内容的前200个字,如何过滤.从网上搜的只能过滤一般的html标签,不能过滤如
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office " /> 这样的,
截取前200个字符时可能会形成断位,如下也要过滤掉
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office
这会导致新闻列表页表格混乱等.时间急,请大师们帮忙!

 浸四氟苎麻盘根、高水基盘根、高档油浸棉纱盘根、普通油浸棉纱盘根、 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office " /> <o:p> </o:p> 纤维类盘根应用广泛，   根据各自不同的优良性能可用于 ]+> | </[^> ]+>

public String clearHtml(String str){

Pattern p = Pattern.compile( " <[^> ]+> | </[^> ]+> ",Pattern.CASE_INSENSITIVE );

Matcher m = p.matcher(str);

return m.replaceAll( " ");

}

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

用JavaBean时的异常，实在不知道是咋回事了！

关于父类、子类静态代码块的有关问题

怎么用Criteria实现四表查询

关于jsp页面里javaScript和Ajax请求的加载时机解决思路

查了半天了还是不知道如何用Annotation来弄hash地图

求spring入门书,哪位高手写的比较合适

有关带有内部类的继承有关问题

glassfish 连接总是报错解决方法

求教，java如何取得CPU和内存的使用率？解决100分送上

香港全能空间免费试用15天香港高速云虚拟主机PHP/ASP/NET送MSSQL和MYSQL

急求:正则过滤WORD转换成的HTML的标签,该怎么处理

相关资料更多>

推荐阅读更多>