高手！去页面所有标签！然后去掉只留内容-Java教程-爱易网页

高手！去页面所有标签！然后去掉只留内容

日期：2014-05-18　浏览次数：20669 次

请教各位高手！去页面所有标签！然后去掉只留内容！
我现在面临的困难是：现在别人给我一段代码（以html代码为例）,此段代码含有比较多的标签属性：例如有如下代码片段：
<body>
<h1>hello</h1>
<table name="tbName" border="1">
<tr id="trId">
<td>Cotent</td>
</tr>
</table>
</body>
我这是要获取其中的
<body>
<h1>
</h1>
<table name="tbName" border="1">
<tr id="trId">
<td>
</td>
</tr>
</table>
</body>
取出来这些标签之后再把这些标签去掉！也就是使之为空，只留其中的内容部分！有哪位高手有好的方法给与指教！小弟非常感激！

------解决方案--------------------
str.replaceAll("<.?*>","");
------解决方案--------------------
用正则应该可以,html,wml形式都差不多

Java code


 Pattern p = Pattern.compile("<[^>]+>|</[^>]+>",Pattern.CASE_INSENSITIVE );
 String htmlContent = "...<body>.....</body>..." 
 Matcher m = p.matcher(htmlContent);
 String content = m.replaceAll("");

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

jsp发布后的有关问题，帮帮忙看一下

怎么判断img的src是否是一个存在的文件

JAVA poi导出excel 换了服务器如何不好用了

关于session的保持有关问题~

关于cxf方式访问电视台webservice的有关问题

==========getRuntime().exec的有关问题==========

javaEE开发，javaBean代码模拟登录各种站点解决方法

jquery文字向上滚动有关问题

JSP 游标异常

高手！去页面所有标签！然后去掉只留内容

相关资料更多>

推荐阅读更多>