日期:2014-05-20  浏览次数:20583 次

关于删除文件内容的实现方法
有一个文件a.html,里面内容如下:
<html>
<head> <title> aaa <title> </head>
<body>
<table> <tr>
<td> abcde
</td> </tr> </table>
</body> </html>

目标:把 <td> 之前的(注:含 <td> 本身)内容以及 </td> (注:含 </td> 本身)之后的
内容删除,即只保留abcde这些内容。

如何实现呢?



------解决方案--------------------
正则表达式匹配HTML标签,然后所有标签替换为 " "
------解决方案--------------------
恩正则做简单点 不过要注意title里的内容~