日期:2014-05-17  浏览次数:20714 次

利用正则表达式实现去除所有HTML标签代码

"<[^>]*>"; //去除所有的标签

"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除

"<img[^>]*>"; //去除图片的正则

@"<(?!br).*?>"; //去除所有标签,只剩br

"<table[^>]*?>.*?</table>"; //去除table里面的所有内容

"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p