日期:2014-05-16  浏览次数:20424 次

如何在HTML代码中提取部分内容
例如:现在有一编文章,内容包含HTML标签.
<center> <p> abc </p> </center>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
<p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p>
.......

现在要提取部分内容作为文章的摘要.包含HTML的,应该要怎样做呢?
谢谢!


------解决方案--------------------
<script type= "text/javascript ">
var txt = ' <center> <p> abc </p> </center> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> <p> &nbsp;&nbsp;afsfsdfasfdsfsafsdfsfsaf </p> '

//txt.replace(/( <center> (.*?) <\/center> )/, "$1 ")
//alert(RegExp.$1)
alert(/( <center> (.*?) <\/center> )/.test(txt))
alert(RegExp.$1)
</script>
------解决方案--------------------
电脑现在还没这么智能啊,要有个规范才可以做的
------解决方案--------------------
你要获取的内容要有一定的规律性啊。比如是第一段啊。。前多少个字啊。什么的。。。
------解决方案--------------------
这个好像不能做吧,最简单的就是你放进文档的html标签会缺少,使你的页面错乱的;
当然你可以自己写一段程序去掉页面中的html,截取内容以后再加上标签
------解决方案--------------------
我2004年的文档,可以看看。。

超长文章(HTML格式)自动分页,用ASP和JS实现
http://www.jaron.cn/chs_Products/60/2004-07/101709.shtml
------解决方案--------------------
最好使用XML
------解决方案--------------------
就把所有 <和/> 之间的全过滤掉吧
如果,文章里有小于符号,那就要出问题了
所以很多人直接过滤整个标签,穷举所有标签,很牛的,哈....
------解决方案--------------------
可以先过滤HTML标签。再加上标签。