日期:2014-05-17  浏览次数:20618 次

求助:如何利用C++(不包括VC)提取HTML中的链接??
如果有了一个网页的HTML源
想把里面有关链接的信息提取出来怎么做?
有高人指点下。

<a   href= 'http://tech.sina.com.cn/ '   target=_blank> 新浪科技 </a> </td>
<td> <a   href= 'http://it.sohu.com/ '   target=_blank> 搜狐IT </a> </td>
<td> <a   href= 'http://tech.163.com/ '   target=_blank> 网易科技 </a> </td>
<td> <a   href= 'http://www.it168.com/ '   target=_blank> IT168 </a> </td>
<td> <a   href= 'http://www.thethirdmedia.com/ '   target=_blank> 第三媒体 </a> </td>
<td> <a   href= 'http://digi.163.com/ '   target=_blank> 网易数码 </a> </td>
像上面这段就是   提取出只包含网页链接

------解决方案--------------------
http://forums.microsoft.com/MSDN/ShowPost.aspx?PostID=1105716&SiteID=1
------解决方案--------------------
不管什么语言都用正则表达式提取就行了。