正则表达式(C#)
我要获取到这个http://ent.qq.com/star/shouye2012/gangtai.htm网站上面
的里面的内容正则表达式该怎么写呀???求高手帮忙呀...
------解决方案--------------------<div class="nrP">蒋雯丽最近桃色绯闻频被爆出!继与同公司新人黄轩传出“美丽的误会”后,近日网上爆出其与一名黑衣眼镜神秘男的亲密拥抱照片。记者致电蒋雯丽经纪人,她回应称:“只能说两个字就是‘无聊’!...<a class="detail" target="_blank" href="/a/20130709/008695.htm">全文</a>
</div>
你要的全文,是这个url还是全文里的内容,如果是内容,那需要打开这个链接才能得到
------解决方案--------------------document.GetHtml,是webbrowser的方法
------解决方案--------------------
(?<=<a\s*class="detail"\s*target="[^"]*"\s*href=")[^"]*(?+")
------解决方案--------------------new Regex(@"(?<=<a\s*class=""detail""\s*target=""[^""]*""\s*href="")[^""]*(?+"")", RegexOptions.ExplicitCapture)
------解决方案--------------------href="[^"]+"\>全文\</a\>
------解决方案--------------------(?<=<a\s*class=\"detail\"\s*target=\"[^\"]*\"\s*href=\")[^\"]*(?+\")
------解决方案--------------------string pattern = @"(?<=href="").+?(?="">全文</a>)";
匹配出来的是网址的后缀,前面加上:http://ent.qq.com ,这个是前缀
最后得到的url就是跳转到全文的地址