求一正则表达示
我想在页面中寻找如
HTML code
<a href="xyz.html">XYZ</a>..(这里有无数的html各种代码)....<a href="AAA.html">进入</a>.后面也有无数的html各种代码..
第一步,我想判断网页中存没存在“进入”这样的一个链接词
第二步 我要取出 "进入" 这个链接词的 href地址
我使用的正则是<a[\s\S]*?进入</a> 进行判断,需然有用,但取出的是 试例代码的全部!
求高手指点!!
------解决方案--------------------Regex reg=new Regex(@"(?i)<a\b[^>]*?href=(['""]?)(?<href>[^'""]+)\1[^>]*?>进入</a>");
if(reg.IsMatch(yourhtml)
{
string str=reg.Match(yourhtml).Groups["href"].Value;
}
------解决方案--------------------C# code
Regex reg = new Regex(@"(?is)(?<=<a[^>]*?>)进入(?=</a>)");