日期:2014-05-17  浏览次数:20676 次

简简单单提取小正则
从一堆html里要提取出:
http://www.abc.com/link.php?ref=V5pNDAPBuT
http://www.abc.com/link.php?ref=ueyVeOp9

符合这样条件的字符串地址,怎么写正则呢?ref=后面的字符是变的

因为html的垃圾数据很多,我想提取出来的字符串,必须包含www.abc.com字样的,要不然符合这样正则的肯定不止一个,应该怎么写呢?
求代码指点。。。



foreach (Match m in Regex.Matches(strHtmlBody, 正则))
            {}

------解决方案--------------------
(?=(http://www.abc.com)).*ref=\w+

------解决方案--------------------
(?i)(https?://)?www\.abc\.com/link.php\?ref=\S+