日期:2014-05-16  浏览次数:21105 次

求提取超链接地址的正则表达式算法?
如何提取以下代码中所有的超级链接地址
“<a href="1.asp" target="_blank">aaaaaa</a><a href=2.asp>bbbbb</a><a href=3.asp>ccc</a> <li><span class="middate">2009-09-01</span><a target="_blank" href=" http://www.baidu.com">haha</a></li>”

不论链接中是否target="_blank"要将所有的链接地址提取出来?

请各位大虾不吝赐教。

------解决方案--------------------
引用:
Quote: 引用:


'返回匹配正则表达式的Matches集合
Public Function RegMatch(ByVal strToBeSearched, ByVal rule)
    Set o_regex = New Regexp
    o_regex.Global = True
    o_regex.IgnoreCase = True
    o_regex.Pattern = rule
    Set RegMatch = o_regex.Execute(strToBeSearched)
    o_regex.Pattern = ""
    Set o_regex = Nothing
End Function

'将匹配正则表达式的Matches集合转换为数组
Public Function Search(ByVal s, ByVal rule)
    Dim matches, match, arr(), i : i = 0
    Set matches = RegMatch(s, rule)
    ReDim arr(matches.Count - 1)
    For Each match In matches
        arr(i) = match.SubMatches(1)
        i = i + 1
    Next
    Set matches = Nothing
    Search = arr
End Function

Dim ListContentStr, arrHref, arrImg
ListContentStr = "<li><a href=""yewu.asp?id=399""><img src=""UploadFile/menu/2012061817570777.jpg"" border=""0"" /></a><span><a href=""yewu.asp?id=399"">代办营业执照</a></span></li><li><a href=""yewu.asp?id=400""><img src=""UploadFile/menu/2012061818023087.jpg"" border=""0"" /></a><span><a href=""yewu.asp?id=400"">代办注册公司</a></span></li><li><a href=""yewu.asp?id=401""><img src=""UploadFile/menu/2012061817573898.jpg"" border=""0"" /></a><span><a href=""yewu.asp?id=401"">代理记帐报税</a></span></li><li><a href=""yewu.asp?id=402""><img src=""UploadFile/menu/2012061817575454.jpg"" border=""0"" /></a><span><a href=""yewu.asp?id=402"">代办建筑资质</a></span></li><li><a href=""yewu.asp?id=403""><img src=""UploadFile/menu/2012061817590166.jpg"" border=""0"" /></a><span><a href=""yewu.asp?id=403"">企业增资验资</a></span></li><li><a href=""yewu.asp?id=410""><img src=""UploadFile/menu/2012061817580709.jpg"" border=""0"" /></a><span><a