日期:2014-05-17  浏览次数:20936 次

百度快照网址提取,正则表达式
大家好,请高手帮忙!我现在获取到了“百度搜索结果页面”的源代码,现在我想从源代码中提取出百度快照的网址,需要用正则表达式,请高手帮忙写一个,小弟感激不尽!
百度搜索结果页面源代码中,百度快照用点规律,如:
1.http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece7631057953b5912c1743ca0d3117ec3933fc239045c5323befb712d1300d2&p=8c66c64ad79611a05ee6d5605252&user=baidu&fm=sc&query=163&qid=bcd60db60cf35ede&p1=5"
2.http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece76310418835420a97634bd4d41468d4e419ce3b4655023ba3ed28211405&p=882a944e8f9608fe0fbe9b7f4951&user=baidu&fm=sc&query=163&qid=9cb654170cfa6535&p1=4
3.http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece7631057953b5912c1743ca0d3117ec3933fc239045c5323befb712d1300d2&p=90769a44919b50e90cbd9b780659&user=baidu&fm=sc&query=163&qid=9cb654170cfa6535&p1=5

只要源代码中出现http://cache.baidu.com/c?m= 就可以判断为百度快照网址 那正则表达式怎么写呢?谢谢高手解答!

------解决方案--------------------
哦,那你可一试试这个
C# code
MatchCollection mcUrls = Regex.matches("输入文本","(?is)http://cache\.baidu\.com/c\?m=[^\s]*");