日期:2014-05-20  浏览次数:20802 次

谁能帮我解释一下这个正则表达式吗?有点看不懂!
"href=\"?(.*?)(\"|>|\\s+)"
是提取html里的网页的,但是分组有点奇怪啊!

------解决方案--------------------
1.href=
2."?指"可有可无
3.(.*?)指随便一组字符
4.(\" ¦> ¦\\s+)指3上面那组字符跟着"|>|;\\s+表示一个或多个分隔符