日期:2014-05-18  浏览次数:20526 次

希望正则高手们赐教 如何写正则 源码<**>**</**>都是有规律的 正则也应该是有规律的,能否共享下 如何应用正则吗? ---------- 过客
<p>11-13 <a href=/bj/11/109/4969873.html target=_blank>中介 - 3400元/3居 - 紫竹桥兵器大厦附近大三居 (紫竹院) </a>
<p>11-13 <a href=/bj/11/104/4969872.html target=_blank>1200元/3居 - 出租上地三居室合住(免中介费) (上地) </a>
<p>11-13 <a href=/bj/11/114/4969866.html target=_blank>中介 - 2600元/2居 - 北太平庄43号院二居出租 (北太平庄) </a>
<p>11-13 <a href=/bj/11/914/4969865.html target=_blank>400元/1居 - 单间独立卫浴免供暖费 (北七家) </a>
<p>11-13 <a href=/bj/11/301/4969864.html target=_blank>中介 - 2400元/2居 - 东直门春秀路太平庄南里二居室出租 (东直门外三里屯工人体育馆) </a>
<p>11-13 <a href=/bj/11/208/4969863.html target=_blank>中介 - 2400元/4居 - 出租定福家园新房四居室 (团结湖) </a>
<p>11-13 <a href=/bj/11/214/4969862.html target=_blank>中介 - 2600元/3居 - 花家地北里三室一厅出租 (酒仙桥 将台路) </a>
<p>11-13 <a href=/bj/11/209/4969859.html target=_blank>1300元/1居 - 十里堡华堂附近新公寓合租 (京广桥 红庙 八里庄) </a>
<p>11-13 <a href=/bj/11/70/4969846.html target=_blank>中介 - 600元/3居 - 出租丰益桥西盛鑫家园4室2厅2卫精装修的房子(免收中介费 (丰益桥西盛鑫家园) </a>
<p>11-13 <a href=/bj/11/901/4969844.html target=_blank>750元/3居 - 田园风光雅园3居中的一居室出租 (回龙观) </a>
<p>11-13 <a href=/bj/11/1101/4969840.html target=_blank>350元/1居 - 找一女孩跟我合租 (亦庄) </a>
<p>11-13 <a href=/bj/11/102/4969839.html target=_blank>中介 - 3400元/3居 - 出租知春里小区三居室 (北京大学) </a>
<p>11-13 <a href=/bj/11/217/4969838.html target=_blank>1100元/3居 - 双井桥 三居 出租 (新装修的)合租 (双井) </a>
<p>11-13 <a href=/bj/11/70/4969837.html target=_blank>中介 - 3500元/3居 - 丰台区兆丰园精装修房子一套低价出租 (玉泉路 吴家村) </a>
<p>11-13 <a href=/bj/11/70/4969835.html target=_blank>中介 - 2900元/3居 - 我有一套长安新城精装修的三居室要出租 (青塔 大成路 长安新城) </a>
<p>11-13 <a href=/bj/11/201/4969834.html target=_blank>中介 - 2200元/1居 - 房屋出租,北辰附近 (亚运村) </a>


<p align=center><a href=index1.html>下一页(50条信息)</a>
我想要 以上代码的汉子 正则怎么写呢

还有
-------------
<table><tr><td>dhfiuas<a href="123.aspx">lkajsdf</></td></tr>
.
.
.
</table>
取出table中的 汉子和连接地址

向学习 写正则的方法
谢谢

------解决方案--------------------
想学?看看这篇文章吧
http://www.regexlab.com/zh/regref.htm
------解决方案--------------------
C# code

//试试,自己修改下

Regex.Replace("你的那些字符串",@"(<[a-z]+[^>]*>)|(</[a-z\d]+>)"," ",RegexOptions.IgnoreCase| RegexOptions.Multiline);

//把HTML标签去掉...

//如果要一个一个捕捉文字正则得重写

------解决方案--------------------
试试:
汉字 = Regex.Replace(str,"(\u4e00-\u9fa5)", "$1", RegexOptions.IgnoreCase|RegexOptions.Multiline);
链接=Regex.Replace(str,"href=(\S*)\s","$1", RegexOptions.IgnoreCase|RegexOptions.Multiline);