日期:2014-05-20  浏览次数:20697 次

求正则
										<body xmlns="http://www.w3.org/1999/xhtml">
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">新华社专电 利比亚前领导人穆阿迈尔·卡扎菲长女艾莎的律师14日说,他已经致信国际刑事法院,询问后者是否会调查卡扎菲及其第五子穆塔西姆遭杀害一事。</p>
<center>
<img style="BORDER-BOTTOM: #000000 0px solid; BORDER-LEFT: #000000 0px solid; BORDER-TOP: #000000 0px solid; BORDER-RIGHT: #000000 0px solid" id="NEM1_20111215_C02229796_A16692.jpg" title="" border="1" hspace="3" vspace="3" align="center" src="NEM1_20111215_C02229796_A16692.jpg" width="436" height="327" type="image" sourcedescription="编辑提供的本地文件" sourcename="本地文件"/>
</center>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">律师尼克·考夫曼说,他致信国际刑事法院检察官路易斯·莫雷诺-奥坎波,“艾莎想知道他(莫雷诺-奥坎波)是否正在调查这些谋杀。如果没有,不调查的原因是什么”。</p>
<p align="center">
<img style="BORDER-BOTTOM: #000000 0px solid; BORDER-LEFT: #000000 0px solid; BORDER-TOP: #000000 0px solid; BORDER-RIGHT: #000000 0px solid" id="NEM1_20111215_C02229796_A16693.jpg" src="NEM1_20111215_C02229796_A16693.jpg" width="392" height="294"/>
</p>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">
<br/>
</p>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">卡扎菲和穆塔西姆10月20日在利比亚城市苏尔特附近遭执政当局俘获,随后死亡。执政当局武装将两人遗体在一座冷藏库展示数日后秘密下葬。</p>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">考夫曼在信中说,卡扎菲和穆塔西姆遭活捉时不对任何人构成威胁,“对利比亚局势的分析要求你调查利比亚冲突各方可能犯下的罪行。”</p>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">国际刑事法院发言人弗洛伦斯·奥拉拉没有证实莫雷诺-奥坎波是否收到这封信函。</p>
<p style="TEXT-INDENT: 30px; MARGIN: 0px 3px 15px">位于荷兰海牙的国际刑事法院今年6月以涉嫌反人类罪通缉卡扎菲、他的次子赛义夫·伊斯兰·卡扎菲和前情报部门主管阿卜杜拉·塞努西。卡扎菲妻子萨菲亚·卡扎菲、女儿艾莎、长子穆罕默德·卡扎菲、四子汉尼拔·穆阿迈尔·卡扎菲进入阿尔及利亚避难。(完)</p>
<p/>
</body>

xml里面有这样一段字符串,现在想要一个正则,能找出某个标签的某个属性,譬如img的type属性,删掉该属性。谢谢
------解决方案--------------------
这种xml或html的用htmlParser和xml解析来做要比正则好的多,而且,也匹配的精确。
------解决方案--------------------
不一定很准确,试试看吧:
html = html.replace(
    "(<img\\s+.*)type=[^\\s>]+([^>]*>)",
    "$1$2"
);