去除网页注释的正则式,该怎么处理-C#教程-爱易网页

去除网页注释的正则式,该怎么处理

日期：2014-05-19　浏览次数：21039 次

去除网页注释的正则式
string mm1 = @ "稿源：

北方网—天津日报

编辑：

朱豪然


[发表评论]
 ";

string ss = Regex.Replace(mm1, "(  )+ ", " ");

我本想去除  里面的字符，可以这样写把所有都去除了，该怎么改，请教！

------解决方案--------------------
可以不用正则表达式..

string ChangeWithDoubleFlag(string MainText, string FlagStart, string FlagEnd)
{
string str = MainText;
string chgValue;
string returnValue;
int Fi1 = -1;//First Flag Index;
int Fi2 = -1;//Second Flag Index;
Fi1 = str.IndexOf(FlagStart);
if (Fi1 != -1)
Fi2 = str.IndexOf(FlagEnd, Fi1);
if (Fi1 != -1 && Fi2 != -1)
{
chgValue = str.Remove(Fi1, Fi2 - Fi1 + FlagEnd.Length);
returnValue = ChangeWithDoubleFlag(chgValue, FlagStart, FlagEnd);
}
else
{
returnValue = MainText;
}
return returnValue;
}

string ChangeWithSingleFlag(string MainText, string Flag)
{
string str = MainText;
string chgValue;
int Fi1 = -1;//First Flag Index;
int Fi2 = -1;//Second Flag Index;
string returnValue = " ";
Fi1 = str.IndexOf(Flag);

if (Fi1 != -1)
Fi2 = str.IndexOf( "\r\n ", Fi1);
if (Fi1 != -1 && Fi2 != -1)
{
chgValue = str.Remove(Fi1, Fi2 - Fi1 + 2);
returnValue = ChangeWithSingleFlag(chgValue, Flag);
}
else
returnValue = MainText;

return returnValue;
}

//使用
string sxml = mm1 ;
string strRemark = "  ";
string[] RemarkFlag = Regex.Split(strRemark, ", ");
for (int i = 0; i <= RemarkFlag.GetUpperBound(0); i++)
{
string Rf = RemarkFlag[i];
if (Rf.IndexOf( ".. ") != -1)
{
string Flag1 = Rf.Substring(0, Rf.IndexOf( ".. "));
string Flag2 = Rf.Substring(Rf.IndexOf( ".. ") + 2, Rf.Length - Rf.IndexOf( ".. ") - 2);
sxml = ChangeWithDoubleFlag(sxml, Flag1, Flag2);
}
else
{
sxml = ChangeWithSingleFlag(sxml, Rf);
}

}
------解决方案--------------------
try

string ss = Regex.Replace(mm1, "(  )+ ", " ");

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

去除网页注释的正则式,该怎么处理

相关资料更多>

推荐阅读更多>