日期:2014-05-18  浏览次数:20468 次

为什么.net的split函数无法正确分割html代码啊?是不是有特殊的字符啊?
为什么我用split函数分割html代码就出错,分割string文本就没有问题啊。

我取回了“http://www.sohu.com "   的html代码(strHtmlBody)然后想将其新闻列出,
我发现了   用 <table> 作为标志就可以分割。
然后用   strHTMLBody.split( " <table> ")(1)来获得后半段   却总是出错。
获得的   是   很短的一段字,就是strhtmlbody开头的几个字,而且并不是按照 <table> 来断的。

似乎是如果string里有换行等特殊文本,就无法用split函数,会出现不可预期的后果,是不是这样啊?
而且我发现,似乎replace函数也无法用。。。
怎么办啊~~~   请大家指点一下吧~~


------解决方案--------------------
你 查一下split 就知道了
------解决方案--------------------
用regex.split,例子:

Regex r = new Regex( "(-) "); // Split on hyphens.
string[] s = r.Split( "one-two-banana ");