为什么.net的split函数无法正确分割html代码啊?是不是有特殊的字符啊?
为什么我用split函数分割html代码就出错,分割string文本就没有问题啊。
我取回了“http://www.sohu.com " 的html代码(strHtmlBody)然后想将其新闻列出,
我发现了 用 <table> 作为标志就可以分割。
然后用 strHTMLBody.split( " <table> ")(1)来获得后半段 却总是出错。
获得的 是 很短的一段字,就是strhtmlbody开头的几个字,而且并不是按照 <table> 来断的。
似乎是如果string里有换行等特殊文本,就无法用split函数,会出现不可预期的后果,是不是这样啊?
而且我发现,似乎replace函数也无法用。。。
怎么办啊~~~ 请大家指点一下吧~~
------解决方案--------------------你 查一下split 就知道了
------解决方案--------------------用regex.split,例子:
Regex r = new Regex( "(-) "); // Split on hyphens.
string[] s = r.Split( "one-two-banana ");