日期:2014-05-18  浏览次数:20953 次

在。net下提取网页的文本
我想用C# 提取网页中的文本文字,请问要用什么方法啊?找了很多好像有关于IHTMLDocument2 和 Htmldocument 希望有好心人能提供完整点的代码。

------解决方案--------------------
using System.IO;
using System.Net;

Stream instream = null;
StreamReader sr = null;
HttpWebResponse response = null;
HttpWebRequest request = null;
request = WebRequest.Create("http://www.sina.com.cn") as HttpWebRequest;
response = request.GetResponse() as HttpWebResponse;
instream = response.GetResponseStream();
sr = new StreamReader(instream, Encoding.UTF8);
//返回结果网页(html)代码 
return sr.ReadToEnd();