抓取网页信息网页保存为文本,该怎么处理-C#教程-爱易网页

抓取网页信息网页保存为文本,该怎么处理

日期：2014-05-18　浏览次数：21567 次

抓取网页信息网页保存为文本
读取网页特定位置的信息，比如数值和图片，如何实现？给出相应的类，提示一下吧

如果不能容易的读取信息，那么如何将网页保存为文本格式？

两个问题解决任何一个都行，谢啦！

------解决方案--------------------
抓取博客园首页推荐文章：

C# code

        HttpWebRequest httpWebRequest = WebRequest.Create(@"http://www.cnblogs.com") as HttpWebRequest;
        HttpWebResponse httpWebResponse = httpWebRequest.GetResponse() as HttpWebResponse;
        Stream stream = httpWebResponse.GetResponseStream();
        StreamReader reader = new StreamReader(stream, Encoding.UTF8);
        string s = reader.ReadToEnd();
        reader.Close();
        stream.Close();
        httpWebResponse.Close();
        HtmlDocument htmlDoc = new HtmlDocument();
        htmlDoc.LoadHtml(s);
        HtmlNodeCollection anchors = htmlDoc.DocumentNode.SelectNodes(@"//a[@class='titlelnk']");
        foreach (HtmlNode anchor in anchors)
            Console.WritleLine(anchor.InnerHtml);

------解决方案--------------------

a.下载网页数据;
b.处理网页得到想要的数据;
c.保存数据

对于a有三种方式
1.使用WebClient下载  2.使用HttpWebRequest和HttpWebResponse 3.使用WebBrowser

对于b
1.正则表达式匹配; 2.使用HtmlAgilityPack

对于c  按个人需求而定

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

抓取网页信息网页保存为文本,该怎么处理

相关资料更多>

推荐阅读更多>

抓取网页信息 网页保存为文本,该怎么处理

相关资料更多>

推荐阅读更多>

抓取网页信息网页保存为文本,该怎么处理