在写网络爬虫，没法完成递归抓取，求大神解救-C#教程-爱易网页

在写网络爬虫，没法完成递归抓取，求大神解救

日期：2014-05-17　浏览次数：21430 次

在写网络爬虫，无法完成递归抓取，求大神解救！

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Text.RegularExpressions;

using System.IO;

using System.IO.Compression;

using System.Net;

using System.Windows.Forms;

using System.Web;

namespace SearchEngine

{

    class Crawl

    {

        string patternCode = @"<meta[\s\S]+?charset=[\s]*[""]?(.*?)""[\s]*[\S]?>";//用于分析网站编码

        string patternUrl = "<a\\s+href\\s*=\\s*\"?(.*?)[\"|>]";

        //content="text/html; charset=gb2312"

        string filePath = @"E:\学习\各种项目\智能搜索\htmldownload\";//文件保存路径

        string dlErrorName = @"E:\学习\各种项目\智能搜索\htmldownload\downloadErrorLog.txt";

        string getCodeErrorName = @"E:\学习\各种项目\智能搜索\htmldownload\getCodeErrorLog.txt";

        /// <summary>

        /// 下载指定url的html文档，并保存在本地

        /// </summary>

        /// <param name="url"></param>

        /// <returns>返回html文本</returns>

        public string download(string url)

        {

            string encoding="ASSIC";

            string html=string.Empty;

            try

            {

                

                HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);

                request.Timeout = 5000;

                request.Method = "get";

                request.ContentType = "text/html";

                HttpWebResponse response = (HttpWebResponse)request.GetResponse();

                Stream resStream = response.GetResponseStream();

                StreamReader strRead;

                encoding = getEncoding(url);

                //判断网页是否经过gzip压缩，如果是则解压缩

                if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringCompari

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

在写网络爬虫，没法完成递归抓取，求大神解救

相关资料更多>

推荐阅读更多>