日期:2014-05-18  浏览次数:20826 次

如何根据有规律的网页url地址获得其页面.htm内容?
网址如http://XXXXXXXXXXXX.php?id=0&p=1,变动的只有id和p 一个id下对应有10个页面,如何获得每个网址下对应的html文件并保存到文件中,然后如何解析内容获得所需要的数据?

给予一些提示,或者代码,或者一些链接网页,谢谢

------解决方案--------------------

HTML code

#region##获取HTML源码信息    
    ///<summary>    
    /// 获取HTML源码信息(Porschev)    
    ///</summary>    
    ///<param name="url">获取地址</param>    
    ///<returns>HTML源码</returns>
    public string GetHtml(string url)    
    {        
        Uri uri = new Uri(url);        
        WebRequest wr = WebRequest.Create(uri);        
        Stream s = wr.GetResponse().GetResponseStream();        
        StreamReader sr = new StreamReader(s, Encoding.Default);                
        return sr.ReadToEnd();    
    }    
    #endregion