日期:2014-05-16  浏览次数:20559 次

有一个问题,我得到一个网页的返回流,,我要得到 某个 div 下面的 ul 里面的 li 里的超链接,求解
有一个问题,我得到一个网页的返回流,,我要得到 某个 div  下面的  ul  里面的  li  里的超链接,求解
           HtmlDocument doc = new HtmlDocument();//节点  细节
                doc.LoadHtml(content);

                HtmlNode hnDetail = doc.GetElementbyId("searchResults");//找到包含列表的框架

                if (hnDetail != null)
                {
                    content = hnDetail.InnerHtml;
                }
这是我的代码。这个里面  hnDetail 得到的只有div 标签, hnDetail.InnerHtml 是空的,怎么解,求大神啊
------解决方案--------------------
content 的内容
  
*****************************************************************************
签名档: http://feiyun0112.cnblogs.com/
------解决方案--------------------
可以用正则,或者使用一些第三方的库例如HtmlAgilityPack,会比正则方便很多的
------解决方案--------------------
解析别人网站上的页面内容,扒取别人网站上的所有链接?
foreach (
            Match m in
                Regex.Matches(content,
                    @"(?is)<li[^>]*?class=(['""]?)hot_list_item\1[^>]*?>\s*?<a[^>]*?href=(['""]?)(?<href>[^'""]*?)\2[^>]*?>(?<text>[^<>]*?)</a>[\s\S]*?</li>")
            )
        {
            sHot += "{\"text\":\"" + m.Groups["text"].Value + "\",\"url\":\"" + m.Groups["href"].Value + "\"},";
        }

这个写法的意思是取所有 class="hot_list_item" 的li 里面 所有a标签的href链接和 a标签包含的值。

<li class="hot_list_item" ><a href="a.html">测试</a></li>
这一段解析完,
sHot={“text”:"测试","url":"a.html"}