日期:2014-05-17  浏览次数:21033 次

C#做一个winform应用,获取天猫单品页的商品描述内容。因商品描述部分是动态加载的,所以无法获取加载后的内容。
目标:根据输入的URL自动获取天猫单品页的商品描述内容。

例如,我要获取下边这个商品的商品描述。
http://detail.tmall.com/item.htm?spm=a1z10.1.w18174882537.3.clJiTE&id=16053953606&
分析页面内容后可以得知,商品描述是放在id="J_ItemDesc"的div中。
获取到页面的HtmlDocument后,取到id="J_ItemDesc"的节点,然后取这个节点中的内容。
这个节点中的内容一直都是“描述加载中”。

firebug跟踪后发现:
打开页面时


向下拉滚动条,到达商品描述部分后:


请教如何获取动态加载后的<div id="J_ItemDesc" class="content ke-post">节点中的内容。
C# 天猫 WinForm

------解决方案--------------------
首先要看懂javascript程序。
------解决方案--------------------
天猫本来就有api滴,所以你要是合法使用自己问你的客户要api提供就可以
天猫api说明:http://open.taobao.com/doc/api_cat_detail.htm?scope_id=378&category_id=102

不过从你的描述看,估计你是非法采集,那么自己想办法把,俺们不鼓励非法采集


------解决方案--------------------
不用官方的api
就直接调用 javascript 看看能不能取出来
------解决方案--------------------
C#获得的HTML源码

是没有Ajax动态添加的。

所以,必须理解JS里面Ajax请求方式来获取源码