日期:2014-05-18  浏览次数:20457 次

webclient抓取数据乱码的问题
WebClient web = new WebClient();
Stream stream = web.OpenRead(url);
StreamReader sr = new StreamReader(stream, Encoding.Default);
string webData = sr.ReadToEnd();


这里抓取的大多数网站都不会乱码

但抓取一些的时候就会出现乱码,如何通过简洁的手段,能达到抓取的数据都不会乱码?

请教大虾~~

------解决方案--------------------
有的网站使用 GB2312 有的使用UTF8 

StreamReader sr = new StreamReader(stream, Encoding.UTF8);
------解决方案--------------------
StreamReader(stream, Encoding.Default); //和网站的编码方式有关系吧

------解决方案--------------------
英文会有乱码?你就先把头部的信息抓回来 就是<head></head>之间的,或者更简单的用个证则去匹配 charset=
------解决方案--------------------
没有头信息???什么情况没有头信息??
------解决方案--------------------
对阿,网页都应该有这个头部信息的