webclient抓取数据乱码的问题
WebClient web = new WebClient();
Stream stream = web.OpenRead(url);
StreamReader sr = new StreamReader(stream, Encoding.Default);
string webData = sr.ReadToEnd();
这里抓取的大多数网站都不会乱码
但抓取一些的时候就会出现乱码,如何通过简洁的手段,能达到抓取的数据都不会乱码?
请教大虾~~
------解决方案--------------------有的网站使用 GB2312 有的使用UTF8
StreamReader sr = new StreamReader(stream, Encoding.UTF8);
------解决方案--------------------StreamReader(stream, Encoding.Default); //和网站的编码方式有关系吧
------解决方案--------------------英文会有乱码?你就先把头部的信息抓回来 就是<head></head>之间的,或者更简单的用个证则去匹配 charset=
------解决方案--------------------没有头信息???什么情况没有头信息??
------解决方案--------------------对阿,网页都应该有这个头部信息的