HTTP POST数据包中MIME数据时怎么确定中文的编码?
大家好,我现在在解析post的数据包,在测试新浪网的blog发帖数据包时,POST数据包数据是multipart/form-data类型,中文显示的是乱码,部分内容如下:
Content-Type: multipart/form-data; boundary=---------------------------17282192212998613471126573507
Content-Length: 5096
-----------------------------17282192212998613471126573507
Content-Disposition: form-data; name= "album "
-----------------------------17282192212998613471126573507
Content-Disposition: form-data; name= "blog_id "
一开始在网上搜索时,有帖子提到post用的是UTF-8编码,结果我解析出来不对,后来对照汉字和十六进制数据搜索,发现用的是gb2312编码,可是在post的数据包中并没有提供charset字段或者其他类似的说明编码的字段,该如何解析呢?
关键不同的网站用的编码还不一样,163的社区发帖子用的是urlencoded,这种编码还没有看怎么解,请大虾帮忙解决一下。
谢谢先
------解决方案--------------------帮顶
------解决方案--------------------直接去看HTTP协议对应的RFC吧,看其他人的帖子不一定有帮助,因为其他人做得不一定就符合标准。
------解决方案--------------------dddddddddddddddddddddd
------解决方案--------------------Content-Language呢?
------解决方案--------------------在HTTP Request Header Fields里有Accept-Charset,看看能否取到!