如果获取html经过转码后的中文
如html文件中的中文都是这样的:
特别说明:本次群发对象中,没有剔除已办理过账单É。。。。。。
在Java里怎么获取到这些中文啊。
请高手赐教。
------解决方案--------------------
这些是Unicode 的10进制编码
下一个 common-lang-2.x.jar 包
import org.apache.commons.lang.StringEscapeUtils;
public class Test {
public static void main(String[] args) {
String str = "无论何时你声明一" +
"个变量,它都被赋" +
"予一个缺省值 NULL。初" +
"始化所有的变量是 PL/SQL " +
"的特点;这样,PL/SQL 不" +
"同于其它语言,比如 " +
"C 和 Ada。如果你想初始" +
"化变量为非 NULL 值,你" +
"可以在声明中用赋值" +
"操作符(:=)或DEFAULT 关键" +
"字做到这一点:";
System.out.println(StringEscapeUtils.unescapeHtml(str));
}
}