去除乱码的问题
我需要将一段utf-8编码格式的字符串转换成gbk格式,但是由于utf-8编码中有的字符转换成gbk之后不能正常显示,我需要在转换过程中对不能正确显示的字符去掉,只保留能够正确转换的部分,应该怎么做呢?请求各位的帮忙。
------解决方案--------------------用正则式,unicode,过滤掉gbk以外的字符
------解决方案-------------------- String str = "我クスクスと笑われちゃった们abd发 ";
str = str.replaceAll( "[^\u4e00-\u9fa5]+ ", " ");//过滤非中文字符,换成gbk的编码范围
System.out.println(str);