日期:2014-05-20  浏览次数:20648 次

正则表达式和字符集问题 谢谢
\u4e00-\u9fa5   可以匹配中文字符,但有帖子说其中包含非中文字符,
想知道各种字符集的范围,如中文   韩文等。

另外了解Java   字符编码的知识,有哪些资料可参考?

以上两问题
谢谢     !  


------解决方案--------------------
匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]

另外:中文字符的匹配是否有其他的不知道,没有测试过。

------解决方案--------------------
另外了解Java 字符编码的知识,有哪些资料可参考?

java中用的是U编编码,可以和大部分国家言语编码进行转换。具体转换命令你搜一下。
------解决方案--------------------
UP!