日期:2014-05-20  浏览次数:20801 次

汉字转拼音码如何去除英文字母和数字?
我现在可以将汉字转为拼音码,但是遇到汉字+英文字母+数字等混杂情况,如“你好csdn123”,程序会将英文字母和数字原封不动的也带过来,即“nhcsdn123”。我想去掉这些英文字母和数字,只保留汉字拼音码,我只想要得到"nh",该怎么办?

------解决方案--------------------
先把非法字符(字母数字)过滤掉,然后再转
------解决方案--------------------
嗯。。先把汉字和非汉字的东西分开,转后再合起来
------解决方案--------------------
汉字编码范围是\u4E00-\u9FA5
在这个范围内的是汉字,其他的就不是
可以用正则表达式提取全部汉字
再转的话就没问题啦