日期:2014-05-17  浏览次数:20466 次

请教一个UNICODE的问题,高手请进!
从API得到一个XML,里面有汉字什么的,还有“\uE40A”和“\uE40B”这样的标识符,请问用PHP如何在文本中找到这些标识符?

下面是一个例子:关键字“掉渣饼”两侧就是这两个标识符,但是PHP似乎很难处理这个问题

<title>掉渣饼 - docin.com豆丁网</title>

------解决方案--------------------
UTF-8字符,这些字符超出了字体库的范围。
------解决方案--------------------
unicode的e000-f8ff码段属于“用户私有”

就是说unicode组织并不在该码段定义任何字符,预留给用户自行使用
所以你所说的这些字符是api自定义的,看来是边界符,请参考你的api说明文档
------解决方案--------------------
正则,/[\uE000-\uF8FF]/u,逐个找出来替换为你需要的