正则匹配 模式修正符 小写u的问题 php
最近看到一段代码:
<?php
$str = '你好,世界dd';
preg_match_all('/./us', $str, $match);
echo count($match[0])."<br />";
?>
上网查了不少资料,但对于php正则表达式中的模式修正符u实在有些不明白,求解啊……
------解决方案--------------------u :unicode 的缩写,表示待匹配的串是一个符合 unicode 编码规则的串,比如 utf-8 编码的串
在 u 修饰符下,一个汉字被当做一个字符被处理。\w 有原来的 [_0-9A-Za-z] 扩展到汉字
------解决方案--------------------$s = '汉字abc';
preg_match_all('/\w/', $s, $r); //没有 u 修饰
print_r($r);
得
Array
(
[0] => Array
(
[0] => a
[1] => b
[2] => c
)
)
$s = '汉字abc';
preg_match_all('/\w/u', $s, $r); //有 u 修饰
print_r($r);
得
Array
(
[0] => Array
(
[0] => 汉
[1] => 字
[2] => a
[3] => b
[4] => c
)
)
------解决方案--------------------