日期:2014-05-16  浏览次数:20509 次

正则匹配 模式修正符 小写u的问题 php
最近看到一段代码:

<?php
$str = '你好,世界dd';
preg_match_all('/./us', $str, $match);
echo count($match[0])."<br />";  
?>

上网查了不少资料,但对于php正则表达式中的模式修正符u实在有些不明白,求解啊……

------解决方案--------------------
u :unicode 的缩写,表示待匹配的串是一个符合 unicode 编码规则的串,比如 utf-8 编码的串
在 u 修饰符下,一个汉字被当做一个字符被处理。\w 有原来的 [_0-9A-Za-z] 扩展到汉字
------解决方案--------------------
$s = '汉字abc';
preg_match_all('/\w/', $s, $r); //没有 u 修饰
print_r($r);

Array
(
    [0] => Array
        (
            [0] => a
            [1] => b
            [2] => c
        )

)
$s = '汉字abc';
preg_match_all('/\w/u', $s, $r); //有 u 修饰
print_r($r);

Array
(
    [0] => Array
        (
            [0] => 汉
            [1] => 字
            [2] => a
            [3] => b
            [4] => c
        )

)

------解决方案--------------------
引用:
$s = '汉字abc';
preg_match_all('/\w/', $s, $r); //没有 u 修饰
print_r($r);

Array
(
    [0] => Array
        (
            [0] => a
            [1] => b
            [2] => c
        )

)
$s = '汉字abc';
preg_match_all('/\w/u', $s, $r); //有 u 修饰
print_r($r);

Array
(
    [0] =&