日期:2014-05-17  浏览次数:20434 次

【正则】问个正则分割的问题,在线求解~
目的:正则分割关键字。

假定关键字为(中间有多个空格):你  我   她

用星号:
print_r(preg_split("/(\s*)/", $_POST['query']));

结果:Array ( [0] => [1] => ? [2] => ? [3] => ? [4] => [5] => ? [6] => ? [7] => ? [8] => [9] => ? [10] => ? [11] => ? [12] => )

用加号:print_r(preg_split("/(\s+)/", $_POST['query']));
结果:Array ( [0] => 你 [1] => 我 [2] => 她 )

这是为什么啊?

正则手册:
*  匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。 
+  匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。 

一个匹配零次或多次,一个匹配一次或多次,就一个区别差距就这么大吗?我怎么也没想明白为什么星号会造成乱码~~~



------解决方案--------------------
* 代表 0 次也可以,你不是要按空格来区分么? 空格也有个数的~
------解决方案--------------------
应该是匹配了0次
------解决方案--------------------
\s*可能在“你”的编码的第一和第二个字节间匹配了0个字符,于是就出乱码了
------解决方案--------------------
何必用split呢,直接匹配非空不好吗