日期:2014-05-16  浏览次数:20870 次

MYSQL入门学习之二:使用正则表达式搜索

一、正则表达式介绍

正则表达式是用来匹配文本的特殊的串(字符集合)。

二、使用MySQL正则表达式

1、MySQL仅仅支持多数正则表达式实现的一个很小的子集。

2、LIKE匹配整个列值;而REGEXP匹配列值的子串,如果被匹配的文本在列值中出现,REGEXP将会找到它,相应的行将被返回。看下面的例子:

mysql>select username from v9_admin where username like 'space';
Emptyset (0.00 sec)
 
mysql>select username from v9_admin where username REGEXP 'space';
+-----------+
|username  |
+-----------+
|warmspace |
+-----------+
1 rowin set (0.02 sec)

3、默认MySQL中的正则表达式匹配不区分大小写,可使用BINARY关键字区分大小写,如

mysql>select username from v9_admin
    -> where username REGEXP BINARY'SPACCE';
Emptyset (0.04 sec)

4、进行OR匹配:为搜索两个串之一,使用|,如下所示:

mysql>select roleid from v9_admin_role
    -> where roleid REGEXP '1|3';
+--------+
|roleid |
+--------+
|      1 |
|      3 |
+--------+
2 rowsin set (0.00 sec)

5、匹配几个字符之一:匹配任何单一字符。如下所示:

mysql>select name from v9_collection_node
    -> where name REGEXP '005-[123]';
+-----------------+
|name            |
+-----------------+
|101-02-01-005-2 |
|101-02-01-005-1 |
|101-02-01-005-3 |
+-----------------+
3 rowsin set (0.00 sec)

正如所见,[]是另一种形式的OR语句。'005-[123]'与’005-[1|2|3]’是等价的。

匹配除给定字符外的字符:

mysql>select name from v9_collection_node
    -> where name REGEXP '005-[^123]';
+-------------------+
|name              |
+-------------------+
|101-02-01-005-4.2 |
|101-02-01-005-4   |
|101-02-01-005-5   |
+-------------------+
3 rowsin set (0.00 sec)

6、可使用-来定义一个范围。如[1-9],[a-b]。

mysql>select name from v9_collection_node
    -> where name REGEXP '005-[1-3]';
+-----------------+
|name            |
+-----------------+
|101-02-01-005-2 |
|101-02-01-005-1 |
|101-02-01-005-3 |
+-----------------+
3 rowsin set (0.00 sec)

7、为了匹配特殊字符,必须用\\为前导,例如\\-,\\.等。这种处理即转义(escaping)。

多数正则表达式实现使用单个反斜杠转义特殊字符,但MYSQL要求两个(MYSQL自己解释一个,正则表达式库解释另一个)。

\\也用来引用元字符(具有特殊含义的字符),如下表:



8、为了更方便工作,可以使用预定义的字符集,称为字符类(character class)。

mysql> select name fromv9_collection_node
   -> where name REGEXP '[[:digit:]]';
+-------------------+
| name              |
+-------------------+
| 101-10-01-002-1   |
| 101-02-01-005-4.2 |
| 101-02-01-005-2   |
| 101-02-01-005-1   |
| 101-02-01-005-3   |
| 101-02-01-005-4   |
| 101-02-01-005-5   |
| 101-10-01-002-2   |
| 101-11-04-001-1   |
+-------------------+
9 rowsin set (0.00 sec)


9、使用正则表达式重复元字符匹配多个实例:

mysql> select name fromv9_collection_node
   -> where name REGEXP '1{2}';
+-----------------+
| name            |
+-----------------+
| 101-11-04-001-1 |
+-----------------+
1 rowin set (0.00 sec)


10、定位符(为了匹配特定位置的文本):

mysql> select name from v9_collection_node
    -> where name REGEXP '2$';
+-------------------+
| name              |
+-------------------+
| 101-02-01-005-4.2 |
| 101-02-01-005-2   |
| 101-10-01-002-2   |
+-------------------+
3 rows in set (0.00 sec)


11、使REGEXP起类似LIKE的作用,它们的区别在于LIKE匹配整个串而REGEXP匹配子串。利用定位符,通过用^开始每个表达式,用$结束每个表达式。

12、简单的正则表达式测试:可以在不使用数据库表的情况下用SELECT来测试正则表达式。REGEXP检查总是返回0或1(匹配)。

mysql> select 'hell