Regular_expression
常用正则表达式
正则字符 | 匹配对象 | 举例 |
---|---|---|
. | 匹配任意字符 | null |
\d | 匹配一个数字 | null |
\w | 匹配一个字母或数字或下划线 | \w匹配的字母不止英文字母, 所以比[A-Za-z0-9_]的匹配范围更广 |
\W | \w的匹配范围取反 | null |
\s | 匹配任意空白符,等价于[\t\n\f\v\r] | null |
\S | 匹配任意非空白符 | null |
[] | 表示[]中所限定的范围内的任意一个字符 | [A-Za-z0-9]匹配任意英文字母和数字 |
() | ()中的内容将作为一个整体 | ([0-9][a-z][A-Z]) 匹配一个长度为3的 字符串,其首字符为数字,中间字符为 小写英文字母,尾字符为大写英文字母 |
^ | 用于行匹配,限制行的开头 | ^\d 表示以数字开头 |
$ | 用于行匹配,限制行的结尾 | \d$ 表示以数字结束 |
* | 表示任意数目的字符 | .* 即通配 |
+ | 表示至少一个字符 | \d+ 表示至少一个数字 |
? | 表示0或1个字符 | null |
{n} | 表示n个字符 | .{4} 表示长度为4的字符串 |
{n,m} | 表示n-m个字符 | null |
A|B | 匹配A或B | (\d|[a-z])+ 匹配至少一个数字或小写英文字母 |
[^a-z] | 负值匹配区间,即匹配除小写英文字母外的任意字符 | 再如[^\d]匹配除数字外的字符 |
\<\> | 匹配文章中词的开始(\<)和结尾(\>) | \<other\>匹配单词other而不会匹配到 another中的other |
\b | 匹配单词边界 | er\b 可以匹配other中的er,但不能匹配 there中的er;\b12 可以匹配123中的 12,但不会匹配3123中的12 |
正则表示中需要使用 \ 转义的字符有 \ | [ ] { } ( ) ? + . * ^ $