Regular_expression
常用正则表达式
| 正则字符 | 匹配对象 | 举例 |
|---|---|---|
| . | 匹配任意字符 | null |
| \d | 匹配一个数字 | null |
| \w | 匹配一个字母或数字或下划线 | \w匹配的字母不止英文字母, 所以比[A-Za-z0-9_]的匹配范围更广 |
| \W | \w的匹配范围取反 | null |
| \s | 匹配任意空白符,等价于[\t\n\f\v\r] | null |
| \S | 匹配任意非空白符 | null |
| [] | 表示[]中所限定的范围内的任意一个字符 | [A-Za-z0-9]匹配任意英文字母和数字 |
| () | ()中的内容将作为一个整体 | ([0-9][a-z][A-Z]) 匹配一个长度为3的 字符串,其首字符为数字,中间字符为 小写英文字母,尾字符为大写英文字母 |
| ^ | 用于行匹配,限制行的开头 | ^\d 表示以数字开头 |
| $ | 用于行匹配,限制行的结尾 | \d$ 表示以数字结束 |
| * | 表示任意数目的字符 | .* 即通配 |
| + | 表示至少一个字符 | \d+ 表示至少一个数字 |
| ? | 表示0或1个字符 | null |
| {n} | 表示n个字符 | .{4} 表示长度为4的字符串 |
| {n,m} | 表示n-m个字符 | null |
| A|B | 匹配A或B | (\d|[a-z])+ 匹配至少一个数字或小写英文字母 |
| [^a-z] | 负值匹配区间,即匹配除小写英文字母外的任意字符 | 再如[^\d]匹配除数字外的字符 |
| \<\> | 匹配文章中词的开始(\<)和结尾(\>) | \<other\>匹配单词other而不会匹配到 another中的other |
| \b | 匹配单词边界 | er\b 可以匹配other中的er,但不能匹配 there中的er;\b12 可以匹配123中的 12,但不会匹配3123中的12 |
正则表示中需要使用 \ 转义的字符有 \ | [ ] { } ( ) ? + . * ^ $