9.1 正则表达式语法
正则表达式是字符串处理的有力工具和技术,正则表达式使用预定义的特定模式去匹配一类具有共同特征的字符串,主要用于字符串处理,可以快速、准确地完成复杂的字符串查找、替换等处理要求。
常用的正则表达式元字符:
元字符 | 功能说明 |
---|---|
. | 除换行符外的任意单个字符 |
* | 0个或任意多个字符 |
+ | 1个或任意多个字符 |
– | 用在 [ ] 中表示范围 |
| | 两者中一个 |
^ | 行首 |
$ | 行尾 |
? | 0个或1个字符 |
\ | 转义字符 |
\num | 连续num个连续字符 |
\f | 换页符 |
\n | 换行符 |
\r | 回车符 |
\b | 任何字母 |
\B | 非字母 |
\d | 任何数字 |
\D | 非数字 |
\s | 任何空白符 |
\S | 非空白符 |
\w | 任何字母、数字、下划线 |
\W | 非字母、数字、下划线 |
( ) | 将 ( ) 内容作为一个整体 |
{ } | 按 { } 中的次数进行匹配 |
[ ] | 匹配 [ ] 中的任一字符 |
[^xyz] | 反向字符集,除 x, y, z 外的任意字符 |
[a-z] | 字符范围,匹配指定范围内的任何字符 |
[^a-z] | 反向范围字符,匹配除 a-z 外的任何字符 |