python 正则
符号 | 意思 | 说明 |
---|---|---|
re1|re2 | 匹配re1或者re2 | |
. | 匹配除了\n的任意字符 | |
^ | 字符串的起始部分 | |
$ | 字符串的结尾部分 | |
* | 对前面的表达式匹配0次或多次 | |
+ | 对前面的匹配1次或多次 | |
? | 对前面的匹配0次或者一次 | |
{N} | 匹配N次 | |
{M,N} | 匹配M到N次 | |
[…],[0-9],[A-Za-z] | 匹配方括号字符集里的单个字符 | |
[^A-Z] | 不匹配字符集里的任意一个字符 | |
(…) | 匹配封闭的表达式,另存为子组 | |
\d | 数字 | |
\w | 字母数字字符 | |
\s | 空格 | |
\b | 单词边界 |
the 匹配的是the这个字符串
\bthe 匹配以the开头的单词 \bthe\b匹配the这个单词 \Bthe 匹配包含但不以the开头的字符串 |
一些函数
函数名 | 函数作用 |
---|---|
complie() | 返回一个正则表达式对象 |
match(pattern,string,flao=0) | 尝试从字符串的起始匹配pattern,成功返回匹配对象,失败返回None |
search(pattern,string,flag=0) | 搜索字符串中第一次出现的pattern,成功返回对象,失败返回None |
findall(pattern,string) | 所有的匹配的模式,返回匹配列表 |
sub(pattern,repl,string,count=0) | 用repl替换string中所有匹配上的pattern的位置,定义count时只匹配count位置 |
group(),groups(),groupdict() | 返回匹配上的组或者子组 |