正则表达式即 regular expression ,描述了一种字符串匹配的模式(pattern),可以用来检查一个字符串是否含有某种子串,也可以将匹配的子串替换,还可以从某个字符串中取出符合某个条件的子串等。
模式和被搜索的字符串既可以是 Unicode 字符串 (str) ,也可以是 8 位字节串 (bytes)。 但是 Unicode 字符串与 8 位字节串不能混用:也就是说,你不能用一个字节串模式去匹配 Unicode 字符串,反之亦然;类似地,当进行替换操作时,替换字符串的类型也必须与所用的模式和搜索字符串的类型一致。
正则表达式并不是 Python 语言独有的,在其他语言也很广泛地使用到正则表达式。Python 自 1.5 版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
1
|
re.compile(pattern, flags=0)
|
1
|
re.findall(pattern, string, flags=0)
|
1
|
re.finditer(pattern, string, flags=0)
|
1
|
re.search(pattern, string, flags=0)
|
1
|
re.match(pattern, string, flags=0)
|
1
|
re.split(pattern, string[, maxsplit=0, flags=0])
|
1
|
re.sub(pattern, repl, string, count=0, flags=0)
|
1
|
re.subn(pattern, repl, string, count=0, flags=0)
|
1
|
Pattern.search(string[, pos[, endpos]])
|
1
|
Pattern.match(string[, pos[, endpos]])
|
1
|
Pattern.split(string, maxsplit=0)
|
1
|
Pattern.findall(string[, pos[, endpos]])
|
1
|
Pattern.finditer(string[, pos[, endpos]])
|
1
|
Pattern.sub(repl, string, count=0)
|
1
|
Pattern.subn(repl, string, count=0)
|
1
|
Match.group([group1, ...])
|
1
|
Match.groups(default=None)
|