Python正则表达式-基础
本文转载自昔日暖阳,原文地址:http://www.osheep.cn/4806.html
python使用正则,需要先引入re模块
import re
匹配符
[0-9]
\D等同于[^0-9]
匹配非数字,即\d
的取反\w等同于[a-z0-9A-Z_]
匹配大小写字母、数字和下划线\W等同于[^a-z0-9A-Z_]
等同于上一条取反.一个任意字符匹配模式
# 匹配126,163邮箱地址ret = re.match(r"^[0-9a-zA-Z_]{4,20}@(163|126)\.com$", 'hello@126.com')if ret: print('符合要求 - ', ret.group(), ret.group(1))else: print('不符合要求!')
案例二:匹配邮箱并进行分组取值匹配126,163邮箱地址
# 使用()对匹配值进行分组,可以方便的取得匹配值# 分组1表示@前面的字符串# 分组2表示163或者126ret = re.match(r"^([0-9a-zA-Z_]{4,20})@(163|126)\.com$", 'hello@126.com')if ret: print('符合要求 - ', ret.group(), ret.group(1), ret.group(2))else: print('不符合要求!')
案例三:在正则表达式中使用分组匹配网页源代码块
# 在正则表达式中使用分组# 使用\分组数表示需要使用的分组ret = re.match(r"^<(\w+)>.*</(\1)>$", '<h2>hello</h2>')if ret: print('符合要求 - ', ret.group())else: print('不符合要求!')
使用多个分组
# 在正则表达式中使用分组# 使用\分组数表示需要使用的分组,这里表示多个分组ret = re.match(r"^<(\w+)><(\w+)>.*</(\2)></(\1)>$", '<body><h2>hello</h2></body>')if ret: print('符合要求 - ', ret.group())else: print('不符合要求!')
案例四:在正则表达式中对分组进行命名对分组进行命名 语法:标记分组 ?P<name> 引用分组 ?P=name
# 在正则表达式中使用分组# 使用\分组数表示需要使用的分组,这里表示多个分组ret = re.match(r"^<(?P<p1>\w+)><(?P<p2>\w+)>.*</(?P=p2)></(?P=p1)>$", '<body><h2>hello</h2></body>')if ret: print('符合要求 - ', ret.group())else: print('不符合要求!')
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。