Python正则表达式基础知识有哪些,re模块怎么用
Admin 2022-08-12 群英技术资讯 393 次浏览
安装 Python 解释器/anaconda。
安装好 jupyter lab。
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 none。
# 导入 re 模块 import re print(re.match('www', 'www.huawei.com').span()) # 在起始位置匹配 print(re.match('com', 'www.huawei.com')) # 不在起始位置匹配
输出: (0, 3)
None
re.search 扫描整个字符串并返回第一个成功的匹配。
import re print(re.search('www', 'www.huawei.com').span()) # 在起始位置匹配 print(re.search('com', 'www.huawei.com').span()) # 不在起始位置匹配
输出: (0, 3)
(11, 14)
compile 方法的使用
re.compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
pattern = re.compile(r'\d+') # 用于匹配至少一个数字 n = pattern.match('one12twothree34four') # 查找头部,没有匹配 print(n) # 从'e'的位置开始匹配,没有匹配 m = pattern.search('one12twothree34four') print(m) print(m.group())
输出: None
12
re.sub 用于替换字符串中的匹配项: phone = "2021-0101-000 # 这是一个电话号码" # 删除字符串中的 Python 注释 num = re.sub(r'#.*$', "", phone) print("电话号码是: ", num) # 删除非数字(-)的字符串 num = re.sub(r'\D', "", phone) print("电话号码是 : ", num) 输出: 电话号码是: 2021-0101-000 电话号码是 : 20210101000
使用正则表达式来匹配数字:
# 匹配文本中的所有数字 str_ = "996.ICU 指工作 996、生病 ICU,也就是工作从早上 9 点上班到晚上 9 点下班,每周工作 6 天, 生病了就住进 ICU" num1 = re.findall(r'\d+', str_) # 使用\d 匹配数字,+表示匹配多次 print(num1) num2 = re.findall(r'[0-9]{1,3}', str_) # 正则表达式不唯一,可以使用[]指定匹配元素的范围 {}指定次数 print(num2)
输出: ['996', '996', '9', '9', '6']
['996', '996', '9', '9', '6']
使用\w 可以匹配数字字母下划线:
# 匹配文本中的所有符号 s6 = re.findall(r'\W+', str_) print(s6)
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了python中常见进制之间的转换方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
文本给大家介绍的是Python的字符串的内容,详细介绍了字符串的创建,字符串的定义,字符串的操作,具有一定的借鉴价值,有需要的朋友可以参考学习。
大家好,本篇文章主要讲的是Python函数中的全局变量详解,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
这篇文章主要介绍了Python基础之tkinter图形化界面学习,文中有非常详细的代码示例,对正在学习python基础的小伙伴们有非常好的帮助,需要的朋友可以参考下
numpy是Python语言的一个扩充程序库,可以支持高级大量的维度数组与矩阵运算。本文给大家介绍的就是关于numpy库的基本使用,具有一定的参考学习价值,下面跟随小编一起来了解一下numpy库的使用吧。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008