Python正则表达式基础知识有哪些,re模块怎么用
Admin 2022-08-12 群英技术资讯 263 次浏览
安装 Python 解释器/anaconda。
安装好 jupyter lab。
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 none。
# 导入 re 模块 import re print(re.match('www', 'www.huawei.com').span()) # 在起始位置匹配 print(re.match('com', 'www.huawei.com')) # 不在起始位置匹配
输出: (0, 3)
None
re.search 扫描整个字符串并返回第一个成功的匹配。
import re print(re.search('www', 'www.huawei.com').span()) # 在起始位置匹配 print(re.search('com', 'www.huawei.com').span()) # 不在起始位置匹配
输出: (0, 3)
(11, 14)
compile 方法的使用
re.compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用。
pattern = re.compile(r'\d+') # 用于匹配至少一个数字 n = pattern.match('one12twothree34four') # 查找头部,没有匹配 print(n) # 从'e'的位置开始匹配,没有匹配 m = pattern.search('one12twothree34four') print(m) print(m.group())
输出: None
12
re.sub 用于替换字符串中的匹配项: phone = "2021-0101-000 # 这是一个电话号码" # 删除字符串中的 Python 注释 num = re.sub(r'#.*$', "", phone) print("电话号码是: ", num) # 删除非数字(-)的字符串 num = re.sub(r'\D', "", phone) print("电话号码是 : ", num) 输出: 电话号码是: 2021-0101-000 电话号码是 : 20210101000
使用正则表达式来匹配数字:
# 匹配文本中的所有数字 str_ = "996.ICU 指工作 996、生病 ICU,也就是工作从早上 9 点上班到晚上 9 点下班,每周工作 6 天, 生病了就住进 ICU" num1 = re.findall(r'\d+', str_) # 使用\d 匹配数字,+表示匹配多次 print(num1) num2 = re.findall(r'[0-9]{1,3}', str_) # 正则表达式不唯一,可以使用[]指定匹配元素的范围 {}指定次数 print(num2)
输出: ['996', '996', '9', '9', '6']
['996', '996', '9', '9', '6']
使用\w 可以匹配数字字母下划线:
# 匹配文本中的所有符号 s6 = re.findall(r'\W+', str_) print(s6)
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
本文主要介绍了python [::-1] [::-1,::-1]的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
很多新手学习python时,对于多进程和多线程不是很清楚,为了帮助大家更好的学习和理解多进程和多线程,这篇文章就给大家介绍关于PHP多进程和多线程的使用,下面有详细的介绍以及代码,供大家参考学习。
这篇文章主要为大家介绍了Python数据分析之文件的读取,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
类(class)抽象的概念,比如说人类、鸟类、水果、是一个总的称呼,没有具体到某个物体;对象(object,指具体实例,instance);
这篇文章主要为大家详细介绍了Python实现单向链表,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008