如何用Python去除字符串逗号,代码是什么
Admin 2022-08-31 群英技术资讯 529 次浏览
在西文数字的表示中,很多格式是类似这样:123,456,789。
如果得到这样的一个字符串,直接用int转换成整型肯定报错,那么在格式转换前需要先去除数字之间的逗号 。
如果字符串只有数字和“,”,那么可以用一个replace替换。
例如:
>>> n = '123,456,789' >>> n1 = n.replace(',','') >>> print n1 123456789
但是,如果当字符串中包括数字和其他字符,replace替换就有点霸道了。例如:Today is Sunday, I bought $ 100,000. 直接用replace替换会把字符串中的逗号标点符号也删除了。
所以需要找到 数字,数字 这种格式之前的逗号。
代码类似如下:
import re s = 'Today is Sunday, I bought $ 100,000.' p = re.compile(r'\d,\d') while 1: m = p.search(s) if m: mm = m.group() s = s.replace(mm,mm.replace(',','')) else: break print s
用正则表达式判断。
删除字符串中的指定符号
s = "abc123,123。" # 删除逗号 s = s.replace(',', '') print(s) # "abc123123。"
删除字符串中的空格
s = " 123abc " # 删除开头的空格 print(s.lstrip()) # "123 abc " # 删除结尾的空格 print(s.rstrip()) # " 123 abc" # 删除开头和结尾的空格 print(s.strip()) # "123 abc" # 删除字符串中所有的空格 print(s.replace(' ', '')) # "123abc"
删除字符串中的所有符号,只保留数字和英文字母
import re s = "123,abc .?/&?》^_^dddA。" # 把所有编码非\u0030-\u0039(数字)、\u0041-\u007a(英文字母)的字符替换为空字符串 rs = re.sub("([^\u0030-\u0039\u0041-\u007a])", '', s) print(rs) # "123abcdddA"
只字符串中的保留汉字
import re s = "我爱中国,I love China。" # 把所有编码非\u4e00-\u9fa5(汉字)的字符替换为空字符串 rs = re.sub("([^\u4e00-\u9fa5])", '', s) print(rs) # "我爱中国"
对应的unicode编码范围
说明 | unicode范围 |
---|---|
数字 | \u0030-\u0039 |
汉字 | \u4e00-\u9fa5 |
大写字母 | \u0041-\u005a |
小写字母 | \u0061-\u007a |
英文字母 | \u0041-\u007a |
韩文 | \uAC00-\uD7AF |
日文 | \u3040-\u31FF |
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python如何对文件进行重命名,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
这篇文章给大家分享的是有关pytorch实现变量类型转换的内容,其实变量类型转换的方法有很多,因此下面小编和大家一起探究变量类型转换的方法有哪些?怎样实现?感兴趣的朋友就继续往下看吧。
这篇文章主要给大家介绍了关于Python自定义模块创建与使用的相关资料,文中还给大家分享了python打包用户自定义模块的方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
这篇文章介绍了python自动化测试之破解图文验证码的解决方案,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
这篇文章主要介绍了在Numpy.array中[:]和[::]的区别说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008