Python中如判断字符串是否包含字符,用什么方法
Admin 2022-08-17 群英技术资讯 490 次浏览
有一个ssqdatav2
数据,要找到其中的深圳,并且替换成圳。
因为收集到的数据出现了错误,本来只有省份简写的地方却出现了深圳。
如何找到DF中包含深圳的数据?
cond=ssqdatav2['first'].str.contains('深圳') ssqdatav2.loc[cond]
此时就找到first当中包含深圳的数据。
# 为分解firstprize定义函数 def fpp(x): if len(x)<=2: # 判断是否只有汉字,还是也有数字 return "待定" # 没有汉字的用待定表示 else: # 使用正则表达式获取中文 pattern="[\u4e00-\u9fa5]" # 汉字专用字符ASCII区间 pat=re.compile(pattern) return ','.join(pat.findall(x)) # 使用逗号作为每个省份的分隔符 #使用fp() ssqdatav2['fpprovince']=ssqdatav2['first'].apply(lambda x:fpp(x)) ssqdatav2.head()
将每个省份单独形成1列:
fpnames=['p01','p02','p03','p04','p05'] ssqdatav3[fpnames]=ssqdatav3['fpprovince'].str.split(',',expand=True) ssqdatav3
去除掉None值,是None的地方变成空值:
# 逐个分割 ssqdatav3['p001']=ssqdatav3['fpprovince'].apply(lambda x:x if x.count(',')==0 else x.split(',')[0]) ssqdatav3['p002']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[1] if x.count(',')>=1 else '') ssqdatav3['p003']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[2] if x.count(',')>=2 else '') ssqdatav3['p004']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[3] if x.count(',')>=3 else '') ssqdatav3['p005']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')[4] if x.count(',')>=4 else '') ssqdatav3.to_excel('ssqdatav3p05.xlsx',index=False) ssqdatav3.head()
# 让双色球的期号ID成为订单号,7个号码都有对应的订单号,即每个期号都有7个订单号且分成不同的行 import numpy as np ssqdatav3['province2']=ssqdatav3['fpprovince'].apply(lambda x:x.split(',')) ssqdatav3 province2=ssqdatav3['province2'].to_list() province2 rs=[len(r) for r in province2] rs a=np.repeat(ssqdatav3['id'],rs) a ssqdataprov=pd.DataFrame(np.column_stack((a,np.concatenate(province2))),columns=['ID','PROVINCE']) # ssqdataprov=ssqdataprov[(ssqdataprov['PROVINCE']!='深')] # 等价 # ssqdataprov=ssqdataprov[~(ssqdataprov['PROVINCE']=='深')] # 等价 ssqdataprov=ssqdataprov[~(ssqdataprov['PROVINCE'].str.contains('深'))] ssqdataprov
按照每个字段来划分,并且删去含有深的字段,这样就只保留圳字了
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python使用ClickHouse的实践与踩坑记录,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
这篇文章主要介绍了解决安装pytorch因网速问题失败的情况,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
大家平时在工作与学习中都会操作到Excel文件格式,特别是很多数据的时候,靠人力去识别操作非常容易出错。今天就带大家用Python来处理Excel文件,让你成为一个别人眼中的秀儿
这篇文章主要为大家介绍了Keras搭建分类网络平台VGG16 MobileNet ResNet50,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
这篇文章主要介绍了初识python的numpy模块,Numpy基于更加现代化的编程语言--python,python凭借着开源、免费、灵活性、简单易学、工程特性好等特点风靡技术圈,已经成为机器学习、数据分析等领域的主流编程语言,需要的朋友可以参考下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008