相同的Dataframe中如何找出不相同的元素
Admin 2022-08-17 群英技术资讯 671 次浏览
本篇博客解决在两个几乎完全相同的DataFrame当中如何找出不相同的元素,并使用datacompy直观的显示出来。
x表:
让x1和x2都是x的副本,则此时x1和x2的值是相同:
x1=x.copy() x2=x.copy()
将其中x2的一个数据赋值为2000
x2.loc['罗梓烜']['20220125']=2000
x1[x1==x2].head(25) # 如何对不相等的数据进行纠正
此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2是不相同的
x1[x1==x2].isnull().sum()
下图说明在20220125
这一列当中存在一个NaN
值,也就是我们刚刚赋值的地方:
但是现在还是不能确定出有异常值(也就是不相等的值的那行数据),因此我们考虑使用datacompy
安装:
pip install datacompy
import datacompy,pandas as pd,sys compy=datacompy.Compare(x1,x2,on_index=True) compy print(compy.matches()) print(compy.report())
此时就可以很清晰的看到两个DataFrame当中不相同的值了:
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
本篇文章给大家带来了关于Python的相关知识,Supervisor 是一款 Python 开发的进程管理系统,允许用户监视和控制 Linux 上的进程,能将一个普通命令行进程变为后台守护进程,异常退出时能自动重启,下面一起来看一下,希望对大家有帮助。
可以使用 >= 运算符判断当前集合是否为另一个集合的超集,即判断集合 b 中的所有元素是否都包含在集合 a 中。
这篇文章主要介绍了Python中range函数的使用方法,文章基于Python3环境展开range函数的使用方法,具有一定的参考价值,需要的小伙伴可以参考一下
在PyTorch中,torch.Tensor类是存储和变换数据的重要工具,相比于Numpy,Tensor提供GPU计算和自动求梯度等更多功能,在深度学习中,我们经常需要对函数求梯度(gradient)。
Urllib3是一个功能强大,条理清晰,用于HTTP客户端的Python库。那么Python爬虫中urllib3与urllib的区别是什么,本文就详细的来介绍一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008