pandas里怎样处理缺失值为NaN的情况?
Admin 2021-08-21 群英技术资讯 586 次浏览
pandas里怎样处理缺失值为NaN的情况?Python中我们用pandas处理数据非常的方便,但是也常会遇到一些问题。例如andas中NaN缺失值的情况,一些新手朋友可能不太清楚怎样解决,下面给大家分享两种处理pandas中NaN缺失值的方法,有需要的朋友可以参考。
import pandas as pd
两种方法:
先判断数据中是否存在NaN,通过下面两个方法中任意一个
pd.isnull(dataframe) # dataframe为数据 如果数据中存在NaN返回True,如果没有就返回False pd.notnull(dataframe) 该方法与isnull相反 any() 和 all() """ pd.isnull(dataframe).any() 判断哪一个字段中存在缺失值没有就返回False pd.notnull(dataframe).all() 判断哪一个字段中存在缺失值没有就返回True """
使用numpy也可以进行判断
import numpy as np np.any(pd.isnull(dataframe)) # 如果返回True,说明数据中存在缺失值 np.all(pd.notnull(dataframe)) # 如果返回False, 说明数据中存在缺失值
然后进行数据处理
方式一: 删除空值行
dataframe.dropna(inplace=False) """ dropna() 是删除空值数据的方法, 默认将只要含有NaN的整行数据删除, 如果想要删除整行都是空值的数据需要添加how='all'参数 默认是删除整行, 如果对列做删除操作, 需要添加axis参数, axis=1表示删除列, axis=0表示删除行 inplace: 是否在当前的dataframe中执行此操作, True表示在原来的基础上修改, False表示返回一个新的值, 不修改原有数据 """
方式二: 替换/插补
dataframe.fillna('替换的值value',inplace=False) ''' 把替换NaN的值传入到fillna()中 '''
比如有的空值不是NaN, 有的是一个'?'
先替换
使用numpy把"?"替换为NaN
import numpy as np # 替换 dataframe.replace(to_replace="?", value=np.nan)
把其他的缺失值换为NaN后, 然后就按照缺失值为NaN的方式就行操作
如果只是单独的删除数据可以使用drop()方法
DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) ''' 代码解释: labels : 就是要删除的行列的名字,用列表指定 index : 直接指定要删除的行 columns : 直接指定要删除的列 inplace=False : 表示返回一个新的值, 不修改原有数据 inplace=True : 表示在原来的基础上修改 '''
例:
import pandas as pd
df = pd.read_csv('/text.xlsx')
# 删除第0行和第1行
df.drop(labels=[0,1],axis=0)
# 删除列名为 age 的列
df.drop(axis=1,columns=age)
关于pandas中处理NaN缺失值的方法就介绍到这,上述实例具有一定的参考价值,感兴趣的朋友可以参考学习,希望能对大家有帮助,想要了解更多pandas 处理缺失值的内容,大家可以关注其他文章。
文本转载自脚本之家
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
本文讲述如何使用 tkinter 的布局管理 (被称作 layout managers 或 geometry managers). tkinter 有三种布局管理方式:pack,grid,place。注意这三种布局管理在同一个 master window 里一定不可以混用! 布局管理有以下功能:
本文主要介绍的python排序算法的实现,下本有冒泡排序、选择排序、插入排序、快速排序这四种排序的算法实现步骤以及实现的介绍,和四种算法实现的比较,具有一定的参考价值。下面一起跟随小编看看吧。
在玩python学习机器时,对于那种对随机性不太敏感的模型,理论上说可以不打乱。但敏感不敏感也跟数据量级,复杂度,算法内部计算机制都有关,目前并没有一个经纬分明的算法随机度敏感度列表。既然打乱数据并不会得到一个更差的结果,一般推荐的做法就是打乱全量数据。那怎么打乱呢?
这篇文章主要为大家介绍了 Python字典的增删改查,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
Altair被称为是统计可视化库,因为它可以通过分类汇总、数据变换、数据交互、图形复合等。本文和大家聊一下Python当中的altair可视化模块,并且通过调用该模块来绘制一些常见的图表,感兴趣的可以了解一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008