pandas中的agg函数可以做什么,如何使用
Admin 2022-08-30 群英技术资讯 468 次浏览
python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数
如下所示:
>>> df = pd.read_excel(r"D:/myExcel/1.xlsx") >>> df A B C 0 bob 12 45 1 millor 15 23 2 bob 34 88 3 bob 98 23
(1)获取按A分组后B列的最大值
>>> df.groupby(by='A').agg({'B':'max'}) B A bob 98 millor 15
(2)获取按A分组后B列的最大值和最小值
>>> df.groupby(by='A').agg({'B':['max','min']}) B max min A bob 98 12 millor 15 15
(3)获取按A分组后B列的最大值和最小值以及C列的最大值
>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'}) B C max min min A bob 98 12 23 millor 15 15 23
(4)默认是以函数名称命名的,可以修改
>>> df.groupby(by='A').agg( b_min=pd.NamedAgg(column='B', aggfunc='min'), b_max=pd.NamedAgg(column='B', aggfunc='max')) b_min b_max A bob 12 98 millor 15 15
通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中
>>> df.groupby('A').B.agg(['min', 'max']) min max A bob 12 98 millor 15 15 >>> df.groupby('A').B.agg(['min', 'max']).reset_index() A min max 0 bob 12 98 1 millor 15 15
这就是python小工具关于agg函数的介绍,挺有用 的一个函数。
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便进行聚合操作。
import pandas as pd df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})
grouped = df1.groupby(['sex','smoker']) # sex有 F M 二值,smoker有 Y N 二值,故分成四组。
grouped['age'].agg('mean')
sex smoker F N 30.0 Y 28.0 M N 40.0 Y 17.5 Name: age, dtype: float64
grouped.agg('mean')
grouped['age'].agg(['min','max'])
grouped['age'].agg([('A','mean'),('B','max')])
grouped.agg({'age':['sum','mean'], 'weight':['min','max']})
def Max_cut_Min(group): return group.max()-group.min() grouped.agg(Max_cut_Min)
grouped.describe()
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章给大家分享的是python中lstrip()用法。lstrip() 方法用于截掉字符串左边的空格或指定的字符,小编觉得挺实用的,因此分享给大家做个参考,文中示例代码介绍的非常详细,感兴趣的朋友接下来一起跟随小编看看吧。
在上一章的学习中,我们主要学习了怎么去衡量一个算法的好坏,比较常见的方式是使用大O记法,就是所谓的时间复杂度,这一章节我来学习基本的数据结构,如栈、队列和双端队列等等。感兴趣的小伙伴可以参考一下
本文将通过股票均线计算的案例来为大家讲解一下NumPy中的线性关系以及数据修剪压缩的实现,文中的示例代码讲解详细,感兴趣的可以了解一下
大家好,本篇文章主要讲的是Python中的变量,参数和模块介绍,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
内容介绍1中国结的组成部分2设计中国结对象3绘制结体4绘制耳翼5绘制挂耳和流苏6完整代码,一键运行1中国结的组成部分中国结是一种手工编织工艺品,它身上所显示的情致与智慧正是汉族古老文明中
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008