Python怎么实现数组查找Topk数值及对应索引
Admin 2022-07-25 群英技术资讯 845 次浏览
对于一个python list 或者numpy数组,我需要找到这个list中最大的K个数及其对应的下标。
1. 可以构造字典通过排序解决,不过代码量较多。
2. 使用heapq库,可以直接获取最大值的下标和数值。
import heapq a = [4,2,6,1,9,9] # 获取下标, 输出为[4, 5, 2] heapq.nlargest(3, range(len(a)), a.__getitem__) # 获取数值, 输出为[9, 9, 6] heapq.nlargest(3,a)
如果要取最小的数,使用 nsmallest即可
补充:Python 利用中间值求TopK 算法
首先我们要思考,我要做什么?解决什么问题?
TopK问题,找出一组数据中的前K个最大值或者最小值,这个数据是否重复?要做去重处理?
ok 我们明确我们做什么了 ,那介绍的python处理的topK 算法过程是怎么样的呢?
如果用排序那就没必要引入topK 了,当数据强大的时候选取TopK 可以省略很多排序的计算,至于有多优化自己去思考下,就比如排列组合的C,A的区别,一个是抽取,一个是抽取并排列…
介绍的算法思想是利用中间值,将数列分为三部分 ,
【比中间值大的列表】,中间值,【比中间值小的列表】
那么我们当比较
【比中间值大的列表】的个数 == k
的时候就可以得出前K个最大值了,因此
以列表的第一个数开始为中间值,拆分为三部分
if 【比中间值大的列表】的个数 == k:return 中间值 #程序出口,结束。
if 【比中间值大的列表】的个数 < k :
・・・・・继续在【比中间值小的列表】找
・・・・・K - 【比中间值大的列表】的个数 -1 个数
(为什么要减一,1是前一次的中间值,分的三部分,前部分后部分都没有包含中间值,因此…)
if 【比中间值大的列表】的个数 > k :
…也就是说比中间值大的列表比K还大,那就在这个列表中继续找就行
如果要找最小值,只需要改一下就ok ,还可以设置一个布尔值的输入,来做前K个最大值最小值
#2019 11 04 #author 半斤地瓜烧 #TopK 算法,找出序列中前K个最大值的 #输入一个seq # 输出以seq[0]为中间值 划分的三个部分,中间值,比这个值大的seq ,比这个值小的seq, # 即splitNum,theBig,theSmall def Split_Seq(seq): splitNum = seq[0] seq = seq[1:]#两个部分都不包含中间值,因此切片去除seq[0] theBig = [x for x in seq if x >= splitNum] theSmall = [x for x in seq if x < splitNum] return splitNum,theBig,theSmall #找出中间值 def topKNum(seq,k): splitNum, theBig, theSmall = Split_Seq(seq) theBigLen = len(theBig) if k == theBigLen: return splitNum#出口,返回这个中间值, # 为什么不直接返回thebig?因为存在递归的原因thebig 不是在初始的seq找出来的 #需要重新Split,即可,读者自己思考 # 大值的列表中还未够K个数的情况, if k > theBigLen: return topKNum(theSmall,k-theBigLen-1) # 大值的列表中大于K个数的情况 return topKNum(theBig,k) #由中间值找出TopK个值,<list> def getTopK(seq,k): return [i for i in seq if i > topKNum(seq, k)] if __name__ == '__main__': alist = [7, 3, 5, 1,885,234,2211,222,22, 2, 11, 2, 115] print("===为了验证,引入排序观看===", sorted(alist,reverse= True)) print(getTopK(alist, 3))
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
orjson是一个用于python的快速、正确的json库,它的基准是 json最快的python库,具有全面的单元、集成和互操作性测试,下面这篇文章主要给大家介绍了关于Python中最好用的json库orjson用法的相关资料,需要的朋友可以参考下
这篇文章主要为大家介绍了Python对字典进行排序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
这篇文章主要介绍了python中列表添加的四种方法小结,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
这篇文章主要介绍了pandas实现按行选择的示例代码,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧
这篇文章主要介绍了利用Python实现读取二进制文件,文章尝试使用Python中的内置open函数使用默认读取模式读取zip文件,下文详细介绍,需要的小伙伴可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008