pandas字符串映射成数字的方法及代码是什么
Admin 2022-07-26 群英技术资讯 525 次浏览
在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:
test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)
但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:
test_df["xx"] = test_df["xx"].add(15)
效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):
user_id item_id ratings time
0 B001GXRQW0 APV13CM0919JD 1.0 1229644800
1 B001GXRQW0 A3G8U1G1V082SN 5.0 1229472000
2 B001GXRQW0 A11T2Q0EVTUWP 5.0 1229472000
3 B001GXRQW0 A9YKGBH3SV22C 5.0 1229472000
4 B001GXRQW0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 B01H5PPJT4 A2K9WVQW9TLWNK 5.0 1536969600
147190 B01H5PPJT4 A149ALSR6TPGF7 4.0 1536278400
147191 B01H5PPJT4 A2Q066NZCQSCOR 5.0 1535500800
147192 B01H5PPJT4 A1KJLWCW7XBS8I 5.0 1534550400
147193 B01H5PPJT4 ANABUB0FRZXRM 5.0 1534204800
user_id item_id ratings time
0 0 APV13CM0919JD 1.0 1229644800
1 0 A3G8U1G1V082SN 5.0 1229472000
2 0 A11T2Q0EVTUWP 5.0 1229472000
3 0 A9YKGBH3SV22C 5.0 1229472000
4 0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 858 A2K9WVQW9TLWNK 5.0 1536969600
147190 858 A149ALSR6TPGF7 4.0 1536278400
147191 858 A2Q066NZCQSCOR 5.0 1535500800
147192 858 A1KJLWCW7XBS8I 5.0 1534550400
147193 858 ANABUB0FRZXRM 5.0 1534204800
使用map的方法就可以实现把某一列的字符类型的值转换为数字。
class_mapping = {'A':0, 'B':1} data[class] = data[class].map(class_mapping)
首先定义一个字典,然后使用map方法就可以把某一列的字符类型的值转换为数字。
好了,这就是对使用pandas把某一列的字符值转换为数字的认识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要为大家详细介绍了python pygame控制物体移动,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
这篇文章主要为大家介绍了python密码学Vignere密码教程,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
django中时区常见问题有哪些?很多新手在学习django,对于时区的一些问题很容易混淆,对此,这篇文章就主要给大家分享django时区的内容,对新手学习django有一定的借鉴价值,感兴趣的朋友可以参考。
分组统计在很多时候都需要用到,可以实现很多数据库函数的功能。本文主要介绍了python中pandas对多列进行分组统计的实现,感兴趣的可以了解一下
tfrecord是tensorflow中常用的数据打包格式,这篇文章给大家介绍的就是关于tfrecord文件的生成和读取,本文有具体以及步骤,具有的一定的参考价值,需要的朋友可以参考学习。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008