Linux中文本差集、并集和交集的求法是什么
Admin 2022-07-26 群英技术资讯 329 次浏览
sort a.txt b.txt | uniq -d
二、并集
a.txt-b.txt:
sort a.txt b.txt b.txt | uniq -u
b.txt - a.txt:
sort b.txt a.txt a.txt | uniq -u
使用sort可以将文件进行排序(sort排序是为了管道交给uniq进行处理,uniq只能处理相邻的行),可以使用sort后面的参数,例如 -n 按照数字格式排序,例如 -i 忽略大小写,例如使用-r 为逆序输出等
uniq为删除文件中重复的行,得到文件中唯一的行,参数-d 表示的是输出出现次数大于1的内容;参数-u表示的是输出出现次数为1的内容;那么对于上述的求交集并集差集的命令做如下的解释:
sort a.txt b.txt | uniq -d:将两个文件进行排序,uniq使得两个文件中的内容为唯一的,使用-d输出两个文件中次数大于1的内容,即是得到交集
sort a.txt b.txt | uniq :将两个文件进行排序,uniq使得两个文件中的内容为唯一的,即可得到两个文件的并集
sort a.txt b.txt b.txt | uniq -u:将两个文件排序,最后输出a.txt b.txt b.txt文件中只出现过一次的内容,因为有两个b.txt所以只会输出只在a.txt出现过一次的内容(b.txt的内容至少出现两次),即是a.txt-b.txt差集;对于b.txt-a.txt同理。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
CentOS服务器下使用Nginx实现Impala负载均衡
在linux中,可以利用cat命令查看支持多少进程,该命令可以连接文件并打印到输出设备中,语法为“cat /proc/sys/kernel/pid_max”;该命令可显示出系统支持的最大进程数量,由于内存等系统资源的限制,结果是一个理论值。
两种解决方法:1、利用getenforce查看selinux的状态并将状态设置为宽松状态。2、利用“head /var/log/messages”查看日志提示,将运行结果的第二行在“/etc/vsftpd/”目录下运行,然后重启vsftpd服务即可。
有时候我们想要恢复删除的文件,那么具体要怎样做呢?下面小编就给大家分享一下linux下恢复删除的文件的方法及步骤,有需要的朋友可以参考,下面我们一起来了解看看。
linux解压命令是什么?linux解压缩命令有很多,例如比较常用的tar命令、gunzip或gzip命令、bzip2或bunzip2命令、rar命令等等,那么具体怎样实现解压缩呢?接下来我们详细了解看看。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008