博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
linux删除重复行
阅读量:2354 次
发布时间:2019-05-10

本文共 566 字,大约阅读时间需要 1 分钟。

文本处理时,经常要删除重复行,下面是三种方法

 

第一,用sort+uniq,注意,单纯uniq是不行的。

sort -n test.txt | uniq

 

第二,用sort+awk命令,注意,单纯awk同样不行,原因同上。

sort -n $file | awk '{if($0!=line)print; line=$0}'

 

第三,用sort+sed命令,同样需要sort命令先排序。

sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'

 

Shell脚本

view plainprint?

# !/bin/sh 

 

 

file='test.txt' 

 

sort -n $file | uniq 

 

sort -n $file | awk '{if($0!=line)print; line=$0}' 

 

sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D' 

测试文件:

yanggang@barry$ cat test.txt

aaa

bbbbb

ccccc

123

aaaaa

123

bbb

aaa

执行结果:

yanggang@barry$ ./diffRow.sh

aaa

aaaaa

bbb

bbbbb

ccccc

123

 

摘自 Sunboy_2050的专栏

转载地址:http://hnutb.baihongyu.com/

你可能感兴趣的文章
Squid中文权威指南-第7章 磁盘缓存基础
查看>>
Squid中文权威指南-第8章 高级磁盘缓存主题
查看>>
Squid中文权威指南-第9章 Cache拦截
查看>>
Squid中文权威指南-第10章 与其他Squid会话
查看>>
Squid中文权威指南-第11章 重定向器
查看>>
Squid中文权威指南-第12章 验证辅助器
查看>>
samba配置
查看>>
不要在linux上启用net.ipv4.tcp_tw_recycle参数
查看>>
UML建模——使用EA工具开发时序图实践及经验
查看>>
centos 7源码编译安装qemu-kvm和spice
查看>>
Gobject 学习总结
查看>>
git - 简明指南
查看>>
CentOS 6&7 安装使用多个GCC版本(GCC4.9,GCC5.3,GCC6.2)
查看>>
LD_PRELOAD作用
查看>>
mysql 5.7忘记密码及重新更改目录,无相关文件
查看>>
spice 0.14.0添加新功能
查看>>
ubuntu下安装tcpdump
查看>>
Linux 问题故障定位,看这一篇就够了
查看>>
Linux线程学习总结
查看>>
计算机网络时间同步技术原理介绍
查看>>