十一、数据提取操作
- 了解Linux系统中数据提取常用命令
- 结合多个命令,提取目标数据
- 了解正则表达式,使用正则表达式匹配关键词
- 初识Linux三剑客
命令 | 功能 | 命令 | 功能 |
---|---|---|---|
cut | 切分 | grep | 检索 |
sort | 排序 | wc | 统计字符、字数、行数 |
uniq | 去重 | tee | 双向重定向 |
split | 文件切分 | xargs | 参数代换 |
tr | 替换、压缩和删除 |
1.cut:切分
以c字符分割:-d c【直接单个使用会报错】
显示num字段的内容【n-;n-m;-m;m,n】:-f num
字节:-b num
字符:-c num
2.sort:按列排序
忽略大小写:-f
以月份名称排序:-M
根据数值进行排序:-n
反向排序:-r
uniq:-u
检查文件是否有序:-c
分隔字符:指定排序时用的栏位分隔字符:-t
以哪个区间排序:-k
排序栏位,第一栏为0,按顺序优先排序:+
3.wc:统计字符、字数、行数
- 仅列出行号:-l
- 仅列出多少字:-w
- 仅列出多少字符:-m
- 列出多少字节:-c
- 列出最长一行的字符长度:-L
4.uniq:行记录去重
- 忽略大小写字符的不同:-i
- 进行计数:-c
- 只输出无重复的行:-u
5.tee:双向重定向
- tee [-a] file
- append:-a
6.split:文件切分
切分为SIZE bytes大小的文件:-b SIZE
切分为SIZE bytes大小的文件,不断开一行:-C SIZE
以num行为大小切分:-l num
7.xargs:参数代换
- 当xargs读到EOF时停止:-eEOF
- 执行指令前询问:-p
- 每次执行command时需要的参数个数:-n num
8.tr:对标准输入的字符替换、压缩、删除
- tr [-cdst] <字符集> <字符集>
- 取代所有不属于第一字符集的字符:-c
- 删除所有属于第一字符集的字符:-d
- 将连续重复的字符以单独一个字符表示:-s
- 先删除第一个字符集较第二字符集多出的字符:-t
版权声明:本文为Guqing_f原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。