第十一章 Linux数据提取

十一、数据提取操作

  1. 了解Linux系统中数据提取常用命令
  2. 结合多个命令,提取目标数据
  3. 了解正则表达式,使用正则表达式匹配关键词
  4. 初识Linux三剑客
命令功能命令功能
cut切分grep检索
sort排序wc统计字符、字数、行数
uniq去重tee双向重定向
split文件切分xargs参数代换
tr替换、压缩和删除

1.cut:切分

  • 以c字符分割:-d c【直接单个使用会报错】

  • 显示num字段的内容【n-;n-m;-m;m,n】:-f num在这里插入图片描述

  • 字节:-b num

  • 字符:-c num在这里插入图片描述

2.sort:按列排序

在这里插入图片描述在这里插入图片描述

  • 忽略大小写:-f

  • 以月份名称排序:-M

  • 根据数值进行排序:-n

  • 反向排序:-r

  • uniq:-u

  • 检查文件是否有序:-c

  • 分隔字符:指定排序时用的栏位分隔字符:-t

  • 以哪个区间排序:-k在这里插入图片描述

  • 排序栏位,第一栏为0,按顺序优先排序:+

3.wc:统计字符、字数、行数

  • 仅列出行号:-l
  • 仅列出多少字:-w
  • 仅列出多少字符:-m
  • 列出多少字节:-c
  • 列出最长一行的字符长度:-L
  • 在这里插入图片描述

4.uniq:行记录去重

  • 忽略大小写字符的不同:-i
  • 进行计数:-c
  • 只输出无重复的行:-u
  • 在这里插入图片描述

5.tee:双向重定向

  • tee [-a] file
  • append:-a
  • 在这里插入图片描述

6.split:文件切分

  • 切分为SIZE bytes大小的文件:-b SIZE在这里插入图片描述

  • 切分为SIZE bytes大小的文件,不断开一行:-C SIZE在这里插入图片描述

  • 以num行为大小切分:-l num在这里插入图片描述

7.xargs:参数代换

在这里插入图片描述

  • 当xargs读到EOF时停止:-eEOF
  • 执行指令前询问:-p
  • 每次执行command时需要的参数个数:-n num

8.tr:对标准输入的字符替换、压缩、删除

  • tr [-cdst] <字符集> <字符集>
  • 取代所有不属于第一字符集的字符:-c
  • 删除所有属于第一字符集的字符:-d
  • 将连续重复的字符以单独一个字符表示:-s
  • 先删除第一个字符集较第二字符集多出的字符:-t
  • 在这里插入图片描述

版权声明:本文为Guqing_f原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。