Linux 命令【3】:xargs

一、为什么需要xargs


xargs 是 execute arguments 的缩写,它的作用是从标准输入中读取内容,并将此内容传递给它要协助的命令,并作为那个命令的参数来执行。

二、xargs 与管道


cat 命令可以接收文件名作为参数,执行后会显示出文件的内容。但是 cat 命令不能直接从标准输入接收参数,正如下面的例子:

#cat后面直接指定china.txt参数, 可以展示china.txt文件的内容
[roc@roclinux ~]$ cat china.txt
hello beijing
 
#我们尝试通过标准输入把参数传给cat, 结果却只是显示了文件名而已
[roc@roclinux ~]$ echo china.txt | cat
china.txt

从上面的例子中,我们可以得出下面的结论:

  • 管道可以实现:将前面的标准输出作为后面的“标准输入”。
  • 管道无法实现:将前面的标准输出作为后面的“命令参数”。

xargs 所擅长的正是“将标准输入作为其指定命令的参数”。

[roc@roclinux ~]$ echo china.txt | xargs cat
hello beijing

我们知道,xargs 会将前一个命令的标准输出转换成命令参数,但很多人可能不知道的是,xargs 的标准输入中出现的“换行符、空格、制表符”都将被空格取代。下面来看一个带有换行符的例子:

- 我们准备好了带有换行的标准输入
[roc@roclinux ~]$ echo -e "china.txt\njapan.txt"
china.txt
japan.txt
 
- 可见, 换行符和空格的作用一样
[roc@roclinux ~]$ echo -e "china.txt\njapan.txt" | xargs cat
hello beijing
hello tokyo

上面的例子是一个比较简单的场景,我们有时还会遇到更棘手的情况,一起来看一看。

当命令参数中包含了空格时,情况就会复杂很多,一起来看一个示例。

- 我们创建了3个日志文件, 且故意让文件名称中都含有空格
[roc@roclinux ~]$ for((i=0;i<3;i++)); do touch "test ${i}.log";done
 
- 我们列出创建的文件
[roc@roclinux ~]$ ls -1F
test 0.log
test 1.log
test 2.log
 
- 我们来运行xargs命令, 发现报错了
[roc@roclinux ~]$  find . -name '*.log' -print | xargs rm
rm: cannot remove ‘./test’: No such file or directory
rm: cannot remove ‘1.log’: No such file or directory
rm: cannot remove ‘./test’: No such file or directory
rm: cannot remove ‘0.log’: No such file or directory
rm: cannot remove ‘./test’: No such file or directory
rm: cannot remove ‘2.log’: No such file or directory

我们在当前目录中创建了 3 个文件,文件名中间都含有空格。但当 find 命令获取到的文件名经过 xargs 传送给 rm 命令时,文件“./test 1.log”就变成了“./test”和“1.log”两个文件了。即原本 3 个文件名刹那间就变成了 6 个文件名,而这 6 个文件其实并不存在,从而引发了错误。

这个错误的根源就在于 xargs 默认的分隔符是空格,如果我们能将 xargs 的分隔符改成其他符号,问题就迎刃而解了!

xargs 提供了-0选项,允许将 NULL 作为分隔符,而 find 命令也心有灵犀地提供了对应的选项来产生以 NULL 字符作为分隔符的输出。

find 命令提供的对应方法是 -print0 选项,在文件名之后输出 NULL,而不像 -print 选项那样输出换行符(换行符会被 xargs 替换成空格)。

正如我们所期待的,命令果然正常执行了,完美!

[roc@roclinux ~]$ find . -name '*.log' -print0 | xargs -0 rm -f

对了,要补充一点,xargs 的-0选项不仅可以将分隔符从默认的空格变成 NULL,还会将单引号、双引号、反斜线等统统默认为是普通字符。所以说,-0选项特别适合处理命令参数中含有引号、空格、反斜线的情况。

如果你是一位 GEEK,希望掌握得更深入,那么我们就再补充一个知识点。除了可以使用-0选项外,其实还可以使用-d选项来指定任何一个符号作为分隔符。只是我们要格外慎重,避免我们所设定的那个分隔符恰好是我们命令参数中所包含的字符,那就会导致非预期的结果了。

三、验证


如果在前一个命令的标准输出中,会有一些参数是你不希望或者不确定是否要传送给后面命令的,这个时候我们就希望 xargs 在传送参数前和我们确认一下。而-p选项恰好可以实现这个愿望,我们可以输入 y 或者 n 来选择是否要执行当前命令:

[roc@roclinux ~]$ find . -type f |xargs -p rm -f
rm -f ./china.txt ./usa.txt ./japan.txt ?...n

上面的命令中,我们输入了“n”,也就是不希望删除这三个文件。不过,这样的确认粒度太粗,我们希望的是更精细地确认,来试试-n选项吧:

[roc@roclinux 20160408]$ find . -type f |xargs -p -n 1 rm -f
rm -f ./china.txt ?...n
rm -f ./usa.txt ?...y
rm -f ./japan.txt ?...n

使用-n选项,可以让 xargs 每次只处理 1 个参数,这样做的好处是避免一次性删除过多文件,万一误删了不该删除的文件,那麻烦就大了。


版权声明:本文为focus_lyh原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。