shell统计词频

cat words.txt | cut -d ' ' -f1 | sort | uniq -c | sort -k 1 | awk '{print $2,$1}'

一个文本里面词语通过’ ‘,空格隔开

uniq -c 统计重复的个数

awk '{print $2,$1}' 调换参数的位置

这个适合小数据量的查询,不适合大数据的统计