文本三剑客

grep

grep（global regular expression print），适用于查找匹配文本，支持基础正则表达式，扩展的正则表达式需要增加 -E 选项或使用 egrep 命令。

警告

grep [选项…] patterns 文件

获取文件中出现 docs 的次数：

grep -o docs package.json | grep -c docs
# or
grep -o docs package.json | wc -l

sed（stream edit 流编辑器），就类似于 vim，可快速实现对文件的增删改查。区别是 vim 还需要交互操作，而 sed 可以预置一组规则。

警告

sed [选项…] [内置命令] 文件

命令	含义
a	append，表示追加文本。
d	delete，表示匹配行的文本。
i	insert，表示插入文本。
p	print，表示打印匹配行的内容。
s	匹配 regexp 部分内容，使用 replacement 替换 regexp 匹配的内容。

输出 20 - 23 行的内容：

head -23 package.json | tail -3
# or
sed -n '20,23p' package.json

输出 5 - 10 行的内容到新的文件中：

sed -n '5,10w test.txt' package.json
cat test.txt # 验证

awk（Aho、Weingberger、Kernighan 三人姓名）是一种编程语言，适用于处理数据和生成报告，进行更为复杂的处理。可以顺带了解下 cut。

awk 会自动给一行中的每个数据元素分配一个变量，默认情况下：

警告

awk [选项…] pattern{action} 文件

警告

awk 'BEGIN{ commands } pattern{ commands } END{ commands }'

了解其基本使用即可。

输出第一列内容：

sed -n '1,5p' /etc/passwd | awk -F ":" '{print $1}'

使用变量：

echo | awk '{ var1="v1"; var2="v2"; var3="v3"; print var1"="var2"="var3; }'

输出 20 - 23 行的行号及内容：

awk 'NR>19&&NR<24 {print NR,$0}' package.json
# or
awk 'NR=20,NR=21,NR=22,NR=23 {print NR,$0}' package.json