正则表达式

regex

1.作用定义(definition)

使用‘‘元字符’‘和“普通”字符一起来描述和分析文本的一项工具;它可以添加,分离,叠加,插入和修整各个类型的文本文件。说到底正则表达式就是一项对文本进行处理的表达式。 (检索文本工具:egerp,他是grep的升级版) –2019.7.27初理解

2.元字符

元字符含义
^行的起始位置
$行的末尾
[]或a[ads]b代表:aab,adb,asb
代表范围[0-4]代表:0,1,2,3,4
[^。]排除型字符。。。[^a]排除a以外的任何字符
.占位符匹配一个字符
+匹配至少一个字符
*匹配任意数量字符
此位置是否有字符及匹配0此或者1次
\>单词的结束位置
|
\<匹配单词开头
\b匹配开始或者结束;\B表示反义
\w字母数字下划线,中文字 [a-z0-9A-Z]
\s匹配空白字符、同上
\d匹配数字、同上=[0-9]

特例:

  • ^cat$:以cat开头的并以cat结束的行(只包含cat的行);
  • ^$:空行,没有任何字符