正则表达式

regular expression正则表达式


正则表达式是一个 特殊结构的式子,用来指定(或者说是代表、列举)一类有某种共同特征的字符串。比如:ba, baa, baaa, baaaa, …

正则表达式在很多地方有应用,word,vi,grep,python,xshell等等。比如在编辑器中需要设置某一个字符串高亮,或者是检索,常常会有一个正则表达式的选项可供勾选。

进一步的正则表达式和有限状态自动机(finite state automata)还在NLP自然语言处理中有应用,用以确认输入的字符串是否是机器规定输入语言等等。

正则表达式语法:

patternmatches
[wW]oodchuckwoodchuck,Woodchuck
[0123456789]所有数字
[A-Z]所有大写字母
[a-z]所有小写字母
[0-9]所有数字
[^A-Z]非大写字母
[^Ss]非S或s
[e^]要么是e要么是^
a^b就是字符串a^b
a|b|c=[abc]
your|mineyour,mine
colou?rcolor,colour
oo*h!oh!,ooh!零个或多个前字符
o+h!oh!,ooh! 一个或多个前字符
ba+ba,baa,baaa
beg.nbegin,begun,beg3n 表示任意字符
^ [A-Z]以大写字母开头的字符串
^ [ ^A-Za-z]不以字母开头的字符串
\ .$以.结束的字符串,.是特殊符号需要转义
.$以任意字符结束

版权声明:本文为qq_52065352原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。