正则表达式是什么:
“正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。”
最后一句话很重要,正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式如何用:
检索功能
直接举一个例子吧:给你任意的字符串,用python编写一个程序找出这段字符串是否有两个连续的字母。如果用普通方法的话:
def fd(text):
''' 判断给定的字符串是否
包含两个连续的字母'''
num=len(text)
for i in range(len(text)-1):
if text[i].isalpha():
if text[i+1].isalpha():
return True;
return False
首先编写一个fd()函数用来完成任务,接下来随便给函数传值
print(fd('12ky138'))
结果是
True
如果要是找连续88个字母的呢?我们会发现这样做很麻烦。
所以,我们引入了正则表达式,上面这个问题用上正则表达式怎么解?解法如下:
>>> import re
>>> i=re.compile(r'[a-zA-Z]{2,}')
>>> m=i.search('12ky138').group()
>>> print(m)
ky
这样就轻松解决了。那我们来看看这段代码,首先调用re模块,然后向re.compile()中传入一个字符串,表示正则表达式,然后在search()方法中传入要查找的字符串(如果search()方法找不到匹配的字符串时,将返回None),紧接着调用方法group()返回匹配的结果。
让我们再来看看正则表达式r'[a-zA-Z]{2,}',首先r表示该段字符串是原始字符串,那也就没有转义序列的存在了,[a-zA-Z]的意思代表任意一个大写或小写字母,{2,}的意思是前面的分组至少出现两次,所以正则表达式[a-zA-Z]{2,}可以匹配连续两个字母以上的字符串。
正则表达式有特殊意义的字符:
正则表达式有特殊意义的字符不算多,举两个例子:
*代表匹配前面分组0次或多次+代表匹配前面分组至少一次
*上面只是其中的一部分,网上有很多关于正则表达式符号的表格介绍*
替换功能
来看一段代码:
>>> import re
>>> i=re.compile(r'Tom')
>>> i.sub('Jerry','I love Tom')
'I love Jerry'
上面有一个新的方法sub(),他的第一个参数用来取代被正则表达式匹配的字符串,第二个参数是正则表达式要匹配的字符串。sub()方法返回替代后的字符串。
以上就是正则表达式的基本用法了,还有更多玩法还需要你们探索。
版权声明:本文为qq_53254126原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。