python正则过滤字符串,只保留数字、字母等

使用正则匹配模块re

# coding = utf-8
import re


num = 'a¥1aB23Cqqq$我.04'
print("原字符串: ", num)
# 字符串只保留中文
num1 = re.sub(u"([^\u4e00-\u9fa5])", "", num)
print("字符串只保留中文: ", num1)
# 字符串只保留英文
num2 = re.sub(u"([^\u0041-\u005a\u0061-\u007a])", "", num)
print("字符串只保留英文: ", num2)
# 字符串只保留数字
num3 = re.sub(u"([^\u0030-\u0039])", "", num)
print("字符串只保留数字: ", num3)
num4 = re.sub("\D", "", num)
print("字符串只保留数字: ", num4)
# 字符串保留数字.和¥
num5 = re.sub(u"([^\u0030-\u0039\u002e\uffe5])", "", num)
print("字符串保留数字.和¥: ", num5)
# 字符串只保留英文和数字
num6 = re.sub(u"([^\u0041-\u005a\u0061-\u007a\u0030-\u0039])", "", num)
print("字符串只保留英文和数字: ", num6)

输出结果如下:

原字符串:  a¥1aB23Cqqq$我.04
字符串只保留中文:  我
字符串只保留英文:  aaBCqqq
字符串只保留数字:  12304
字符串只保留数字:  12304
字符串保留数字.和¥:  ¥123.04
字符串只保留英文和数字:  a1aB23Cqqq04

如果要保留其他字符只需要输入对应的unicode编码即可。


版权声明:本文为BurningSilence原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。