初识re模块和re提取分组数据

案例介绍

import re

# 匹配 2个a
# result = re.findall("a","我是一个abcdeafg")
# print(result)

# result = re.findall(r"\d+", "我今年18岁，我有20000000块")
# print(result)

# 这个是重点，多多练习
# result = re.finditer(r"\d+", "我今年18岁，我有20000000块")
# # print(result)
# for item in result:  # 从迭代器拿到内容
#     print(item.group()) # 从匹配到的结果中拿到数据

# search 只会匹配到第一次匹配的内容
# result = re.search(r"\d+","我叫周某某，今年32岁，我的班级是3年2班")
# print(result.group())

# match,在匹配的时候，是从字符串的开头进行匹配的，类似在正则前面加上了^
# result = re.match(r"\d+","我叫周某某，今年32岁，我的班级是3年2班")
# print(result.group())

#　预加载，提前把正则对象加载完毕
# obj = re.compile(r"\d+")
# # 直接把加载好的正则进行使用
# result = obj.findall("我叫周某某，今年32岁，我的班级是5年2班")
# print(result)

# 想要提取数据必须用小括号括起来，可以单独起名字
# (?P<名字>正则)
# 提取数据的时候,需要group("名字")
s = """
<div class = '西游记'><span id='10010'>中国联通</span></div>
<div class = '西游记'><span id='10086'>中国移动</span></div>
"""
obj = re.compile(r"<span id='(?P<id>\d+)'>(?P<name>.*?)</span>")

# result = obj.findall(s) # 虽然提取出来了，但数据没有顺序可言
result = obj.finditer(s)
for item in result:
    id = item.group("id")
    print(id)

    name = item.group("name")
    print(name)
原文链接：https://blog.csdn.net/weixin_48321071/article/details/122696812