思路:
- 根据输入的关键字,获取想要爬取的百度图片页的url地址
- 为了方便抓取,把瀑布页的展示模式改为翻页式
- 寻找翻页url的规律,获取需要抓取的url地址
- 分析url和html源码,通过正则表达式获取原始图片的url地址
- 通过正则表达式处理将来需要保存的图片名称
- 获取图片数据,并保存为指定名称
# !/usr/bin/python
# Filename: 通过正则表达式爬取瀑布页百度图片.py
# Data : 2020/07/23
# Author : --king--
# ctrl+alt+L自动加空格格式化
import requests
import re
import urllib.parse
import time
版权声明:本文为kingx3原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。