六、异步爬取 - 1(概念)
1. 异步加载
异步加载的数据,简单来讲,就是网址不变化,内容变多或变少,动态加载数据,类似有些评论区翻页,百度地图地点的显示,百度图片不停的往下拉等,以下是部分典型的例子:
1. 人民网:http://liuyan.people.com.cn/threads/list?fid=5062&position=1
2. B站评论区:https://www.bilibili.com/video/BV1Mf4y197cj
3. 百度地图:https://map.baidu.com
4. 网易邮箱注册:https://mail.163.com/register/index.htm
5. 百度图片
2. 辅助工具
- Chrome浏览器调试工具
- Postman:网址 https://www.postman.com/downloads/
- JSON在线解析: https://www.sojson.com/
3. 实现原理

4. 部分概念
| 概念 | 简述 |
|---|---|
| AJAX | 通过JavaScript技术和XML异步获取数据的技术 |
| 异步 | url路径不变,部分刷新界面动态加载内容 |
| JavaScript | 一个操作浏览器元素的脚本语言 |
| XML | 可以定义标签的标记语言 |
| JSON | 文本格式,本质是JavaScript对象 |
| python解析json |
5. JSON对象举例
{
"note": [
{"to": "Tove"},
{"from": "Jani"},
{"heading": "Reminder"},
{"body": "Don't forget me this weekend!"}
]
}
6. 异步数据判断
- 判断是否为异步加载
- 找到异步请求的链接并分析规律:参数-规律
- 获取返回的JSON数据并解析:转换-解析
版权声明:本文为qq_45958577原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。