python爬虫翻页功能 循环_Python爬虫实现JS写的翻页

目标网站:http://beijing.chineseoffice.com.cn/Template/office_complete.html

当查看网页源码时,没有各楼信息,实际写在JS里,包括翻页功能。

Chrome的developer tool查看网络包信息:

848f69ffcdcf4852961f00181ffe5edf.jpgfc9e40cfc1db43d481d57c1870429c5e.jpg

上代码:

url = "http://beijing.chineseoffice.com.cn/Building/GetbuildingList"

for i in range(10): #总页数可以从翻页工具条中获得

data = "page=%s" % str(i)

listPage = requests.post(url,data=data) #实现翻页

#以下非本文内容,用json解析获得的页面,取得build的id,拼成详细页link,访问详细页

page = requests.get("http://beijing.chineseoffice.com.cn/Building/GetbuildingList")

detail_page_link = "http://beijing.chineseoffice.com.cn/Template/office_details.html"

page_dic = str(listPage.content.decode())

for build in listPage.json():

print(build['id'], build['officeName'])

build_link = detail_page_link + "?id=" + build['id']

print(build_link)


版权声明:本文为weixin_35900054原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。