python爬虫,请求地址中包含中文字符的解决办法

比如
r=requests.get('www.xxx.com/?city=上海')

这时候可能会导致urlerror,之所以说可能,是因为有的网站后台可能有转码机制,特别是大网站,他们会把地址做一次转码。

对于那些没有做转码的站,则需要自己先转码,转成类似于这种:

'%E4%B8%8A%E6%B5%B7'   ‘上海’

这是中文字符的编码格式,16进制表示

所用到的包是

from urllib import parse

代码如下

from urllib import parse
url='www.xxx.com/?city={}'.format(parse.quote('上海'))
r=requests.get(url)

www.xxx.com/?city=%E4%B8%8A%E6%B5%B7






版权声明:本文为cc9200原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。