python(网络爬虫),第二部分---对URL的认识

 一:URL举例
 就以下面这个URL为例,介绍下普通URL的各部分组成
 
 http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name
 
 从上面的URL可以看出,一个完整的URL包括以下几部分(如图):
 
 

二:URL通用格式

URL的语法:大多数URL语法都建立在9个部分构成的通用格式上,而其中最重要的是方案(scheme)、主机(host)和路径(path)

通用格式:方案://用户名:密码@主机名:端口/服务器上资源的路径;参数?查询#片段

 三、URL的分类

 URL可以分为绝对URL和相对URL

相对URL中的基础URL:转换相对URL的第一步就是找到基础URL
 
 1、在资源中显式地指定基础URL。比如,HTML文档中可能会包含一个定义了基础URL的HTML标签<base>
 
 2、封装资源的基础URL。在HTML中,基础URL可以从它们所属资源的基础URL中推导出来
原文链接:https://blog.csdn.net/tao546377318/article/details/69325972

 四、URL特殊字符

 该点较为复杂,我不是很懂,想了解的友友们可以转到原博主的网页去浏览:

作者:Ijuan_0712

原文链接:URL详解_tao546377318的博客-CSDN博客

本文是我从另外博主那里学习转发来的,如需看详细的话,可以转到上面链接去看原博主的原文。


版权声明:本文为mao_yangyang原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。