飞道的博客

访问一个网站会经历哪些流程

462人阅读  评论(0)

在我的专栏《wireshark从入门到精通》中,前面的十几篇文章陆陆续续讲述了wireshark UI以及其自带命令行的使用技巧和方法。学习工具的目的在于使用它来分析问题和学习,本节将通过wireshark分析访问一个网站的时候经历了哪些过程来对本次专栏的初级和中级部分的内容做一次总结。

本 文以访问一个实际的 HTTP 网站为例,讲述在访问一个网页背后所经历哪些过程。通过介绍各层协议是如何共同协作,最终完成网页数据传输,使得读者能够对该过程的理解更加清晰。本文以浏览器访问 URL 为例进行介绍,其实在众多 APP 客户端工作的过程中,也是会访问各自服务器的 URL,从原理上来说和浏览器端的访问基本一致,可自行对应。

本文分析使用到的数据报文,我已经放在这个地方,可自行下载,对应着后续的讲述更加容易的理解整个分析过程。本 文以 www.cctv.com 央视网这样一个 HTTP 网站为例来进行讲述。如果访问像 www.baidu.com 这样一个常见的域名,由于为百度已经采用了全站加密的技术,这样的话会出现一些重定向,比如从 http://www.baidu.com 重定向到 https://www.baidu.com,同时 SSL 层还有一个建立连接的过程,对于网络协议还不是那么熟悉的同学来说可能会显得较为复杂(如果想要了解SSL协议的过程,可以去我的专栏文章《Wireshark分析实际报文理解SSL(TLS)协议》进行查看,也是有讲解的)。因此这里面使用一个没有重定向,基于 HTTP1.1 协议传输的网站会使问题的分析变的更加容易理解,同时目前国内的大多数网站还停留在 HTTP1.1 传输阶段,分析 HTTP1.1 传输也能够兼顾大多数的场景。虽然一些大的互联网企业都是积极的拥抱新技术,采用了 HTTPS,但是也可以看到,政府网站,学校网站,公司网站依然基于 HTTP1.1 传输居多,就总量来说国内80%的流量未加密。

在分析 HTTP1.1 传输的基础上再去尝试分析重定向以及 HTTPS,甚至已经开始应用的 HTTP2 等网站就变得很容易。需要说明的是本文只分析协议层次的访问流


转载:https://blog.csdn.net/javajiawei/article/details/80991929
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场