「HTTP」Web页面是如何呈现的?

本周开始进入《图解HTTP》这本书的阅读,让大家更好了解HTTP协议,以及HTTP的前世今生,分11章节,每周更新一章,欢迎大家围观。

「HTTP」Web页面是如何呈现的?

Web页面是如何呈现的?

当我们在网页浏览器的地址栏输入URL地址时,Web页面是如何呈现的呢?

「HTTP」Web页面是如何呈现的?

Web浏览器从地址栏中指定的URL向Web服务器获取文件资源等信息,从而显示出Web页面。

「HTTP」Web页面是如何呈现的?

 

客户端:用于发送请求获取服务器资源的Web浏览器等,都可以称为客户端。

Web使用一种名为HTTP(HyperText Transfer Protocol,超文本传输协议)的协议作为规范,完成从客户端到服务端等一系列运作流程,协议是指规则的约定。Web正是建立在HTTP协议上进行通信的。

HTTP的诞生

欧洲核子研究组织的Tim Berners Lee博士提出了一种能让远隔两地的研究者们共享知识的设想。最初设想的基本理念是: 借助多文档之间相互关联形成的超文本(HyperText),连接可相互参阅的WWW (World Wide Web, 万维网)。

现在已提出了3项www构建技术,分别是把SGML(Standard Generalized Markup Language, 标准通用标记语言)作为页面的文本标记语言的HTML(HyperText Markup Language, 超文本标记语言); 作为文档传递协议的http;指定文档所在地址的url(Uniform Resource Locator, 统一资源定位符)。

www这一名称,是Web浏览器当年用来浏览超文本的客户端应用的名称。现在则用来表示这一系列的集合,也可简称为Web。

「HTTP」Web页面是如何呈现的?

Web的成长时代

  • HTTP/0.9 http于1990年问世。那时的http并没有作为正式的标准被建立。现在的http其实含有http1.0之前版本的意思,因此被称为 http/0.9。
  • HTTP/1.0 http正式作为标准被公布是在1996年的5月,并记载于RFC1945。虽说是初期标准,但该协议标准至今仍被广泛使用在服务器端。
  • HTTP/1.1 1997年1月公布http/1.0,并记载于RFC2068
  • HTTP/2.0 它由互联网工程任务组(IETF)的Hypertext Transfer Protocol Bis(httpbis)工作小组进行开发。该组织于2014年12月将HTTP/2标准提议递交至IESG进行讨论,于2015年2月17日被批准。HTTP/2标准于2015年5月以RFC 7540正式发表。HTTP/2的标准化工作由Chrome、Opera、Firefox、Internet Explorer 11、Safari、Amazon Silk及Edge等浏览器提供支持。多数主流浏览器已经在2015年底支持了该协议。根据W3Techs的数据,截至2019年6月,全球有36.5%的网站支持了HTTP/2。

驻足不前的HTTP

至今被世人广泛使用的 HTTP 协议,仍然是 20 多年前的版本。也就是说,作为 Web 文档传输协议的 HTTP,它的版本几乎没有更新,从另一方面来说,前人的智慧真的牛逼。

网络基础TCP/IP

为了理解 HTTP,我们有必要事先了解一下 TCP/IP 协议族。

互联网中常用的代表性的协议有IP、TCP、HTTP等,LAN中常用协议有IPX、SPX等

“计算机网络体系结构”将这些网络协议进行了系统的归纳;TCP/IP就是这些协议的集合

「HTTP」Web页面是如何呈现的?

其中,还有Novell公司的IPX/SPX、苹果公司的AppleTalk(仅限苹果公司计算机使用)、IBM开发的用于构建大规模网络的SNA以及前DEC公司开发的DECnet等。

简单来说,协议就是计算机之间通过网络实现通信时事先达成的一种“约定”;这种“约定”使那些由不同厂商的设备,不同CPU及不同操作系统组成的计算机之间,只要遵循相同的协议就可以实现通信。

协议可以分很多种,每一种协议都明确界定了它的行为规范:2台计算机之间必须能够支持相同的协议,并且遵循相同的协议进行处理,才能实现相互通信。

「HTTP」Web页面是如何呈现的?

TCP/IP 是互联网相关的各类协议族的总称。

TCP/IP的分层管理

TCP/IP 协议族里重要的一点就是分层。TCP/IP 协议族按层次分别分 为以下 4 层:应用层、传输层、网络层和数据链路层

把 TCP/IP 层次化是有好处的。比如,如果互联网只由一个协议统 筹,某个地方需要改变设计时,就必须把所有部分整体替换掉。而分 层之后只需把变动的层替换掉即可。把各层之间的接口部分规划好每个层次内部的设计就能够自由改动了。

层次化设计也变得相对简单了。处于应用层上的应用可以只考虑分派给自己的任务,而不需要弄清对方在地球上哪 个地方、对方的传输路线是怎样的、是否能确保传输送达等问题。

TCP/IP 协议族各层的作用如下。

「HTTP」Web页面是如何呈现的?

应用层

应用层决定了向用户提供应用服务时通信的活动。

TCP/IP 协议族内预存了各类通用的应用服务。比如,FTP(File Transfer Protocol,文件传输协议)和 DNS(Domain Name System,域 名系统)服务就是其中两类。

HTTP 协议也处于该层。

传输层

传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据 传输。

在传输层有两个性质不同的协议:TCP(Transmission Control Protocol,传输控制协议)和 UDP(User Data Protocol,用户数据报 协议)。

网络层(又名网络互连层)

网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数 据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计 算机,并把数据包传送给对方。

与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所 起的作用就是在众多的选项内选择一条传输路线。

链路层(又名数据链路层,网络接口层)

用来处理连接网络的硬件部分。包括控制操作系统、硬件的设备驱 动、NIC(Network Interface Card,网络适配器,即网卡),及光纤等 物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在 链路层的作用范围之内。

「HTTP」Web页面是如何呈现的?

TCP/IP的通信传输流

「HTTP」Web页面是如何呈现的?

发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该 层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层 时会把对应的首部消去。

这种把数据信息包装起来的做法称为封装(encapsulate)。

与HTTP关系密切的协议

负责传输的IP协议

IP是Internet Protocol(网际互连协议)的缩写,是TCP/IP体系中的网际层协议。设计IP的目的是提高网络的可扩展性:一是解决互联网问题,实现大规模、异构网络的互联互通;二是分割顶层网络应用和底层网络技术之间的耦合关系,以利于两者的独立发展。根据端到端的设计原则,IP只为主机提供一种无连接、不可靠的、尽力而为的数据包传输服务。

可能有人会把“IP”和“IP地址”搞混,“IP”其实是一种协议的名称。

IP 协议的作用是把各种数据包传送给对方。而要保证确实传送到对方 那里,则需要满足各类条件。其中两个重要的条件是 IP 地址和 MAC 地址(Media Access Control Address)。

IP 地址指明了节点被分配到的地址,MAC 地址是指网卡所属的固定 地址。IP 地址可以和 MAC 地址进行配对。IP 地址可变换,但 MAC 地址基本上不会更改。

IP 间的通信依赖 MAC 地址。在网络上,通信的双方在同一局域网 (LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转 才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC 地址来搜索下一个中转目标。这时,会采用 ARP 协议(Address Resolution Protocol)。ARP 是一种用于解析地址的协议,根据通信方 的 IP 地址就可以反查出对应的 MAC 地址。

没有人能够全面掌握互联网中的传输状况 在到达通信目标前的中转过程中,那些计算机和路由器等网络设备只 能获悉很粗略的传输路线。

「HTTP」Web页面是如何呈现的?

确保可靠性的TCP协议

按层次分,TCP 位于传输层,提供可靠的字节流服务。

所谓的字节流服务(Byte Stream Service)是指,为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。而可靠的传输服务是指,能够把数据准确可靠地传给对方。一言以蔽之, TCP 协议为了更容易传送大数据才把数据分割,而且TCP协议能够确认数据最终是否送达到对方。

为了准确无误地将数据送达目标处,TCP 协议采用了三次握手 (three-way handshaking)策略。用 TCP 协议把数据包送出去后,TCP 不会对传送后的情况置之不理,它一定会向对方确认是否成功送达。握手过程中使用了 TCP 的标志(flag) —— SYN(synchronize) 和 ACK(acknowledgement)。

发送端首先发送一个带 SYN 标志的数据包给对方。接收端收到后, 回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。发 送端再回传一个带 ACK 标志的数据包,代表“握手”结束。

若在握手过程中某个阶段莫名中断,TCP 协议会再次以相同的顺序发 送相同的数据包。

「HTTP」Web页面是如何呈现的?

负责域名解析的DNS服务

DNS(Domain Name System)服务是和 HTTP 协议一样位于应用层的 协议。它提供域名到 IP 地址之间的解析服务。

计算机既可以被赋予IP地址,也可以被赋予主机名和域名,用户通常使用主机名和域名来访问对方的计算机,也不是直接以IP地址来访问,因为与IP地址的一串数字比起来,用字母和数字的形式来指定计算机名更符合人类的记忆习惯。

但是要让计算机去理解名称就变得困难很多了,于是DNS服务应运而生。DNS协议提供通过域名查找IP地址,或逆向从IP地址反查域名的服务。

「HTTP」Web页面是如何呈现的?

各种协议与HTTP协议的关系

「HTTP」Web页面是如何呈现的?

URI和URL

URI,统一资源标志符(Uniform Resource Identifier, URI),表示的是web上每一种可用的资源,如 HTML文档、图像、视频片段、程序等都由一个URI进行标识的。

URL是URI的一个子集。它是Uniform Resource Locator的缩写,译为“统一资源定位 符”。

通俗地说,URL是Internet上描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上。

为您推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注