飞道的博客

Linux网络与数据封装

269人阅读  评论(0)

欢迎关注博主 Mindtechnist 或加入【Linux C/C++/Python社区】一起探讨和分享Linux C/C++/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。



专栏:《Linux从小白到大神》《网络编程》


1. 网络应用程序的设计模式

(1)C/S架构

client/server架构,即客户端/服务器架构。

  • 优点:协议选用比较灵活;可以缓存数据,比如说我们在打游戏时,在游戏过程中,实际上一些音效、图片都已经缓存下来了,想象一下,如果你玩LOL的时候,音效和动画需要去服务器实时下载,那么游戏会卡成什么样子。
  • 缺点:对用户的安全构成威胁,因为客户端收集了哪些信息,这些信息用于什么工作我们都不知道;客户端开发工作量大,调试困难,需要考虑多线程和数据同步。
  • 典型的C/S架构比如QQ微信,我们在使用QQ或者微信的时候都需要安装一个客户端软件,也就是说,需要安装客户端软件的都是基于C/S架构。

(2)B/S架构

browser/server架构,即浏览器/服务器架构。

  • 优点:跨平台。浏览器不需要我们开发,我们只需要下载一个浏览器即可,并且可以在各个平台通过浏览器访问网站数据(手机、电脑等),那么既然是跨平台访问,在开发的时候就需要考虑跨平台开发语言,比如Java和QT等等,QT提供了统一的接口,只不过在不同平台下封装的API不同,有Windows、Linux等,但是可以通过同样的接口去调用。Java是运行在虚拟机上的,只要在不同平台安装Java虚拟机即可。
  • 缺点:只能使用http或https去实现。比如说,我们在浏览器输入百度的域名http://www.baidu.com,这个域名对应一个IP,浏览器会根据解析出的IP向百度的服务器发送一个http请求。

对于两种架构,并没有好坏之分,它们的应用场景不同。比如说,大型游戏必须要通过客户端来运行,比如我们玩的LOL、DNF、CF都需要下载一个客户端。而小型游戏只要在web服务器运行就可以了,比如4399小游戏等。

2. 协议

协议就是指数据传输和数据解释的规则,典型的协议比如TCP/UDP协议、HTTP协议、FTP协议、IP协议、ARP协议等。

发送数据和接收数据要遵守相同的协议,否则就无法正确解析。同时,发送数据的大小一般不要太大,因为这些数据是存放在栈上的,而栈空间的大小在Linux下默认只有8M。

3. 网络分层模型

① 七层OSI模型

  • 物理层:双绞线、光纤
  • 数据链路层:数据传输、错误检测
  • 网络层:路由转发
  • 传输层:提供端对端的接口
  • 会话层:解除或建立节点之间的联系
  • 表示层:数据格式化、代码转换、数据加密
  • 应用层:文件传输、电子邮件、文件服务、虚拟终端

② TCP/IP四层模型

  • 数据链路层
  • 网络层
  • 传输层
  • 应用层
OSI七层模型 TCP/IP四层模型
应用层 应用层
表示层 应用层 - ftp http ssh telent
会话层 应用层
传输层 传输层 - TCP/UDP协议
网络层 网络层 - IP协议
数据链路层 数据链路层(网络接口层)- 以太网帧协议
物理层 数据链路层

作为程序员主要关注的是应用层协议(其它三层由操作系统完成),我们可以自己去定义一套应用层协议,实际上大公司都有自己的应用层协议。

4. 协议格式——数据包的封装思想

(1)以太网帧格式

以太网帧是在数据链路层传输的数据格式,借助mac地址完成数据报的传递

MAC地址就是网卡编号,我们使用ifconfig就可以看到,硬件地址HWaddr就是MAC地址,这个编号是全世界唯一的,Windows下ipconfig显示的物理地址就是MAC地址(Linux中用:间隔,Windows中用-间隔)

以太网帧发送数据报的前提是知道MAC地址,否则就要通过ARP协议根据对方的IP(对方的IP我们肯定是知道的,不然的话我们怎么给他发数据)去获取对方的MAC地址,我们只需要关注类型,0800表示正常发送数据,0806表示要获取对方的MAC地址,至于报文数据的填充我们不需要知道,这是操作系统完成的(只有应用层协议的封装由用户完成),当我们发送0806类型的数据包,对方会回复一条ARP数据报,我们就可以获得对方的MAC地址(见下面ARP协议示意图)。也就是说,以太网帧是根据MAC地址发送数据的,并不是根据IP地址发送数据,IP地址是用来获取MAC地址的,获取到MAC地址后,再通过MAC地址发送数据。RARP协议就是通过MAC地址获取IP地址的。

ARP数据报的格式(ARP用于根据IP地址获取MAC地址)

ARP协议的工作示意图如下

比如说,我们在北京要向广州的人员发送数据,我们只知道对方的IP不知道MAC地址,那么是如何实现以太网帧发送的呢?首先北京的主机会向广州的主机发送一个ARP协议包,帧类型为0806,以太网源地址和发送端地址都是北京本地主机的MAC地址,发送端IP为北京本地主机的IP,目的IP为要发送到的广州主机的IP地址,以太网目的地址我们不知道就填充FF。广州主机接收到这个数据包之后,会回复一个ARP数据包,类型同样为0806,这其中就包含了广州主机的MAC地址,有了这个MAC地址就可以进行以太网帧的发送了。

(2)IP段数据格式

  • 4位版本:ipv4、ipv6,当前主要是ipv4
  • 8位生存时间(TTL):最多经过多少跳,即路由
  • 32位源IP地址:数据发送端地址
  • 32位目的IP地址:数据接收端地址

需要注意的是,IP协议和IP地址是两个不同的概念,不要混淆。

关于路由:每经过一个路由结点,TTL减一,为了防止无限跳导致垃圾数据包,这个操作是由路由器完成的,当TTL减为0,路由器就不会再转发这个数据包了,而是直接丢弃。假如要从中国通过其他国家,可能通过海底光纤一跳就到达了,所以完全不必担心256跳(2的8次方)不够用,并且路由会选择最短路径。

(3)UDP数据包格式

在UDP数据包中包含一个16位源端口号和一个16位目的端口号,端口号是用来标识进程的,每个进程对应位一一个PID。在网络环境中,IP可以定位网络中的一台主机,而port端口可以定位一台主机中的一个进程,格式一般为IP:Port,比如127.0.0.1:80。端口是16位的,端口最大值为65535(2的16次方减一)。

(4)TCP数据报格式

这里有一个16位的滑动窗口,滑动窗口实际上是代表了存储空间的大小。比如说,A给B发送数据,A发送的速度快,而B处理数据的速度较慢,那么A发送的数据就要先存储起来,B就可以告诉A我的滑动窗口是多大,也就是我能缓存多少数据,A发送的数据就存储在这个缓存中,当缓存区满了后,A就不在发送了。滑动窗口就是做流量控制的,当B的缓存区满了,A就会阻塞,等到B处理了一部分数据后,A再发送数据。

在传输层是不需要封装IP地址的,这是因为传输层的数据包还要经过网络层的包装,而网络层的IP协议中已经封装了IP地址,所以传输层就不需要IP了,传输层主要是封装端口号,端口号用于标识源主机哪个进程传递给目标主机的哪个目标进程。

(5)数据的封装过程

5. TCP/UDP传输层协议简介

(1)TCP协议

面向连接的安全的流式传输协议

  • 连接的时候,自动进行三次握手
  • 数据发送的时候,会进行数据确认,是否收到
  • 数据丢失之后,会进行数据重传

(2)UDP协议

面向无连接的不安全的报式传输

  • 连接的时候不会握手,通过IP和PORT连接
  • 数据发送出去之后就不再管了,即不在乎对方收没收到

实际上,虽然UDP不会校验数据,也就是不安全的,但是实际上我们可以在应用层对数据做校验来实现UDP的安全传输,比如说QQ发消息就是使用的UDP协议,但是它在应用层自己定义了一套协议来保证安全传输,如果传输失败可以再次传输,而QQ密码校验和文件传输则是使用TCP传输。

6. DNS服务器

DNS服务器也叫做域名解析服务器,根据域名解析出IP地址,比如说在浏览器输入一个域名www.baidu.com,该域名将会通过DNS服务器解析得到IP地址。DNS根服务器在全世界总共有13台,其中美国10台,英国、瑞典、日本各有一台。如果其他国家不向中国提供域名解析服务,那么我们就无法上网了,所以中国现在主推IPv6,实现DNS根服务器的多国治理。





转载:https://blog.csdn.net/qq_43471489/article/details/128410980
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场