小言_互联网的博客

TCP/IP卷一:80---TCP数据流与窗口管理之(延时确认(延迟ACK)、Nagle算法)

336人阅读  评论(0)

一、延迟确认(延迟ACK)

  • 在许多情况下,TCP并不对每个到来的数据包都返回ACK,利用TCP的累积ACK字段(参见TCP报文格式https://blog.csdn.net/qq_41453285/article/details/104016416)就能实现该功能
  • 累积确认可以允许TCP延迟一段时间发送ACK,以便将ACK和相同方向上需要传的数据结合发送。这种捎带传输的方法经常用于批量数据传输
  •  显然,TCP不能任意时长地延迟ACK;否则对方会误认为数据丢失而出现不必要的重传

不同操作系统对延迟确认的实现

  • 采用延时ACK的方法会减少ACK传输数目,可以一定程度地减轻网络负载。对于批量数据传输通常为2:1的比例。基于不同的主机操作系统,延迟发送ACK的最大时延可以动态配置
  • Linux使用了一种动态调节算法,可以在每个报文段返回一个ACK (称为“快速 确认”模式)与传统延时ACK模式间相互切换
  • Mac OS X中,可以改变系统变量net.inet. tcp.delayed_ack值来设置延时ACK。可选值如下:禁用延时(设为0),始终延时(设为1),每隔一个包回复一个ACK(设为2),自动检测确认时间(设为3)。默认值为3
  • 最新的 Windows版本中,注册表项中,每个接口的全局唯一标识(GUID)都不同(IG表示被引用的特定网络接口的GUID)。TcpAckFrequency值(需要被添加)可以设为0-255,默认为2。它代表延时ACK计时器超时前在传的ACK数目。将其设为1表明对每个收到的报文段都生成相应的ACK。ACK计时器值可以通过TcpDelAckTicks注册表项控制。该值可设为2 - 6,默认为2。它以百毫秒为单位,表明在发送延时ACK前要等待百毫秒数

  • 之前提到过,通常TCP在某些情况下使用延时ACK的方法,但时延不会很长。在后面“TCP拥塞控制”文章中大量采用了延时ACK的方法,我们将会看到TCP怎样在处理批量数据的大数据包传输中实现拥塞控制
  • 小数据包传输中,如交互式应用,需要采用另外的算法。将该算法与延时ACK结合使用,如果处理不好,反而会导致性能降低。下面我们详细讨论该算法

二、Nagle算法

设计Nagle算法的初衷

  • 从前面的小节中可以知道,在ssh连接中,通常单次击键就会引发数据流的传输。如果使用IPv4,一次接键会生成约88字节大小的TCP/IPv4包(使用加密和认证):20字节的IP头部,20字节的TCP头部(假设没有选项),数据部分为48字节。这些小包(称为微型报)会造成相当高的网络传输代价。也就是说,与包的其他部分相比,有效的应用数据所占比例甚微
  • 该问题对于局域网不会有很大影响,因为大部分局域网不存在拥塞,而且这些包无须传输很远。然而对于广域网来说则会加重拥塞,严重影响网络性能
  • John Nagle在[RFCO896]中提出了一种简单有效的解决方法,现在称其为Nagle算法
  • 下面首先介绍该算法是怎样运行的,接着我们会讨论结合延时ACK方法使用时可能出现的一些缺陷和问题

Nagle算法实现原理

  • Nagle算法要求,当一个TCP连接中有在传数据时(即那些已发送但还未经确认的数据),小的报文段(长度小于SMSS)就不能被发送,直到所有的在传数据都收到ACK。并且,在收到ACK后,TCP需要收集这些小数据,将其整合到一个报文段中发送
  • 这种方法迫使TCP遵循“停等规程”——只有等接收到所有在传数据的ACK后才能继续发送
  • 该算法的精妙之处在于它实现了自时钟控制:ACK返回越快,数据传输也越快。在相对高延迟的广域网中,更需要减少微型报的数目,该算法使得单位时间内发送的报文段数目更少。也就是说,RTT控制着发包速率

演示案例

  • 从前前面一篇文章的演示案例中可以看到,单个字节的发送、确认以及回显的RTT较小(15ms以下)。为更快地生成数据,我们需要每秒钟输入60个字符以上。这意味着,当两台主机之间以很小的RTT传输数据时,例如在同一个局域网中,我们将很难看到该算法的显著效果
  • 为了显示Nagle算法的效果,我们比较分析某个TCP应用使用和禁用该算法的行为。 我们对一个ssh版本的客户端做了一定的修改。利用一个RTT相对较大(约190ms)的连接,就可以看出区别
  • 首先观察禁用Nagle算法(ssh默认)的情况,如下图所示:
  • 上图中显示的传输是在初始的认证完成以后、登录会话开始时记录的。这时输入date命令,我们看到共捕获到了19个包,整个传输过程持续了0.58s。共有5个ssh请求包,7个ssh应答包,以及7个TCP层的纯ACK包(不包含数据)

  • 下面我们将在使用Nagle算法的情况下重复探测这一过程(即在相似的网络环境下),如下图所示:
  • 可以看到下图中的包数目要少于上图(少了8个)。另外一个明显的差异是,请求和响应包随时间分布呈一定的规律性。回想一下Nagle算法的原理,它迫使TCP遵循停等行为模式,因此TCP发送端只有在接收到全部ACK后才能继续发送。观察每组请求/响应的传输时刻——0.0、0.19、0.38以及0.57,我们可以发现它们遵循一定的模式:每两个间隔为190ms,恰为连接的RTT。每发送一组请求和响应包需要等待一个RTT,这就加长了整个传 输过程(需要0.80s而非前面的0.58s)

  • Nagle算法做出了一种折中:传输的包数目更少而长度更大,但同时传输时延也更长。从下图中可以更清晰地看出差别
  • 下图显示了Nagle算法的停等行为。左侧显示双向传输,而右侧使用Nagle算法,使得在任一给定时刻,只有一个方向保持传输状态

延迟ACK与Nagle算法结合

  • 若将延时ACK与Nagle算法直接结合使用,得到的效果可能不尽如人意
  • 考虑如下情形,客户端使用延时ACK方法发送一个对服务器的请求,而服务器端的响应数据并不适合在同一个包中传输(见下图)
  • 从图中可以看到:
    • 客户端:在接收到来自服务器端的两个包以后,客户端并不立即发送ACK,而是处于等待状态,希望有数据一同捎带发送。通常情况下,TCP在接收到两个全长的数据包后就应返回一个ACK,但这里并非如此
    • 服务器端:由于使用了Nagle算法,直到收到ACK前都不能发送新数据,因为任一时刻只允许至多一个包在传
    • 因此延时ACK与Nagle算法的结合导致了某种程度的死锁(两端互相等待对方做出行动)。幸运的是,这种死锁并不是永久的,在延时ACK计时器超时后死锁会解除。客户端即使仍然没有要发送的数据也无需再等待,而可以只发送ACK给服务器。然而,在死锁期间整个传输连接处于空闲状态,使性能变差。在某些情况下,如这里的ssh传输,可以禁用Nagle算法

禁用Nagle算法

  • 从前面的例子可以看到,在有些情况下并不适用Nagle算法。典型的包括那些要求时延尽量小的应用,如远程控制中鼠标或接键操作需要及时送达以得到快捷的反馈。另一个例子是多人网络游戏,人物的动作需要及时地传送以确保不影响游戏进程(也不致影响其他玩家的动作)
  • 禁用Nagle算法有多种方式,主机需求RFC列出了相关方法:
    • 若某个应用使用Berkeley套接字API,可以设置TCP_NODELAY选项(见文章:https://blog.csdn.net/qq_41453285/article/details/89541693
    • 另外,也可以在整个系统中禁用该算法。在Windows系统中,使用如下的注册表项:
      • 这个双字节类型的值必须由用户添加,应将其设为1。为使更改生效,消息队列也需要重新设置


转载:https://blog.csdn.net/qq_41453285/article/details/104121538
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场