TCP协议详解

2023-05-16

参考博客
在可靠的TCP网络通信中,客户端和服务器端通信建立连接的过程可简单表述为三次握手(建立连接的阶段)和四次挥手(释放连接阶段),下图是这两个阶段的一个完整的表述:
在这里插入图片描述
其状态图可以表示为,
在这里插入图片描述
在TCP连接建立的时候,存在一个如下的有限状态机:

在这里插入图片描述
在状态转化图中,其中客户端的状态转移用带箭头的粗实线表示,服务器端的状态转换用带箭头的粗虚线表示。带箭头的细线表示一些不常见的事件,如复位、同时打开、同时关闭等。关于有限状态图可以参考博客http://blog.csdn.net/lycb_gz/article/details/8515062,里面的细节都将的很清楚;如果要深入理解TCP连接建立和释放的过程就需要结合socket编程里的connect(),socket(),bind(),listen(),send(),close()等函数。

从图中看到,三次握手对应的Berkeley Socket API:connect, listen, accept 3个,connect用在客户端,另外2个用在服务端。对于TCP/IP protocol stack来说,TCP层的tcp_in&tcp_out也参与这个过程。我们这里只讨论这3个应用层的API干了什么事情。

(1) connect()
发送了一个SYN,收到Server的SYN+ACK后,代表连接完成。发送最后一个ACK是protocol stack,tcp_out完成的。
(2)listen()
在server这端,准备了一个未完成的连接队列,保存只收到SYN_C的socket结构;还准备了已完成的连接队列,即保存了收到了最后一个ACK的socket结构。
(3)accept()
应用进程调用accept的时候,就是去检查上面说的已完成的连接队列,如果队列里有连接,就返回这个连接;如果没有,即空的,blocking方试调用,就睡眠等待;客户端调用connect函数之后就发起完成TCP的三次握手,客户端调用connect后,由内核中的TCP协议完成TCP的三次握手,close操作会完成四次挥手。

其中accept发生在三次握手之后。
第一次握手:客户端发送syn包(syn=j)到服务器。
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个ASK包(ask=k)。
第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1)。
三次握手完成后,客户端和服务器就建立了tcp连接。这时可以调用accept函数获得此连接。

我们如何判断有一个建立链接请求或一个关闭链接请求:

  • 建立链接请求:
    1、connect将完成三次握手,accept所监听的fd上,产生读事件,表示有新的链接请求,但此时accept函数并没有调用,在内核中维持了一个完成连接的队列;
  • 关闭链接请求:
    1、close将完成四次挥手,如果有一方关闭sockfd,对方将感知到有读事件,如果read读取数据时,返回0,即读取到0个数据,表示有断开链接请求。(在操作系统中已经这么定义) 关闭链接过程中的TCP状态和SOCKET处理,及可能出现的问题:
  1. TIME_WAIT
    TIME_WAIT 是主动关闭 TCP 连接的那一方出现的状态,系统会在 TIME_WAIT 状态下等待 2MSL(maximum segment lifetime )后才能释放连接(端口)。通常约合 4 分钟以内。TIME_WAIT 状态等待 2MSL 的意义:
    1、确保连接可靠地关闭; 即防止最后一个ACK丢失。
    2、避免产生套接字混淆(同一个端口对应多个套接字)。
    为什么说可以用来避免套接字混淆呢?一方close发送了关闭链接请求,对方的应答迟迟到不了(例如网络原因),导致TIME_WAIT超时,此时这个端口又可用了,我们在这个端口上又建立了另外一个socket链接。 如果此时对方的应答到了,怎么处理呢?其实这个在TCP层已经处理了,由于有TCP序列号,所以内核TCP层,就会将包丢掉,并给对方发包,让对方将sockfd关闭。所以应用层是没有关系的。即我们用socket API编写程序,就不用处理。
    注意:TIME_WAIT是指操作系统的定时器会等2MSL,而主动关闭sockfd的一方,并不会阻塞。(即应用程序在close时,并不会阻塞)。当主动方关闭sockfd后,对方可能不知道这个事件。那么当对方(被动方)写数据,即send时,将会产生错误,即errno为: ECONNRESET。服务器产生大量 TIME_WAIT 的原因:(一般我们不这样开发Server,但是web服务器等这种多客户端的Server,是需要在完成一次请求后,主动关闭连接的,否则可能因为句柄不够用,而造成无法提供服务。)服务器存在大量的主动关闭操作,需关注程序何时会执行主动关闭(如批量清理长期空闲的套接字等操作)。一般我们自己写的服务器进行主动断开连接的不多,除非做了空闲超时之类的管理。(TCP短链接是指,客户端发送请求给服务器,客户端收到服务器端的响应后,关闭链接)。

  2. CLOSE_WAIT
    CLOSE_WAIT 是被动关闭 TCP 连接时产生的,如果收到另一端关闭连接的请求后,本地(Server端)不关闭相应套接字就会导致本地套接字进入这一状态。
    (如果对方关闭了,没有收到关闭链接请求,就是下面的不正常情况)按TCP状态机,我方收到FIN,则由TCP实现发送ACK,因此进入CLOSE_WAIT状态。但如果我方不执行close(),就不能由CLOSE_WAIT迁移到LAST_ACK,则系统中会存在很多CLOSE_WAIT状态的连接。如果存在大量的 CLOSE_WAIT,则说明客户端并发量大,且服务器未能正常感知客户端的退出,也并未及时 close 这些套接字。(如果不及时处理,将会出现没有可用的socket描述符的问题,原因是sockfd耗尽)。
    正常情况下:一方关闭sockfd,另外一方将会有读事件产生, 当recv数据时,如果返回值为0,表示对端已经关闭。此时我们应该调用close,将对应的sockfd也关闭掉。
    不正常情况下:一方关闭sockfd,另外一方并不知道,(比如在close时,自己断网了,对方就收不到发送的数据包)。此时,如果另外一方在对应的sockfd上写send或读recv数据。
    recv时,将会返回0,表示链接已经断开。
    send时, 将会产生错误,errno为ECONNRESET。

3.close()函数和shutdown()函数的区别:

首先我们来看看close()函数的原型:

 头文件:#include <unistd.h> 
定义函数:int close(int fd);

close 一个套接字的默认行为是把套接字标记为已关闭,然后立即返回到调用进程,该套接字描述符不能再由调用进程使用,也就是说它不能再作为read或write的第一个参数,然而TCP将尝试发送已排队等待发送到对端的任何数据,发送完毕后发生的是正常的TCP连接终止序列。在多进程并发服务器中,父子进程共享着套接字,套接字描述符引用计数记录着共享着的进程个数,当父进程或某一子进程close掉套接字时,描述符引用计数会相应的减一,当引用计数仍大于零时,这个close调用就不会引发TCP的四路握手断连过程。如果是主动调用close()则会发起内核TCP协议的四次挥手,断开连接.

再来看看shutdown()函数的原型:

int shutdown(int sockfd,int howto); //返回成功为0,出错为-1.

该函数的行为依赖于howto的值
1.SHUT_RD:值为0,关闭连接的读这一半。
2.SHUT_WR:值为1,关闭连接的写这一半。
3.SHUT_RDWR:值为2,连接的读和写都关闭。

终止网络连接的通用方法是调用close函数。但使用shutdown能更好的控制断连过程(使用第二个参数)。

当调用SHUT_RD的时候,套接字sockfd的读端将会关闭,不能调用接受数据的函数,这对于协议层没有影响。然和当前在sockfd读端的数据缓冲区的数据都会被舍弃掉,进程将不能对该套接字发起读操作,对TCP套接字调用SHUT_RD将会导致协议层将接收到的数据无声的丢掉!!!如果想要继续接受数据都要重置链接;
当调用SHUT_WR的时候,对于tcp套接字来说,这意味着会在所有数据发送出并得到接受端确认后产生一个FIN包。而此时套接字的状态会由ESTABLISHED变成FIN_WAIT_1,然后对方发送一个 ACK包作为回应,套接字又变成FIN_WAIT_2。如果对方也关闭了连接则对方会发出FIN,我方会回应一个ACK并将套接字置为 TIME_WAIT。

4.如何判断socket连接断开:
非阻塞模式,如果暂时没有数据,返回的值也会是<=0的,如果用阻塞模式的话,返回<=0的值是可以认为socket已经无效了。当使用 select()函数测试一个socket是否可读时,如果select()函数返回值为1,且使用recv()函数读取的数据长度为0 时,就说明该socket已经断开。经过代码试验,如果进程受到一些信号时,例如:EINTR,recv()返回值小于等于0时,这是就需要判断 errno是否等于 EINTR , 如果errno == EINTR 则说明recv函数是由于程序接收到信号后返回的,socket连接还是正常的,不应close掉socket连接。如果write,我觉得还有一些情况需要考虑,那就是写的太快的时候,有可能buffer写满了,errno是EAGAIN,可以根据实际需要,如果errno是EAGAIN的话,再写几次。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TCP协议详解 的相关文章

随机推荐

  • struct和class的区别

    总结 xff0c 主要有这么几点不同 xff1a 1 struct 是值类型 xff0c class 是对象类型 2 struct 不能被继承 xff0c class 可以被继承 3 struct 默认的访问权限是public 而class
  • c++中模板类的成员函数的声明与定义应该放在头文件里

    今天尝试自己实现vector数据结构底层 xff0c 在定义vector模板类的时候 xff0c 还想像往常一样把类分为 h文件和 cpp文件 xff0c 把成员函数的声明放在 h文件中 xff0c 把具体实现放在 cpp文件中 xff0c
  • Byte 高位/低位简介绍(大端格式/小端格式)

    一个byte由8个二进制位构成1个字节 即1Byte 61 8Bit 其中左边是高位 xff0c 右边是低位 high four 61 byte amp 0xf0 gt gt 4 0xf0 61 11110000 low four 61 b
  • Python3+Requests库带验证码登陆学校教务系统的尝试。

    毕业快两年了 xff0c 上班空闲摸鱼的时候无意中打开了学校的教务系统 发现浏览器还记着我的学号和登陆密码 果然是很多东西你自己都忘了 xff0c 浏览器的云端都帮你记着 xff0c 输入验证码之后居然登陆进去了 学校的教务系统还是一如既往
  • RK3568开发笔记-socketCan编程

    目录 前言 一 socket can创建 xff1f 二 系统can节点设置 三 can过滤器设置 四 can数据发送 五 can数据接收 总结 前言 CAN是ControllerArea Network xff08 控制器局域网 xff0
  • vs2015基于UDP协议的简单通信例程

    vs2015基于UDP协议的简单通信例程 关键字 xff1a socket套接字 udp通信 注意 xff1a 1 UDP发送和接受数据分别使用sendto 和recvfrom 函数 xff0c 注意函数的用法 xff1b 2 在vs201
  • memcpy与结构体

    前言 最近小学期做通信的实验 xff0c 很有意思 通讯是用了老师统一规定的结构体 xff0c 但是苦于结构体与要传输时字符串数组的转换 xff0c 思索了很久没有结果 启发 在zigbee协议栈已经看到 xff0c 传输结构体时 xff0
  • (一)SAS初识

    1 SAS常用工作窗口 结果 xff08 Result xff09 窗口 管理SAS程序的输出结果 xff1b 日志 xff08 Log xff09 窗口 记录程序的运行情况 xff1b SAS资源管理器 xff08 Explore xff
  • 2021-08-31

    二次规划求解器OOQP的基础使用 前言一 OOQP所包含参数的定义二 简单调用1 头文件2 参数设置3 进行求解4 取出计算结果 总结 前言 OOQP作为一款强大的开源凸优化库 支持C 43 43 Matlab调用 现在这里记录下其简单的使
  • Smart PLC与Wincc通过Simatic NET建立OPC通讯(1)

    有已经组态好的XDB文件可以在我的博客下载中心下载SIMATIC NET通讯 xff0c 下载完成直接导入到Simaticnet软件即可 xff0c 如下图 xff1a 下载链接 xff1a https download csdn net
  • 如何下载西门子PLC的CAD图库

    1 进入西门子下载中心 xff0c 网址如下 xff1a https www automation siemens com bilddb search aspx multipleObjectTypes 61 61 64 63 65 60 2
  • 串联电阻和并联电阻的计算方法

    注 xff1a 并联电路的电阻计算公式 1 R总 61 1 R1 43 1 R2 电阻可以无限数量的串联和并联组合连接在一起形成复杂的电阻电路 在之前的教程中 xff0c 我们学习了如何将各个电阻连接在一起形成一个系列电阻器网络或并联电阻器
  • 西门子V90 PN控制FB284块的个人理解

    FB284块的引脚定义 xff1a 1 MDI xff08 Manual Data Input xff09 称为设定值直接给定运行方式 即上位控制器直接设置目标位置 速度 加减速度后 xff0c 轴自动移动到目标位置的定位方式 MDI也是实
  • 伺服驱动

    1 什么是丝杠的导程 xff1f 伺服电机旋转一圈360度 xff0c 同时带动丝杠旋转360度 导程只是关系到丝杆转一圈 xff0c 丝杆螺母走的距离 如果配有减速机的话 xff0c 会有一个减速比 xff0c 如果减速比为1 12的话
  • 增量式编码器与绝对值编码器的区别

    增量式编码器只能记住自己走了多少步 xff0c 当然会有一个原点 在开机第一次走过原点一千 xff0c 它是不知道自己的位置在什么地方 绝对值编码器只要上电就能知道自己现在所处的位置 xff0c 绝对值编码器需要刻更多的线 xff0c 成本
  • RS422-RS485-RS232标准接线

    1 RS422标准接线 2 RS485标准接线 3 RS485全双工接线
  • C语言中关于合法的数值常量

    1 八进制常量 xff1a 开头必须是0 xff0c 且八进制是0 7之间组成的数 xff0c 例如 xff0c 029就是错误的八进制表示方式 2 十六进制常量 xff1a 0X开头 xff0c 包含字母ABCDEF xff0c 不区分大
  • C中关于“表达式必须是可修改的左值错误”的解决方式

    注意1 xff1a 1 num 10 是字符数组名 xff0c a i num指向字符常量 xff0c 字符数组名是无法修改的 2 所以可以用strcpy字符串复制功能就可以了 3 另外写成s 61 a i 也可以 4 又或者将结构体内ch
  • (二)SAS基本语法

    1 语句 SAS语言的基本单位是语句 xff0c 多条SAS语句构成一个SAS程序 xff08 SAS xff09 xff1b Libname mylib 34 c sasdata 34 语句通常由一个关键词 SAS名称 特殊字符 运算符等
  • TCP协议详解

    参考博客 在可靠的TCP网络通信中 xff0c 客户端和服务器端通信建立连接的过程可简单表述为三次握手 建立连接的阶段 和四次挥手 释放连接阶段 xff0c 下图是这两个阶段的一个完整的表述 xff1a 其状态图可以表示为 xff0c 在T