http之半包粘包

2023-05-16

短连接：
连接->传输数据->关闭连接
HTTP是无状态的，浏览器和服务器每进行一次HTTP操作，就建立一次连接，但任务结束就中断连接。
也可以这样说：短连接是指SOCKET连接后发送后接收完数据后马上断开连接。

长连接：
连接->传输数据->保持连接 -> 传输数据-> 。。。 ->关闭连接。
长连接指建立SOCKET连接后不管是否使用都保持连接，但安全性较差。

半包
指接受方没有接受到一个完整的包，只接受了部分，这种情况主要是由于TCP为提高传输效率，将一个包分配的足够大，导致接受方并不能一次接受完。（在长连接和短连接中都会出现）。

粘包
指发送方发送的若干包数据到接收方接收时粘成一包，从接收缓冲区看，后一包数据的头紧接着前一包数据的尾。出现粘包现象的原因是多方面的，它既可能由发送方造成，也可能由接收方造成。发送方引起的粘包是由TCP协议本身造成的，TCP为提高传输效率，发送方往往要收集到足够多的数据后才发送一包数据。若连续几次发送的数据都很少，通常TCP会根据优化算法把这些数据合成一包后一次发送出去，这样接收方就收到了粘包数据。接收方引起的粘包是由于接收方用户进程不及时接收数据，从而导致粘包现象。这是因为接收方先把收到的数据放在系统接收缓冲区，用户进程从该缓冲区取数据，若下一包数据到达时前一包数据尚未被用户进程取走，则下一包数据放到系统接收缓冲区时就接到前一包数据之后，而用户进程根据预先设定的缓冲区大小从系统接收缓冲区取数据，这样就一次取到了多包数据。

什么时候需要考虑半包的情况?
从备注中我们了解到Socket内部默认的收发缓冲区大小大概是8K，但是我们在实际中往往需要考虑效率问题，重新配置了这个值，来达到系统的最佳状态。
一个实际中的例子：用mina作为服务器端，使用的缓存大小为10k，这里使用的是短连接，所有不用考虑粘包的问题。
问题描述：在并发量比较大的情况下，就会出现一次接受并不能完整的获取所有的数据。

什么时候需要考虑粘包的情况?
1.当是短连接的情况下，不用考虑粘包的情况
2.如果发送数据无结构，如文件传输，这样发送方只管发送，接收方只管接收存储就ok，也不用考虑粘包
3.如果双方建立连接，需要在连接后一段时间内发送不同结构数据

下面看个具体事例
假设我们连续调用两次send分别发送两段数据data1和data2,在接收端有以下几种接收情况(当然不止这几种情况,这里只列出了有代表性的情况).
A.先接收到data1,然后接收到data2.
B.先接收到data1的部分数据,然后接收到data1余下的部分以及data2的全部.
C.先接收到了data1的全部数据和data2的部分数据,然后接收到了data2的余下的数据.
D.一次性接收到了data1和data2的全部数据.

对于A这种情况正是我们需要的,不再做讨论.对于B,C,D的情况就是大家经常说的"粘包",同时BC中也有半包的问题,就需要我们把接收到的数据进行拆包,拆成一个个独立的数据包.为了拆包就必须在发送端进行封包.

另:对于UDP来说就不存在拆包的问题,因为UDP是个"数据包"协议,也就是两段数据间是有界限的,在接收端要么接收不到数据要么就是接收一个完整的一段数据,不会少接收也不会多接收.而TCP当中,只有流的概念,没有包的概念.

二.为什么会出现B.C.D的情况.
"粘包"可发生在发送端也可发生在接收端.
1.由Nagle算法造成的发送端的粘包:Nagle算法是一种改善网络传输效率的算法.简单的说,当我们提交一段数据给TCP发送时,TCP并不立刻发送此段数据,而是等待一小段时间,看看在等待期间是否还有要发送的数据,若有则会一次把这两段数据发送出去.这是对Nagle算法一个简单的解释,详细的请看相关书籍.象C和D的情况就有可能是Nagle算法造成的.
2.接收端接收不及时造成的接收端粘包:TCP会把接收到的数据存在自己的缓冲区中,然后通知应用层取数据.当应用层由于某些原因不能及时的把TCP的数据取出来,就会造成TCP缓冲区中存放了几段数据.

针对粘包和半包的解决方案
1.封包：通过包头+包长+包体的协议形式，当服务器端获取到指定的包长时才说明获取完整。
2.指定包的结束标识，这样当我们获取到指定的标识时，说明包获取完整。

封包就是给一段数据加上包头,这样一来数据包就分为包头和包体两部分内容了(以后讲过滤非法包时封包会加入"包尾"内容).包头其实上是个大小固定的结构体,其中有个结构体成员变量表示包体的长度,这是个很重要的变量,其他的结构体成员可根据需要自己定义.根据包头长度固定以及包头中含有包体长度的变量就能正确的拆分出一个完整的数据包.
对于拆包目前我最常用的是以下两种方式.
1.动态缓冲区暂存方式.之所以说缓冲区是动态的是因为当需要缓冲的数据长度超出缓冲区的长度时会增大缓冲区长度.
大概过程描述如下:
A,为每一个连接动态分配一个缓冲区,同时把此缓冲区和SOCKET关联,常用的是通过结构体关联.
B,当接收到数据时首先把此段数据存放在缓冲区中.
C,判断缓存区中的数据长度是否够一个包头的长度,如不够,则不进行拆包操作.
D,根据包头数据解析出里面代表包体长度的变量.
E,判断缓存区中除包头外的数据长度是否够一个包体的长度,如不够,则不进行拆包操作.
F,取出整个数据包.这里的"取"的意思是不光从缓冲区中拷贝出数据包,而且要把此数据包从缓存区中删除掉.删除的办法就是把此包后面的数据移动到缓冲区的起始地址.

这种方法有两个缺点.1.为每个连接动态分配一个缓冲区增大了内存的使用.2.有三个地方需要拷贝数据,一个地方是把数据存放在缓冲区,一个地方是把完整的数据包从缓冲区取出来,一个地方是把数据包从缓冲区中删除.第二种拆包的方法会解决和完善这些缺点.

前面提到过这种方法的缺点.下面给出一个改进办法, 即采用环形缓冲.但是这种改进方法还是不能解决第一个缺点以及第一个数据拷贝,只能解决第三个地方的数据拷贝(这个地方是拷贝数据最多的地方).第2种拆包方式会解决这两个问题.
环形缓冲实现方案是定义两个指针,分别指向有效数据的头和尾.在存放数据和删除数据时只是进行头尾指针的移动.

2.利用底层的缓冲区来进行拆包
由于TCP也维护了一个缓冲区,所以我们完全可以利用TCP的缓冲区来缓存我们的数据,这样一来就不需要为每一个连接分配一个缓冲区了.另一方面我们知道recv或者wsarecv都有一个参数,用来表示我们要接收多长长度的数据.利用这两个条件我们就可以对第一种方法进行优化.
对于阻塞SOCKET来说,我们可以利用一个循环来接收包头长度的数据,然后解析出代表包体长度的那个变量,再用一个循环来接收包体长度的数据.

借鉴于：https://blog.csdn.net/zhangxinrun/article/details/6721495

https://blog.csdn.net/sunmenggmail/article/details/38952131

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

http

http之半包粘包的相关文章

URL 真的可以被视为 HTTP 响应的唯一密钥吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案这个问题既可以看作是实践问题也可以看作是理论问题我正在设计一个涉及 HTTP 客户端 Flash Player 应用程序和 HT
什么时候适合响应 HTTP 412 错误？

我不清楚什么时候应该或不应该返回 HTTP 412 先决条件失败 Web 服务错误我正在考虑在验证数据时使用它例如如果客户端 POST 的 XML 数据并且该数据缺少必需的数据元素则以 412 和错误描述进行响应这是否符合 HTT
请求 http.GET 时发送的 Angular2 OPTIONS 方法[重复]

这个问题在这里已经有答案了我正在尝试添加基本身份验证 https en wikipedia org wiki Basic access authentication Client side到我的 angular2 应用程序 public
Cherrypy 3.2.0：启动引擎在同一实例中运行 HTTP 和 HTTPS

早上好我在 HTTP 或 HTTPS 中成功启动了cherrypy 3 2 0引擎 ssl variable commes input parameters Bellow cherrypy configuration is fully c
Python urllib2.urlopen() 很慢，需要更好的方法来读取多个 url

正如标题所示我正在开发一个用 python 编写的网站它多次调用 urllib2 模块来读取网站然后我用 BeautifulSoup 解析它们由于我必须阅读 5 10 个网站因此页面需要一段时间才能加载我只是想知道是否有办法一次
如何防止 Safari 在遵循同源重定向时删除授权标头？

Safari 似乎放弃了Authorization遵循同源 301 重定向时的标头例如这段JS代码 fetch api endpoint that redirects headers new Headers Authorization s
监控 REST API 的最佳方式是什么？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我创建了一个基于 RESTful 模式的 API 我想知道监视它的最佳方法是什么我可以以某种方式收集每个请求的统计信息以及我可以监控
Gorilla mux，“捕获”响应代码的最佳方式

我所有的路由都使用 Gorilla mux 现在我的应用程序工作正常我想找到一种方法将我的所有响应代码记录到例如 statds 我找到了这个包 https godoc org github com gorilla handlers Lo
将照片上传到 Google Photos API 不返回上传令牌

我正在使用 2018 版 Google Photos API 来上传图像和媒体如下所述上传字节 https developers google com photos library guides upload media uploadi
使用 PHP 的 HTTP PUT、DELETE 和 I/O 流

除了 HTTP PUT 方法之外还有什么方法可以访问通过 HTTP PUT 方法发送的数据 putdata fopen php input r 我从未与PUT and DELETE方法和 putdata fopen php input r
NSURLSession 帖子：uploadTask 和 dataTask 之间的区别

这是我的两个例子 let config NSURLSessionConfiguration defaultSessionConfiguration config HTTPAdditionalHeaders Accept applicatio
浏览器和服务器在实践中是否使用 HTTP 内容协商？

我正在学习关于HTTP内容协商 https developer mozilla org en US docs Web HTTP Content negotiation眼下我已经了解客户端和服务器能够协商所请求内容的表示的基本方式但我不知
网页编码，设置矛盾[重复]

这个问题在这里已经有答案了如果一个网页有但http标头有 Content Type text html charset UTF 8 那么假设什么编码呢在 HTML5 中优先级定义为用户浏览器设置字节顺序标记 HTTP 标头 or
DioError [DioErrorType.RESPONSE]：Http 状态错误 [405]

我正在创建一个post请求使用Dio https pub dev packages dio 这是我的FormData params FormData formData FormData fromMap wallet id dropdownV
如何从 apache 中删除日期标头？

我需要最小化 Apache HTTP 响应标头现在我将它们减少如下 HTTP 1 1 200 OK Date Thu 25 Mar 2010 21 57 41 GMT Server Apache Content Type text htm
video 元素发送多个网络请求

我有一个带有 mp4 源的视频元素
如何设置http请求的源IP？

在发送 http 请求之前我需要设置源 IP 地址用于 IP 欺骗等用于建立http连接的类是HTTPURLConnection 我在 stackoverflow 上找到了下面的链接这非常有用注册和使用自定义 java net U
Ruby 中的参数化 get 请求？

如何创建 HTTPGETRuby 中带参数的请求这很容易做到当你POSTing require net http require uri HTTP post form URI parse http www example com sea
如何在 ASP.NET Core 控制器中接收“multipart/mixed”

旧系统会向我发送以下内容 POST xml HTTP 1 1 Host localhost 9000 User Agent curl 7 64 1 Accept Content Length 321 Content Type multipa
AngularJS 服务 http 成功函数使用错误的“this”范围

a 的成功函数 http put无权访问this内部调用的服务的范围我需要在 PUT 请求的回调中更新服务的属性这是我在服务中尝试做的事情的简化示例 var myApp angular module myApp function rou

随机推荐

ROS实验笔记之——自主搭建四旋翼无人机

最近搭建了一台小的四旋翼无人机 xff0c 本博文记录一下搭建的过程以及一些问题请问我博客就记录了自己做实验的搭建的飞机有什么问题 xff1f xff1f xff1f 目录组装飞行前准备试飞组装首先是一系列的散装原件到最后搭建
ROS实验笔记之——基于l515激光相机的FLVIS与MLMapping

之前博客 ROS实验笔记之 VINS Mono在l515上的实现在l515上实现了vins xff0c 博客 ROS实验笔记之 SLAM无人驾驶初入门配置flvis并跑了对应的kitti数据集本博文在l515上先实现flvis然后再用
Chapter 2. ROS 创建和编译功能包

1 创建ROS功能包使用catkin create pkg命令来创建一个新的catkin程序包首先切换到之前通过创建catkin工作空间教程创建的catkin工作空间中的src目录下 xff1a ros workspace span c
linux ulimit命令用法解析

以下内容转载自 xff1a http www linuxidc com Linux 2012 10 72782 htm Linux对于每个用户 xff0c 系统限制其最大进程数为提高性能 xff0c 可以根据设备资源情况 xff0c 设置
机体坐标系的角速度分量

一角速度分量机体坐标系的三个角速度分量 xff0c 是机体坐标系相对于地面坐标系的转动角速度在机体坐标系各轴上的分量其中 xff1a 角速度 xff50 xff0c 与机体轴 xff58 重合一致 xff1b 角速度 xff51 xf
使用Realsense测试aruco_ros包

01 准备工作安装realsense ros安装aruco ros span class token builtin class name cd span ur ws src span class token function git s
DIY遥控船(一):电调和舵机的驱动[使用STC89C52]

在动力模型中 xff0c 有两样东西是最基本最必要的 xff0c 即舵机和无刷电机舵机提供转动特定角度的功能 xff0c 而无刷电机需要由电调 xff0d xff0d 电子调速器驱动舵机舵机又叫伺服电机 xff0c 可以按照输入的指
GD32VF103之CRC

在GD32VF103内部有一个CRC 循环冗余校验计算单元 xff0c 使用它可以对数据的完整性和正确性进行校验 xff0c 比如固件的完整性和正确性校验通信数据的校验等它使用固定的32位多项式 xff1a 0x4C11DB7 xff1
GD32VF103之GPIO最小配置

longan nano是Sipeed xff08 矽速科技 xff09 推出的开发板 xff0c 使用兆易创新的gd32vf103cbt6芯片 xff0c 该芯片是基于芯来科技的Nuclei Bumblebee处理器的32位通用微控制器 x
Linux控制I2C/SMBus设备

平台 xff1a 树莓派 bcm2835 Raspberry Pi 3 Model B Rev 1 2 I2C是Philips开发的一种两线通信协议 xff0c 常用于一些对速度要求不高的小型器件上 SMBus是系统管理总线 xff0c 基
ArduPilot/APM源码学习笔记（一）

最近开始学习ArduPilot APM飞控的源码 xff0c 源码托管在github上源码链接 xff1a https github com diydrones ardupilot 飞控主页 xff1a http ardupilot co
GRUB2引导修复

本来是想把GRUB2装到U盘 xff0c 却不小心把电脑的GRUB搞坏了原因可能是我执行命令grub install时没有加任何参数 xff0c 由于不知道没有参数怎么执行 xff0c 我赶紧ctrl 43 c终止了安装 xff0c 最后
ardupilot的libraries之PID

在源码的libraries中 xff0c 有两个关于PID的源文件文件夹 xff0c 一个叫AC PID xff0c 另一个是PID AC PID中又细分为AC HELI PID AC P和AC PID xff0c 这里我们只讨论AC PI
stm32串口HAL库的DMA发送问题

本文使用stm32f411ret的串口1的DMA方式发送数据 xff0c 刚开始调试的时候发现串口只能发送一次数据 xff0c 之后就把系统hang住了通过网上搜资料和不断尝试 xff0c 发现问题是中断回调函数没有写的原因使用HAL库
stm32的HAL库i2c从机实现

stm32的i2c默认就是slave模式 xff0c 本文基于HAL库实现中断方式的接收和发送 xff0c 首先是初始化gpio和i2c xff0c 代码如下 xff1a I2C HandleTypeDef I2cHandle void H
openBLT-系统结构及框架

openBLT 系统结构及框架前言1 框架1 1设备层1 2中间件1 2 1 COM1 2 2 BACKDOOR1 2 3 FILE 1 3应用层前言 openBLT 是开源的小型嵌入式系统bootloader xff0c 目前支持ST
磁力计的基本工作原理

http www dzsc com data html 2010 11 29 87454 html ST集成传感器方案实现电子罗盘功能
Ubuntu（ROS+雷达）修改udev/rules/更改ttyUSB 使端口绑定

前提 xff1a 1 Linux xff08 Ubuntu xff09 系统 xff0c 本版本为Ubuntu16 04 2 确定USB口可以使用 xff08 拔插U盘看看有没有弹出文件夹窗口 xff09 参考博客 xff1a https
CAN总线标准帧/扩展帧滤波器设置

在CAN协议里 xff0c 报文的标识符不代表节点的地址 xff0c 而是跟报文的内容相关的因此 xff0c 发送者以广播的形式把报文发送给所有的接收者节点在接收报文时根据标识符 CAN ID 的值决定软件是否需要该报文 xff1b
http之半包粘包

短连接 xff1a 连接 gt 传输数据 gt 关闭连接 HTTP是无状态的 xff0c 浏览器和服务器每进行一次HTTP操作 xff0c 就建立一次连接 xff0c 但任务结束就中断连接也可以这样说 xff1a 短连接是指SOCKET连

http之 半包 粘包

http之 半包 粘包 的相关文章

随机推荐

热门标签

http之半包粘包

http之半包粘包的相关文章