IO多路复用机制详解

2023-11-17

高性能IO模型浅析

服务器端编程经常需要构造高性能的IO模型，常见的IO模型有四种：

（1）同步阻塞IO（Blocking IO）：即传统的IO模型。

（2）同步非阻塞IO（Non-blocking IO）：默认创建的socket都是阻塞的，非阻塞IO要求socket被设置为NONBLOCK。注意这里所说的NIO并非Java的NIO（New IO）库。

（3）IO多路复用（IO Multiplexing）：即经典的Reactor设计模式，有时也称为异步阻塞IO，Java中的Selector和Linux中的epoll都是这种模型。

（4）异步IO（Asynchronous IO）：即经典的Proactor设计模式，也称为异步非阻塞IO。

同步和异步的概念描述的是用户线程与内核的交互方式：同步是指用户线程发起IO请求后需要等待或者轮询内核IO操作完成后才能继续执行；而异步是指用户线程发起IO请求后仍继续执行，当内核IO操作完成后会通知用户线程，或者调用用户线程注册的回调函数。

阻塞和非阻塞的概念描述的是用户线程调用内核IO操作的方式：阻塞是指IO操作需要彻底完成后才返回到用户空间；而非阻塞是指IO操作被调用后立即返回给用户一个状态值，无需等到IO操作彻底完成。

另外，Richard Stevens 在《Unix 网络编程》卷1中提到的基于信号驱动的IO（Signal Driven IO）模型，由于该模型并不常用，本文不作涉及。接下来，我们详细分析四种常见的IO模型的实现原理。为了方便描述，我们统一使用IO的读操作作为示例。

一、同步阻塞IO

同步阻塞IO模型是最简单的IO模型，用户线程在内核进行IO操作时被阻塞。

图1 同步阻塞IO

如图1所示，用户线程通过系统调用read发起IO读操作，由用户空间转到内核空间。内核等到数据包到达后，然后将接收的数据拷贝到用户空间，完成read操作。

用户线程使用同步阻塞IO模型的伪代码描述为：

{

read(socket, buffer);

process(buffer);

}

即用户需要等待read将socket中的数据读取到buffer后，才继续处理接收的数据。整个IO请求的过程中，用户线程是被阻塞的，这导致用户在发起IO请求时，不能做任何事情，对CPU的资源利用率不够。

二、同步非阻塞IO

同步非阻塞IO是在同步阻塞IO的基础上，将socket设置为NONBLOCK。这样做用户线程可以在发起IO请求后可以立即返回。

图2 同步非阻塞IO

如图2所示，由于socket是非阻塞的方式，因此用户线程发起IO请求时立即返回。但并未读取到任何数据，用户线程需要不断地发起IO请求，直到数据到达后，才真正读取到数据，继续执行。

用户线程使用同步非阻塞IO模型的伪代码描述为：

{

while(read(socket, buffer) != SUCCESS)

;

process(buffer);

}

即用户需要不断地调用read，尝试读取socket中的数据，直到读取成功后，才继续处理接收的数据。整个IO请求的过程中，虽然用户线程每次发起IO请求后可以立即返回，但是为了等到数据，仍需要不断地轮询、重复请求，消耗了大量的CPU的资源。一般很少直接使用这种模型，而是在其他IO模型中使用非阻塞IO这一特性。

三、IO多路复用

IO多路复用模型是建立在内核提供的多路分离函数select基础之上的，使用select函数可以避免同步非阻塞IO模型中轮询等待的问题。

图3 多路分离函数select

如图3所示，用户首先将需要进行IO操作的socket添加到select中，然后阻塞等待select系统调用返回。当数据到达时，socket被激活，select函数返回。用户线程正式发起read请求，读取数据并继续执行。

从流程上来看，使用select函数进行IO请求和同步阻塞模型没有太大的区别，甚至还多了添加监视socket，以及调用select函数的额外操作，效率更差。但是，使用select以后最大的优势是用户可以在一个线程内同时处理多个socket的IO请求。用户可以注册多个socket，然后不断地调用select读取被激活的socket，即可达到在同一个线程内同时处理多个IO请求的目的。而在同步阻塞模型中，必须通过多线程的方式才能达到这个目的。

用户线程使用select函数的伪代码描述为：

{

select(socket);

while(1) {

sockets = select();

for(socket in sockets) {

if(can_read(socket)) {

read(socket, buffer);

process(buffer);

}

其中while循环前将socket添加到select监视中，然后在while内一直调用select获取被激活的socket，一旦socket可读，便调用read函数将socket中的数据读取出来。

然而，使用select函数的优点并不仅限于此。虽然上述方式允许单线程内处理多个IO请求，但是每个IO请求的过程还是阻塞的（在select函数上阻塞），平均时间甚至比同步阻塞IO模型还要长。如果用户线程只注册自己感兴趣的socket或者IO请求，然后去做自己的事情，等到数据到来时再进行处理，则可以提高CPU的利用率。

IO多路复用模型使用了Reactor设计模式实现了这一机制。

图4 Reactor设计模式

如图4所示，EventHandler抽象类表示IO事件处理器，它拥有IO文件句柄Handle（通过get_handle获取），以及对Handle的操作handle_event（读/写等）。继承于EventHandler的子类可以对事件处理器的行为进行定制。Reactor类用于管理EventHandler（注册、删除等），并使用handle_events实现事件循环，不断调用同步事件多路分离器（一般是内核）的多路分离函数select，只要某个文件句柄被激活（可读/写等），select就返回（阻塞），handle_events就会调用与文件句柄关联的事件处理器的handle_event进行相关操作。

图5 IO多路复用

如图5所示，通过Reactor的方式，可以将用户线程轮询IO操作状态的工作统一交给handle_events事件循环进行处理。用户线程注册事件处理器之后可以继续执行做其他的工作（异步），而Reactor线程负责调用内核的select函数检查socket状态。当有socket被激活时，则通知相应的用户线程（或执行用户线程的回调函数），执行handle_event进行数据读取、处理的工作。由于select函数是阻塞的，因此多路IO复用模型也被称为异步阻塞IO模型。注意，这里的所说的阻塞是指select函数执行时线程被阻塞，而不是指socket。一般在使用IO多路复用模型时，socket都是设置为NONBLOCK的，不过这并不会产生影响，因为用户发起IO请求时，数据已经到达了，用户线程一定不会被阻塞。

用户线程使用IO多路复用模型的伪代码描述为：

void UserEventHandler::handle_event() {

if(can_read(socket)) {

read(socket, buffer);

process(buffer);

}

{

Reactor.register(new UserEventHandler(socket));

}

用户需要重写EventHandler的handle_event函数进行读取数据、处理数据的工作，用户线程只需要将自己的EventHandler注册到Reactor即可。Reactor中handle_events事件循环的伪代码大致如下。

Reactor::handle_events() {

while(1) {

sockets = select();

for(socket in sockets) {

get_event_handler(socket).handle_event();

}

事件循环不断地调用select获取被激活的socket，然后根据获取socket对应的EventHandler，执行器handle_event函数即可。

IO多路复用是最常使用的IO模型，但是其异步程度还不够“彻底”，因为它使用了会阻塞线程的select系统调用。因此IO多路复用只能称为异步阻塞IO，而非真正的异步IO。

四、异步IO

“真正”的异步IO需要操作系统更强的支持。在IO多路复用模型中，事件循环将文件句柄的状态事件通知给用户线程，由用户线程自行读取数据、处理数据。而在异步IO模型中，当用户线程收到通知时，数据已经被内核读取完毕，并放在了用户线程指定的缓冲区内，内核在IO完成后通知用户线程直接使用即可。

异步IO模型使用了Proactor设计模式实现了这一机制。

图6 Proactor设计模式

如图6，Proactor模式和Reactor模式在结构上比较相似，不过在用户（Client）使用方式上差别较大。Reactor模式中，用户线程通过向Reactor对象注册感兴趣的事件监听，然后事件触发时调用事件处理函数。而Proactor模式中，用户线程将AsynchronousOperation（读/写等）、Proactor以及操作完成时的CompletionHandler注册到AsynchronousOperationProcessor。AsynchronousOperationProcessor使用Facade模式提供了一组异步操作API（读/写等）供用户使用，当用户线程调用异步API后，便继续执行自己的任务。AsynchronousOperationProcessor 会开启独立的内核线程执行异步操作，实现真正的异步。当异步IO操作完成时，AsynchronousOperationProcessor将用户线程与AsynchronousOperation一起注册的Proactor和CompletionHandler取出，然后将CompletionHandler与IO操作的结果数据一起转发给Proactor，Proactor负责回调每一个异步操作的事件完成处理函数handle_event。虽然Proactor模式中每个异步操作都可以绑定一个Proactor对象，但是一般在操作系统中，Proactor被实现为Singleton模式，以便于集中化分发操作完成事件。

图7 异步IO

如图7所示，异步IO模型中，用户线程直接使用内核提供的异步IO API发起read请求，且发起后立即返回，继续执行用户线程代码。不过此时用户线程已经将调用的AsynchronousOperation和CompletionHandler注册到内核，然后操作系统开启独立的内核线程去处理IO操作。当read请求的数据到达时，由内核负责读取socket中的数据，并写入用户指定的缓冲区中。最后内核将read的数据和用户线程注册的CompletionHandler分发给内部Proactor，Proactor将IO完成的信息通知给用户线程（一般通过调用用户线程注册的完成事件处理函数），完成异步IO。

用户线程使用异步IO模型的伪代码描述为：

void UserCompletionHandler::handle_event(buffer) {

process(buffer);

}

{

aio_read(socket, new UserCompletionHandler);

}

用户需要重写CompletionHandler的handle_event函数进行处理数据的工作，参数buffer表示Proactor已经准备好的数据，用户线程直接调用内核提供的异步IO API，并将重写的CompletionHandler注册即可。

相比于IO多路复用模型，异步IO并不十分常用，不少高性能并发服务程序使用IO多路复用模型+多线程任务处理的架构基本可以满足需求。况且目前操作系统对异步IO的支持并非特别完善，更多的是采用IO多路复用模型模拟异步IO的方式（IO事件触发时不直接通知用户线程，而是将数据读写完毕后放到用户指定的缓冲区中）。Java7之后已经支持了异步IO，感兴趣的读者可以尝试使用。

from：https://blog.csdn.net/sehanlingfeng/article/details/78920423

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux系统编程

IO多路复用机制详解的相关文章

06makefile学习之三个自动变量($@,$^,$＜)，模式规则和静态模式规则

06makefile学习之三个自动变量 lt 和模式规则以下为相关makefile的学习文章 01makefile学习之GCC编译的四个阶段带编译阶段汇编阶段 S c的区别 02makefile学习之makefile的基本原则 03m
10信号学习之signal函数及使用其实现信号捕捉案例

1 signal函数功能该函数注册一个信号捕捉函数对比上一篇的案例和相关函数都是针对于信号集操作的而这个函数是针对处理动作来操作的你可以利用此函数将捕捉到的信号按自己的方式执行例如你可以捕捉段错误的信号后执行打印hello w
xxxx is deprecated

编译工程发现json object object get is deprecated 最终解决 jason c库中有声明 deprecated Please use json object object get ex json c库编译的时
Linux·C++多线程基础知识

目录 1 多线程 1 1 多进程与多线程 1 2 多线程理解 1 3 创建线程 1 4 join与detach方式 1 join举例 2 detach举例 1 5 this thread 2 mutex 2 1 lock与unlock 2
面试官都在问

面试官都在问 Linux命令之gdb 0 简述 GDB GNU symbolic debugger 简单地说就是一个调试工具它是一个受通用公共许可证即GPL保护的自由软件一般来说 GDB主要帮助你完成下面四个方面的功能 1 启动你的程序
Makefile（面试必备）

1 Makefile基本介绍 1 1 makefile介绍 make是一个工程管理器它可以根据文件时间自发检测更新的文件从而减少编译量 makefile文件和make工具一起使用用于控制工程项目的编译和链接也可以用来编写手册页和程序的
进程的相概念（linux系统编程）

什么是程序什么是进程有什么区别程序是静态的概念 gcc xx x o pro 磁盘中生成的pro就是程序进程是程序的一次运行活动通俗的讲就是程序跑起来了系统中就多了一个进程在Linux里面怎么查看系统中有哪些进程使用ps指令
文件IO

文章目录简介 OPEN函数 CREATE函数 CLOSE函数 LSEEK函数 READ函数 WRITE函数简介文件IO 常用五大函数 open read write lseek close 称之为不带缓存的I O 不带缓存指的是每个
面试官都在问

面试官都在问 Linux命令mpstat详解 1 mpstat的基本用法 mpstat的全称为Multiprocessor Statistics 是一款常用的多核CPU性能分析工具用来实时查询每个CPU的性能指标以及所有CPU的平均指标
三、Linux系统编程：进程间的通信（IPC）之消息队列

3 IPC 进程间通信消息队列消息队列 Message queue 是一种进程间通信或同一进程的不同线程间的通信方式软件的贮列用来处理一系列的输入通常是来自用户 3 1 背景管道和套接字比较适合两三个进程之间的通信如果进程成倍增
Linux：死锁与解决方法

死锁死锁指在一组进程中的各个进程均占有不会释放的资源但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态死锁现象现象1 如果执行流加锁完毕后不进行解锁则会造成死锁上篇所述现象2 线程A获取了1锁线程B获取了2
Linux进程的讲解(僵尸进程、孤儿进程)

进程程序就是你编译过后产生的那个文件进程就是打开程序过后产生的 fork vfork exit execl system popen 孤儿进程僵尸进程 wait fork1 getpid getppid区别 pid t getpid
【hello Linux】Linux第一个小程序 - 进度条

目录先来区分两个标识符回车和换行 1 倒计时 2 进度条 Linux 下面来编写Linux系统下的第一个小程序进度条先来区分两个标识符回车和换行 r 和 n r 回车代表回到本行的开头 n 换行代表回到光标的下一行的光标处我
linux系统函数总结（一）

realpath include
Linux·DNS协议、ICMP协议、NAT技术

目录 DNS协议 DNS背景编辑域名简介域名解析过程使用dig工具分析DNS过程 ICMP协议 ICMP功能 ICMP协议格式编辑ping命令一个值得注意的坑 traceroute命令 NAT技术 NAT技术背景 NAT IP转换
linux文件编程（1）—— open、write、read、lseek、阻塞问题(ps文件操作/文件描述符/重定向原理/缓冲区/标准错误)

参考 linux文件编程 1 常用API之open write read lseek 作者丶PURSUING 发布时间 2021 04 08 22 19 28 网址 https blog csdn net weixin 44742824
05LinuxC线程学习之练习循环创建多个子线程和线程传参大坑(可以对比之前循环创建多个子进程)

注 1 之前循环创建多个子进程的文章 https blog csdn net weixin 44517656 article details 109433060 2 wait回收子进程并且获取正常退出的返回值和异常退出的信号值的文章 htt
共享存储映射

存储映射I O 存储映射I O memory mapped I O 使一个磁盘文件与存储空间中的一个缓冲区相映射于是当从缓冲区中获取数据就相当于读文件中的相应字节与此类似将数据存入缓冲区则相应的字节就自动写入文件这样就可在不适
GDB调试的基本使用、GDB调试多进程

1 编译时加选项 g 生成具有调试信息的程序 gcc g test c o test 2 启动GDB 1 启动GDB gdb test 2 设置运行时参数主函数中可接收运行时参数 set args 设置运行时参数如set args 10
【Linux学习笔记】7. Linux文件IO详解（附代码实例）

Linux文件I O 前置知识 Linux文件I O分为系统IO和标准IO 常用于系统编程系统I O通过文件描述符 fd 来操作文件标准I O通过文件流 FILE 来操作文件 Linux下可以使用man命令来查看使用手册学习和使用这些

随机推荐

网络字节序与主机字节序高低位

最近在项目开发过程中需要在采用JAVA作为语言的服务器与采用C 作为语言的服务器间进行通信这就涉及到这两种语言间数据类型的转换以及网络字节序与主机字节序的区别该文主要说说网络字节序和主机字节序的区别以及Little endian与Bi
WTL 界面设计篇（CSkinComboBox）

头文件声明 CSkinComboBox h pragma once include SkinManager h define WM CBO EDIT MOUSE HOVER WM USER 1 define WM CBO EDIT MOUS
74HC595驱动7x11点阵屏（LED-7X11-JHM）DEMO

起因由于我之前做了一个点阵时钟但是无奈LED点阵屏价格比较贵所以想找一个价格较为便宜的点阵来做便宜一点的点阵方案再淘宝上看到有那种五毛钱一个的7x11的LED点阵所以就想着试试搞一下这种点阵屏这个由于是7x11的点阵没有比较好
Java后端项目实现无限极树 - 案例：部门树 - Department实体类

1 domain层
java找不到符号解决办法

一 java找不到符号如果你的代码里没有报错明明是存在的但是java报错找不到符号像下面这样子二解决步骤 1 清除编码工具缓存本人用的idea eclipse清除缓存方式有需要的可以百度一下 2 如果是mavne项目的先cl
编程艺术 - 第一章左旋转字符串

题目定义字符串的左旋转操作把字符串前面的若干个字符移动到字符串的尾部若把字符串abcdef左旋转2位得到字符串cdefab 请实现字符串左旋转的函数要求对长度为n的字符串操作的时间复杂度为O n 空间复杂度为O 1 类似题目还有剑指
【算法】Shell排序--C++源代码（VS2015）

include
tensorflow导入错误“ImportError: DLL load failed”（已解决）

毕业论文需要用到tensorflow 然鹅我却卡在了安装由于各种问题还自身的拖延症与它斗争了一周终于安装成功了我一定要记录下来这血泪史这篇笔记也拖了好几天如果你也遇到下面的问题就继续往下看吧直接 pip install t
Docker网络理解（1）

2017 02 17 我注意到很多大型的企业公司在提供云计算服务的时候必然要对各个不同的租户进行隔离这就和OpenStack一样了需要一个网络拓扑的设计所以前面对网络的理解是很有用的后续对这个隔离应用来说我所知道的就是用OVS
记一次windows下Netty做为压测端引发的错误 No buffer space available (maximum connections reached?): bind

最近写了个客户端压测工具结果每次压到将近5000时就会报错也是搞了两天才发现问题主要是错误表现和网上大多数人的表现一样导致忽略了眼前的错误提示错误表现具体如下 java lang IllegalStateException fail
兔队线段树：楼房重建

https www luogu com cn problem P4198 本质在线段树上每个节点维护信息时再深入到底部加个 log log log O n
Promise,async,await

什么是Promise Promise 简单说就是一个容器里面保存着某个未来才会结束的事件通常是一个异步操作的结果从语法上说 promise是一个对象从它可以获取异步操作的的最终状态成功或失败 Promise是一个构造函数对外提
轨迹相似性度量方法总结

轨迹相似性度量方法总结基于点的度量基于形状的度量基于分段基于特定任务基于点的度量 1 欧氏距离优点线性计算时间缺点轨迹长度要相同 2 DTW 是对时间序列距离测量的改进优点考虑到时间差比欧式距离效果好缺点对噪音比
C++（17）——智能指针初步及弃用auto_ptr的原因

RAII 使用局部对象来管理资源的技术 RAII的原理 RAII的四个步骤裸指针存在的问题 delete后的指针变量就变成了一个失效指针也叫作悬空指针对于下面的代码 void Destroy Object op delete op d
无源波分和彩光模块_甘肃移动2020~2022年无源波分设备及光模块集采结果:迅特、绍兴中科中标...

据CFOL从中国移动招标与采购网上了解上周五甘肃移动公开2020 2022年无源波分设备及光模块集采结果该项目于10月份启动招标历时1个月集采产品分为无源波分设备及光模块两类项目分为标包1及标包2 各标包3家企业中标 2家中标1
android监控view高度变化,Android-获取View宽高的时机

前言最近遇到一个bug 问题描述是这样的启动页需要放置一张广告图要使这张图在不变形的情况下等比例缩放宽度要占满屏幕宽于是手动计算并设置ImageView需要的缩放比例来对图片进行缩放该方法触发的时机引发了一些问题 privat
ReferenceError: XXX is not defined 错误及解决办法

ReferenceError XXX is not defined 错误及解决办法我这里报错是忘记了引入此方法所在的js文件解决办法引入所需的js文件此错误另外一种情况就是 jQuery引入先后顺序不对要先引入jQuery文件
emmc学习

1 介绍 1 1 简介 emmc embedded multi media card eMMC的一个明显优势是在封装中集成了一个控制器它提供标准接口并管理闪存使得手机厂商就能专注于产品开发的其它部分并缩短向市场推出产品的时间这些特点
pikachu之文件下载和文件上传

目录一文件下载 1 复制这个下载文件地址 2 尝试去下载这个down nba php 3 目录扫描工具二文件上传 1 checkclient 1 利用burp suite 2 关闭js 3 修改页面源代码 2 mime类型验证 3
IO多路复用机制详解

高性能IO模型浅析服务器端编程经常需要构造高性能的IO模型常见的IO模型有四种 1 同步阻塞IO Blocking IO 即传统的IO模型 2 同步非阻塞IO Non blocking IO 默认创建的socket都是阻塞的非阻塞IO

IO多路复用机制详解

IO多路复用机制详解 的相关文章

随机推荐

热门标签

IO多路复用机制详解的相关文章