spdk理解

2023-11-08

核跟线程的关系

在理解spdk,特别是spdk线程模型前,需要清楚cpu核跟线程的关系。

首先,关于计算机系统的很多概念,都有“逻辑层” 和 “物理层”的区分,这个是前提。
然后再看,“核心”这个概念是“物理层”的概念,指的就是 CPU硬件的物理核心数量。
而“线程” 这个概念,是“逻辑层”的概念,而且这个“逻辑层”的概念,还要区分是 “CPU逻辑层” 还是 “操作系统OS逻辑层”。
先说 “CPU逻辑层” 的 线程。Intel 在CPU上搞出了HT技术(Hyper Threading),也叫超线程技术。这个技术简单来说,就Intel 把一个CPU核心上,搞出了两个处理的流水线,在使用的时候可以当成两个来用。而他们把这每一个核心分出来的两个流水线,叫做“线程”。这也就是 4核心8线程的意思。从上层逻辑上来看,完全可以把它当作是个8核心的CPU。
再说 “操作系统OS逻辑层”的线程。操作系统把把处理单元称为“进程”,然后在每一个进程里面开辟了粒度更细的“线程”,这个“线程”是运行在某个进程中的处理调度单元,是由操作系统提供的虚拟的概念。因为是虚拟出来的,所以操作系统层面来说,“线程”可以创建很多个,而不局限于CPU层面的那个“8个线程”。

下文中提到的"核"指“物理层的cpu核“;”线程“指”cpu逻辑层的线程“,而非os层的线程。

spdk概述

存储性能开发工具包(即SPDK)提供了一组工具库和线程模型,用于编写高性能、可伸缩的用户态存储应层程序。通过以下技术实现高性能:

  • 用户态。将必需的驱动程序从内核态移到用户态,避免系统调用,同时实现用户态的零拷贝访问。
  • 异步轮询。采用异步轮询,而非依赖中断,减少上下文切换的开销。
  • 免锁。避免IO路径中用加锁的方式来进行线程间的通信,而是依赖于消息传递。
  • run_to_complete。旨在一个线程上做完所有事情。

spdk组件

spdk的主要构件如下图:
在这里插入图片描述

  • 驱动(Drivers)
    NVMe Driver:SPDK的基础组件,这个高优化无锁的驱动有着高扩展性、高效性和高性能的特点。
    Intel QuickData Technology:也称为Intel I/O Acceleration Technology(Inter IOAT,英特尔I/O加速技术),这是一种基于Xeon处理器平台上的copy offload引擎。通过提供用户空间访问,减少了DMA数据移动的阈值,允许对小尺寸I/O或NTB的更好利用。
    NVMe over Fabrics(NVMe-oF)initiator:从程序员的角度来看,本地SPDK NVMe驱动和NVMe-oF启动器共享一套共同的API命令。这意味着,例如本地/远程复制将十分容易实现。

  • Storage Services(存储设备)
    Block device abstration layer(bdev):这种通用的块设备抽象是连接到各种不同设备驱动和块设备的存储协议的粘合剂。并且还在块层中提供灵活的API,用于额外的用户功能,如磁盘阵列、压缩、去冗等等。
    Blobstore:为SPDK实现一个高精简的文件式语义(非POSIX)。这可以为数据库、容器、虚拟机或其他不依赖于大部分POSIX文件系统功能集(比如用户访问控制)的工作负载提供高性能基础。
    Blobstore Block Device:由SPDK Blobstore分配的块设备,是虚拟机或数据库可以与之交互的虚拟设备。这些设备得到SPDK基础架构的优势,意味着零拷贝和令人难以置信的可扩展性。
    Logical Volume:类似于内核软件栈中的逻辑卷管理,SPDK通过Blobstore的支持,同样带来了用户态逻辑卷的支持,包括更高级的按需分配、快照、克隆等功能。
    Ceph RADOS Block Device(RBD):使Ceph成为SPDK的后端设备,比如这可能允许Ceph用作另一个存储层。???
    Linux Asynchrounous I/O(AIO):允许SPDK与内核设备(比如机械硬盘)交互。

  • 存储协议(Storage Protocols)
    iSCSI target:建立了通过以太网的块流量规范,大约是内核LIO效率的两倍。现在的版本默认使用内核TCP/IP协议栈,后期会加入对用户态TCP/IP协议栈的集成。
    NVMe-oF target:实现了NVMe-oF规范。将本地的高速设备通过网络暴露出来,结合SPDK通用块层和高效用户态驱动,实现跨网络环境下的丰富特性和高性能。支持的网络不限于RDMA一种,FC,TCP等作为Fabrics的不同实现,会陆续得到支持。
    vhost target:KVM/QEMU的功能利用了SPDK NVMe驱动,使得访客虚拟机访问存储设备时延迟更低,使得I/O密集型工作负载的整体CPU负载减低,支持不同的设备类型供虚拟机访问,比如SCSI, Block, NVMe块设备。

spdk线程

在SPDK内部,reactor对应了绑定在某个CPU核上的一个线程,每个reactor上会创建多个thread,类似于协程,会不断的被调度。
thread跟io_device通过channel连接。一个thread可有多个channel,一个channel对应一个device,一个channel只能从属于一个thread。
在这里插入图片描述
下图中的“spdk线程”就是上图中的“thread”。Reactor1下的所有spdk线程都跑在物理线程1上。
在这里插入图片描述
为了在spdk线程上执行相应代码,spdk提供了2种机制:msg和poller。msg是一个函数指针和一个上下文指针,可以通过spdk_thread_send_msg发送给指定线程以执行函数。poller有分为定时和非定时,通过spdk_poller_register注册poller给指定线程。
其中Reactor有个轮训函数,就是一个while(1) {},先处理msg,在轮询处理非定时poller,最后轮询处理定时poller。

线程模型实现细节

  • Reactor包含:
    threads,表示该Reactor上的spdk_thread;
    events,这是一个spdk ring,用于事件传递接受;
  • spdk_thread包含:
    channel:用于连接spdk_thread和dev;
    active_pollers: 非定时poller;
    timer_pollers:定时poller;
    messages:这是一个spdk_ring,用于消息传递接受。

Reactor的处理逻辑是这样的:
spdk_app_start
–> spdk_reactor_init
–> spdk_reactor_start
–> spdk_reactor_run
–> spdk_reactor_destroy

其中spdk_reactor_run就是一个while轮询函数。reactor的模型就是:while轮询处理event,处理各个spdk_thread的poller。

static int _spdk_reactor_run(void *arg) {
while (1) {
// 处理reactor上的event消息,消息会在之后讲到
_spdk_event_queue_run_batch(reactor);
// 每一个reactor上注册的thread进行遍历并且处理poller事件
TAILQ_FOREACH_SAFE(lw_thread, &reactor->threads, link, tmp) {
rc = spdk_thread_poll(thread, 0, now)
}
// 检查reactor的状态
if (g_reactor_state != SPDK_REACTOR_STATE_RUNNING) {
break;
}
}

参考文章:
https://www.codenong.com/cs106732499/
https://zhuanlan.zhihu.com/p/551255049
https://www.modb.pro/db/164720

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

spdk理解 的相关文章

随机推荐

  • 软件工程师在职业生涯中说的32句话

    原文地址 http zhangjiankun880 iteye com blog 1625393 这篇文章来自于一篇旧博文 的启发 我已经用现在语言和技术更新了它 1 它在我的电脑上运行得很好 不信的话 你可以过来看 2 你有权限登录 你是
  • 离线数仓流程

    一 数据仓库 1 什么是数据仓库 1 数据仓库是为企业所有决策定制过程 提供所有系统数据支持的战略集合 2 通过对数据仓库中数据的分析 可以帮助企业 改进业务流程 控制成本 提高产品质量等 3 数据仓库 并不是数据的最终目的地 而是为数据最
  • Oracle VirtualBox 6.1.18 安装扩展包

    VirtualBox安装扩展包 下载的Oracle VM VirtualBox Extension Pack包不是 vbox extpack格式的或扩展名的 怎么办 见下文插曲 下载扩展包 扩展名为vbox extpack 关闭虚拟机电脑
  • Linux笔记:文件共享服务Samba基础使用

    文章目录 目的 基础使用 软件包安装 独立服务器 客户端 总结 目的 linux中目前还比较常用的文件共享服务主要就是NFS和Samba 但其实NFS一般也就linux间用用 Samba通常是一个更加好的选择 可以方便的在linux和win
  • 【实用工具】2020版IDEA调试入门(简单实用)

    文章目录 前言 开始调试 调试界面解释 步过 步入和强制步入区别 前言 相信大家在运行 Java 代码的时候难免会有自己设下的 bug 找不出来的时候 那叫一个头发纷飞止不住 头发堪忧啊 所以狗子我去网上看了许多关于 IDEA调式 文章 发
  • Servlet---解决post请求中中文乱码问题、解决后端传输数据给客户端出现乱码问题

    一 解决post请求中中文乱码问题 Override protected void doPost HttpServletRequest req HttpServletResponse resp throws ServletException
  • 「玩物志」来自 Jigsaw 的 Outline

    前段时间 来自谷歌 Google 母公司 Alphabet 旗下的科技孵化器 Jigsaw 开发了一款名为 Outline 的代理软件 我们今天就来体验一下谷歌同门开发的这款应用 看看它有没有给我们带来什么惊喜 关于 Outline 其实
  • 指针复习,注意小的知识点

    include
  • 【嵌入式】——理论基础

    STM32初探 一 计算机组成 1 嵌入式系统 1 1 什么是嵌入式系统 1 2 嵌入式系统组成 2 计算机系统 2 1 冯 诺伊曼结构 普林斯顿结构 2 2 哈佛架构 Harvard Architecture 3 各组件是如何通信的 3
  • 丽升评卷系统显示服务器地址错误,A3_丽升评卷系统评卷员操作方法-副本(2页)-原创力文档...

    PAGE PAGE 2 丽升评卷系统评卷员操作方法 操作方法说明将文字和图片结合 优化了叙述的条理性 尽量做到简洁明了 通俗易懂 即便不经培训 也可以独立动手操作 一 双击桌面上的丽升图标 弹出 用户登录 窗口 输入阅卷服务器IP地址 服务
  • Android手机上剪藏笔记到Obsidian

    前两天 Obsidian 正式发布了 v1 0 0 这两年老苏一直只是把 Obsidian 当一个 Markdown 编辑器在使用 是时候花时间研究怎么用 Obsidian 真正成为一个知识管理工具了 关于 Obsidian 详细的版本更新
  • Gensim word2vec计算多个词之间的相似度

    使用most similar 函数即可 代码如下 from gensim models import Word2Vec word model Word2Vec load wiki word2vec model 导入模型 word model
  • 用awk编写Shell脚本

    一 概述 1 产品概述 awk是一种编程语言 用于在linux unix下对文本和数据进行扫描与处理 数据可以来自标准输入 文件 管道 awk分别代表其作者姓氏的第一个字母 因为它的作者是三个人 分别是Alfred Aho Peter We
  • 吴恩达《机器学习》——线性回归代码实现

    线性回归 1 单变量线性回归 单变量线性回归公式 损失函数 优化算法 批梯度下降 BGD 2 多变量线性回归 特征缩放 标准化 参数的逆缩放 3 线性回归算法代码实现 向量实现 Python代码 4 实验结果 单变量回归 多变量回归 实验总
  • Ubuntu 14.04 64位上配置JDK操作步骤

    1 从 http www oracle com technetwork java javase downloads jdk8 downloads 2133151 html 下载jdk 8u172 linux x64 tar gz 2 解压缩
  • 软件测试期末总复习(知识点+习题+答案)

    目录 1 软件测试基础 1 1软件概述 1 1 1软件的生命周期 1 1 2 软件开发模型 1 1 3 软件质量概述 1 2 软件缺陷管理 1 2 1 软件缺陷产生的原因 1 2 2 软件缺陷的分类 1 2 3 软件缺陷的处理流程 1 3
  • jvm之java类加载机制和类加载器(ClassLoader)的详解

    当程序主动使用某个类时 如果该类还未被加载到内存中 则JVM会通过加载 连接 初始化3个步骤来对该类进行初始化 如果没有意外 JVM将会连续完成3个步骤 所以有时也把这个3个步骤统称为类加载或类初始化 一 类加载过程 1 加载 加载指的是将
  • 无线连接服务器 很慢,无线网很慢是什么原因

    大家好 我是时间财富网智能客服时间君 上述问题将由我为大家进行解答 无线网很慢的原因有 1 连接的网站所在的服务器带宽不足或负载过大 2 网线接触不良或者交换机的硬件原因导致 3 电脑本身存储文件过多等 所谓无线网络 是指无需布线就能实现各
  • 2022年天梯赛比赛真题,L1基础题,C语言,没有算法的那种

    目录 L1 1 今天我要赢 5 分 L1 2 种钻石 5 分 L1 3 谁能进图书馆 10 分 L1 4 拯救外星人 10 分 L1 5 试试手气 15 分 L1 6 斯德哥尔摩火车上的题 15 分 L1 7 机工士姆斯塔迪奥 20 分 L
  • spdk理解

    核跟线程的关系 在理解spdk 特别是spdk线程模型前 需要清楚cpu核跟线程的关系 首先 关于计算机系统的很多概念 都有 逻辑层 和 物理层 的区分 这个是前提 然后再看 核心 这个概念是 物理层 的概念 指的就是 CPU硬件的物理核心