B tree、B- tree、B+ tree、B*tree

2023-10-26

目录

1.B tree(B- tree)

2.B+ tree(B+树)

2.1为什么需要B+树,B+树比B树更好呢?

2.1数据库索引采用B+树的主要原因

3.B*tree(B*树)

4.小结


 

1.B tree(B- tree)

B树( B tree)是一种平衡的多路查找树。2-3树和2-3-4树都是 B树的特例。节点最大的孩子数目称为B树的阶(order),因此,2-3树是3阶B树,2-3-4树是4阶B树。(注:B树就是B-树)

2-3树和2-3-4树可看:https://blog.csdn.net/weixin_42513339/article/details/89016963

一棵m阶的B树具有如下属性:

  1. 如果根节点不是叶节点,则其至少有两颗子树。
  2. 每一个非根节点的分支节点都有k-1个元素和k个孩子,其中[m / 2] (不小于m / 2的最小整数)<= k <= m。每一个叶子节点n都有k - 1个元素。
  3. 所有叶子节点都位于同一个层次
  4. 所有分支节点包含下列信息数据(n,A0,K1,A1,K2,····Kn,An),其中:Ki(i = 1,2,···,n)为关键字,且Ki<Ki+1(i=1,2,3···n);Ai(i=1,2,3···n)为指向子树根节点的指针,且指针Ai-1所指子树中所有节点的关键字均大于Kn,n([m/2]-1<=n<=m-1)为关键字的个数(或n+1为子树的个数)。

 

 例如:(阶数M=3)

       B树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;

B-树的特点:

  1. 关键字集合分布在整颗树中;
  2. 任何一个关键字出现且只出现在一个结点中;
  3. 搜索有可能在非叶子结点结束;
  4. 其搜索性能等价于在关键字全集内做一次二分查找;
  5. 自动层次控制;

       由于限制了除根结点以外的非叶子结点,至少含有M/2个儿子,确保了结点的至少利用率,其最底搜索性能为:

   其中,M为设定的非叶子结点最多子树个数,N为关键字总数;

   所以B-树的性能总是等价于二分查找(与M值无关),也就没有B树平衡的问题;

   由于M/2的限制,在插入结点时,如果结点已满,需要将结点分裂为两个各占M/2的结点;删除结点时,需将两个不足M/2的兄弟结点合并;

 

2.B+ tree(B+树)

一个m阶B+树和m阶B树的区别在于:

  1. 有n棵子树的节点中包含有n个关键字。
  2. 所有叶子节点包含全部关键字的信息,及指向含这些关键字记录的指针,叶子节点本身依关键字的大小自小而大的顺序链接
  3. 所有分支节点可以看成是索引,节点中仅含有其子树中的最大或最小关键字。

B+树可以看下图(从图中能看出叶子节点的链接,而且叶子节点中包含了全部的关键词)。

其中所有的叶子结点中包含了全部关键字的信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接。 (而B 树的叶子节点并没有包括全部需要查找的信息)

另外,所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。 (而B 树的非终节点也包含需要查找的有效信息)

 

2.1为什么需要B+树,B+树比B树更好呢?

可以看下面这个例子:以下是一棵三阶B树,如果我们想要中序遍历,我们需要先到先到磁盘5——磁盘2——磁盘6——磁盘2——磁盘6——。。等等;这导致磁盘的多次访问,IO读写次数增大。

但是对于B+树,所有同一内部结点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了。

而且B+树的叶子节点都是相链的,因此对整棵树的便利只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。(对于B树则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻,所以缓存命中性没有B+树好)

 

2.1数据库索引采用B+树的主要原因

B树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。正是为了解决这个问题,B+树应运而生。B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作(或者说效率太低)。

 

3.B*tree(B*树)

B*树是B+树的变体,在B+树的基础上(所有的叶子结点中包含了全部关键字的信息,及指向含有这些关键字记录的指针),B*树中非根和非叶子结点再增加指向兄弟的指针;B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3(代替B+树的1/2)。给出了一个简单实例,如下图所示:

B+树的分裂:当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针。

B*树的分裂:当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针。

所以,B*树分配新结点的概率比B+树要低,空间使用率更高。
 

 

4.小结

  •  B(B-)树:多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键字范围的子结点;所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;
  • B+树:在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中;
  • B*树:在B+树基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3;

也可以这么看:

  • B树:有序数组+平衡多叉树;
  • B+树:有序数组链表+平衡多叉树;
  • B*树:一棵丰满的B+树。

 

部分转自:https://blog.csdn.net/v_JULY_v/article/details/6530142

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

B tree、B- tree、B+ tree、B*tree 的相关文章

  • VSCode打开多个文件时实现标签栏多行显示

    默认情况下 VSCode的标签栏是滚动式的 当打开多个文件时是在同一行中显示的 想要选择查看某个文件时很不方便 如果想要实现多行显示标签页 也是可以的 具体方法如下 操作步骤 1 安装Custom CSS and JS Loader插件 2
  • 相关子查询和不相关子查询

    相关子查询 比如 select t id t name t pass from student t where 80 lt select f score from f where f id t id and f name xxx 这就是1个
  • AICG,人工智能自动生成内容——根据文本生成图像,视频,音频

    文章目录 1 什么是AICG 2 Text2Video 3 Text2Image 4 Text2Audio 5 AICG的发展趋势 1 什么是AICG 什么是AICG AICG是指人工智能自动生成内容 通过算法模型 将文本转化为图像 音频
  • [原]通过GitHub Pages建立个人站点(详细步骤)

    1 Git简介 2 为什么使用Github Pages 3 创建Github Pages 3 1 安装git工具 3 2 两种pages模式 3 3 创建步骤 3 4 常用命令 4 使用Jekyll搭建博客 4 1 什么是jekyll 4
  • 【微信小程序】wx.login 和 wx.getUserProfile 同时使用问题

    场景 在使用微信登录时 通常会在调用 wx login 获取 code 后再通过 wx getUserProfile 获取 iv 和 encryptedData 加密数据 一起发到后端进行登录验证 但是 在实际使用中如果在 wx login
  • HTML+CSS实现按钮居中

    居中的方式有很多 这里以button为例 它是一个行内块级元素display inline block 所以处理方式很简单 可以用以下两种方式 方式一 div style text align center div
  • 1116. 打印零与奇偶数

    现有函数 printNumber 可以用一个整数参数调用 并输出该整数到控制台 例如 调用 printNumber 7 将会输出 7 到控制台 给你类 ZeroEvenOdd 的一个实例 该类中有三个函数 zero even 和 odd Z
  • 数据库SQL优化大总结之 百万级数据库优化方案

    网上关于SQL优化的教程很多 但是比较杂乱 近日有空整理了一下 写出来跟大家分享一下 其中有错误和不足的地方 还请大家纠正补充 这篇文章我花费了大量的时间查找资料 修改 排版 希望大家阅读之后 感觉好的话推荐给更多的人 让更多的人看到 纠正
  • 【Xilinx Vivado时序分析/约束系列3】FPGA开发时序分析/约束-保持时间

    目录 基本概念 数据结束时间 Data finish time 时钟到达时间 Clock arrival time 保持时间门限 保持时间余量 Hold Slack 往期系列博客 基本概念 数据结束时间 Data finish time 之
  • win10+中标麒麟双系统安装步骤

    win7 10 中标麒麟双系统安装步骤 场景要求 联想启天M415台机出厂预装的是win10 现在要改成win7和中标麒麟7 0双系统 开机在选择系统界面要有两个系统选择 并且默认进入win7 注 先安装win7 再安装中标麒麟 一开始是用
  • MySQL--order by升序与降序、count计数与子查询

    MySQL order by升序与降序 count计数与子查询 1 创建表格 2 题目部分 1 升序与降序 order by 2 count 计数 3 子查询 3 文末彩蛋 轻松一刻 更多关于数据库知识请加关注哟 若需联系和想安装MySQL

随机推荐

  • 打印预览的时候,总是会多于一个空白页,怎么办?

    media print printTest 要打印的区域 display block width 100 height auto overflow hidden 在页面内加入此样式即可
  • PyTorch-01初见

    PyTorch 01初见 同类框架 PyTorch生态 PyTorch能做什么 1 GPU加速 import torch import time print torch version print torch cuda is availab
  • 零基础!搭建好本地的ChatGPT!

    当搭建好本地的GPT 你可以充分利用OpenAI的功能 无需使用任何魔法 并且免去了许多烦恼和难题 通过魔法访问gpt遇到过很多问题吗 以下是你搭建的本地GPT的一些关键特点 功能全面 你的本地GPT能够使用OpenAI的全部功能 让你体验
  • 11 前端模块化

    文章目录 为什么有前端模块化 以前的解决办法 了解CommonJS es6的模块化 export 导出 import 导入 为什么有前端模块化 首先 如果多人合作开发一个项目 你的a js用了一个变量a 你同事的b js也用了一个变量a 那
  • mybatis学习文档

    mybatis 9 28 环境 JDK1 8 mysql 8 0 16 maven3 6 1 IDEA 回顾 JDBC mysql jave基础 Maven junit 1 简介 1 1 什么是mybatis mybatis是支持普通SQL
  • StackExchange.Redis加锁机制实例

    1 redis下载安装 Github下载地址 https github com MicrosoftArchive redis releases 安装过程不做写明 1 VS引用StackExchange Redis 通过 工具 库程序包管理器
  • 软件测试 - sql - 与数据对话的语言

    初识数据库 一 数据库简介 1 1 常见数据库 1 2 数据库模型 1 3 关系型数据库 二 软件的安装与使用 mysql navicat 2 1 安装 2 2 启动关闭mysql服务 2 3 mysql连接navicat 三 数据库基本概
  • clickhouse 数据模型之有序漏斗分析(windowFunnel)

    什么是有序漏斗 有序漏斗需要满足所有用户事件链上的操作都是逡巡时间先后关系的 且漏斗事件不能有断层 触达当前事件层的用户也需要经历前面的事件层 介绍 windowFunnel 搜索滑动时间窗中的事件链 并计算从链中发生的最大事件数 该函数采
  • vs2010 内置了可应用于流的utf8和utf16的编码

    std wifstream is is open T E utf8 txt std ios base binary UTF 8编解码的关健代码 is imbue std locale std locale classic new std c
  • TCP/IP常见面试问题

    TCP IP常见面试问题 1 OSI七层协议以及四层协议 实际使用时只包含四层协议 从上到下依次是 应用层 http 传输层 tcp udp 网络层 ip 网络接口层 以太网协议 2 在网络中具体的传输过程 从上图可见传输的数据每经过一层
  • 【毕业论文】

    博客主页 肩匣与橘 欢迎点赞 收藏 留言 如有错误敬请指正 本文由肩匣与橘编写 首发于CSDN 生活依旧是美好而又温柔的 你也是 基于Unity3D引擎的冒险游戏的设计与实现 前言 摘要 Abstract 1 绪论 1 1 选题背景 1 2
  • rust物品图标_《腐蚀rust》全新XP建造系统图文介绍

    腐蚀rust 全新XP建造系统图文介绍 2016 06 23 15 05 28来源 贴吧编辑 评论 0 腐蚀rust 出了一个新的建造系统 XP建造系统 小编带来相关介绍 一起看一下吧 XP系统在测试服不断的更新完善 现在已经有了比较清晰的
  • 【docker】docker学习(4)——docker-compose常用语法与编写实战

    大家好 我是好学的小师弟 今天和大家分享下docker compose的一些常用语法和编写实战 docker compose是一个二进制文件 我们通常都是通过github把它下载下来 然后给他执行的权限 下载docker compose 在
  • 服务器中激活刚安装好的anaconda

    在服务器安装anaconda的过程中 最后一步是初始化 选择yes 然后在命令行输入conda info envs 发现conda not found 是因为conda环境未激活 此时直接输入source bashrc 即可成功激活环境 一
  • element-ui表格+分页器数据分页展示

  • SpringBoot从0到实战8:简单使用Swagger生成接口开发文档

    初识Swagger Swagger 是一个规范和完整的框架 广泛用于生成 描述 调用和可视化 RESTful 风格的 Web服务 总体目标是使客户端和文件系统作为服务器以相同速度更新 文件的方法 参数和模型紧密集成到服务器端的代码 允许AP
  • 测量学4_距离测量

    测量学 lesson 4 距离测量是确定地面点位时的基本测量工作之一 距离测量的方法有钢尺量距 视距测量和电磁波测距等 距离测量 钢尺量距 利用卷钢尺直接沿地面丈量距离 受地形影响较大 仅用于平坦地区的近距离测量 地面上两点之间距离较远时
  • Windbg+VMware双机调试/1394/串口/常见问题处理+下载符号文件离线包

    目录 1 调试工具VisualDDK 2 Vista以下的版本系统设置 3 Vista以上的版本系统设置 4 1394火线调试 5 使用串口线双机调试 6 调试过程中出现的问题及解决方案 7 快速下载符号文件离线包 1 调试工具Visual
  • SQL IF语句实际应用--返回输出

    SQL IF语句输出 SQL IF语句我们有时会用到用到这个通常是对某个属性进行判断操作 类似我们编程那种三元表达式一样 但有时候业务上不会让你去简简单单去判断操作 还会让你把结果返回过去 通过接口展示出去在前端 你写一个带有if的查询结果
  • B tree、B- tree、B+ tree、B*tree

    目录 1 B tree B tree 2 B tree B 树 2 1为什么需要B 树 B 树比B树更好呢 2 1数据库索引采用B 树的主要原因 3 B tree B 树 4 小结 1 B tree B tree B树 B tree 是一种