C++学习第八篇——字典树

2023-11-14

学习了之前的树状结构，接下来就可以利用树状结构存储数据了。
首先什么是字典树？
字典树就是利用树的结构按照字典的原理进行存储的数据结构，树的结构我们了解了，字典是什么样的呢，我们通常去查英文单词的时候，往往都是英文字母a,b,c,d…x,y,z这样一个顺序，利用这样的原理我们知道有字典序这样的顺序。字典树也是如此，例如有两个单词application，apple，我们查字典时通常是按a->p->p->l->接着下去，然后先发现了apple，再发现了application，我们会发现这些有着相同前缀的单词查询时进行的方式是相同的，为了减少内存的使用，而且便于查找，它的优点很明显，有相同前缀的单词前缀部分只用存储一次。

这里给出字典树最常用的模板，当然不同的题目需要不同的删改变动灵活运用，需要注意的一点就是，我们知道一个树结构的分枝越多和深度越深，那么递归调用起来很可能爆栈，所以要适时进行改动，另外有些内存优化过的编译器更容易出现这样的情况。

和之前一样利用注释和代码结合，先给大家清晰直观的图示，了解一下。
在这里插入图片描述
insert函数过程：首先apple单词插入，char *s指向a字符，for循环遍历，遍历至root里next数组a结点时，也就是下标为0的数组值。它还是NULL，那么新建，将值赋进去，同理延伸至apple完成，e点时该单词结束标记此时的e结点为单词，isword=true。当application单词插入时，之前的appl都是已经建立好的了，只用在原来的基础上将prefix++即可，那么新的分枝出现了，也就是appli，与apple同理继续延伸下去。

struct node//树结构
{
	char *s;//字符指针存储当前结点字符
	int prefix;//出现多少以当前字符串为前缀的字符串，后面会进行深入解释
	bool isword;//截止当前，该字符串是否为单词
	node *next[26];//26个字母，从a的下标为0开始
	node()//初始化函数，相当于构造函数初始化数据
	{
		s = NULL;//当前结点为空
		prefix = 0;//0个单词以此段为前缀
		isword = false;//不是单词
		memset(next,0,sizeof(next));
	}
}*root;
void insert(node *root,char *s)//插入函数
{
	node *p = root;//将p赋值为我当前插入的结点
	for(int i=0;s[i];i++)//遍历单词
	{
		int x = s[i] - 'a';//将单词顺序转化为下标存储
		p->s=s+i;//p结点存储的字符指向char * s的第i位字，char * 结构需要通过调用指针+-来获取字符指针
		if(p->next[x] == NULL)//很明显，如果没有指向下一个的就新建一个
			p->next[x] = new node;
		p = p->next[x];//接着p就会指向它，也就是指针向下一个字母前进
		p->prefix++; //出现次数+1
	}
	p->isword=true;//遍历的最后，末尾p即为单词的结尾，所以它是一个完整的单词
}
bool del(node *root,char *s)//删除函数，这个函数通常很少使用,删除某个单词原理与插入相同
{
	node *p = root;
	for(int i=0;s[i];i++)
	{
		int x = s[i]-'a';
		if(p->next[x]==NULL)
			return false;
		p = p->next[x];
	}
	if(p->isword)
		p->isword=false;
	else return false;
	return true;
}
bool search(node *root,char *s)//查找单词
{
	node *p=root;
	for(int i=0;s[i];i++)
	{
		int x=s[i]-'a';
		if(p->next[x]==NULL)//和insert中相同，只需要向下找到所需分枝即可，如果不存在，则说明不含有该单词返回false即可
			return false;
		p = p->next[x];
	}
	return p->isword;//如果到了末尾，返回当前分枝是否为单词，例如appl就不是一个单词，但是可以访问到达，返回appl的l结点的isword即可
}
int count(node *root,char *s)//记录以当前字符串为前缀的单词个数
{
	node *p= root;
	for(int i=0;s[i];i++)
	{
		int x=s[i]-'a';
		if(p->next[x]==NULL)
			return 0;
		p = p->next[x];
	}//遍历找到当前字符串的最后一个分枝返回出现次数即可，也就是prefix的值
	return p->prefix;
}
char word[11];//单词长度，利用char 数组存储
char pre[11];
int main() 
{
	root = new node;
	while(gets(word))
	{
		if(strcmp(word,"")==0) break;
		insert(root,word);
//		cout<<word<<endl;
	}
//	cout<<"next"<<endl;
	while(gets(pre))
	{
		if(strcmp(pre,"")==0) break;
		cout<<count(root,pre)<<endl;
	}
}

很多人可能对char * s和char s[]之间产生疑问，c++中字符串的存储方式实际上是利用char数组进行的，指针实际上就相当于一个数组，只是他没有固定的大小，就好比如果我需要存1000000的字符串和10的字符串，如果char数组那我只能开一个1000000大小的，相对于10大小的，会造成浪费，所以char *没有固定大小是在内存上提供了遍历，本质上与char数组对字符串的处理是相同的。

main函数里的操作时，先进行插入单词，然后输入一些测试查询以此为前缀的单词数量
通常对于字典树的操作，在建树完成后，我们需要知道以下几个问题：

该字符串是否为单词
以此字符串为前缀的单词数量
有多少单词经过该分枝节点
最长的公共前缀，prefix为n的所有节点最深的那个，它的深度即为所求

想要求出这些问题的解，只需要对上述模板进行变形即可，熟练使用后，便很容易操作起来。
字典树学会了的话，不妨看看字典树的延伸——AC自动机，难度过大的话可以先收藏起来以后再学哦！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++学习第八篇——字典树的相关文章

工业异常检测AnomalyGPT-Demo试跑

写在前面如果你有大的cpu和gpu可以使用直接根据官方的安装说明就可以如果没有可以点进来试着看一下我个人的安装经验一试跑环境 NVIDIA4090显卡24g cpu内存33G 交换空间8g 操作系统ubuntu22 04 试跑过
CCF模拟题 202309-2 坐标变换（其二）

问题描述试题编号 202309 2 试题名称坐标变换其二时间限制 1 0s 内存限制 512 0MB 问题描述对于平面直角坐标系上的坐标 x y 小 P 定义了如下两种操作 1 拉伸 k 倍横坐标 x 变为 kx 纵坐标 y 变
华为OD机试真题-计算三叉搜索树的高度-2023年OD统一考试（C卷）

题目描述定义构造三叉搜索树规则如下每个节点都存有一个数当插入一个新的数时从根节点向下寻找直到找到一个合适的空节点插入查找的规则是 1 如果数小于节点的数减去500 则将数插入节点的左子树 2 如果数大于节点的数加上500 则将数
基于粒子群算法的电动汽车充电动态优化策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
J2EE常见面试题（一）

StringBuilder和StringBuffer的区别 String 字符串常量不可变使用字符串拼接时是不同的2个空间 StringBuffer 字符串变量可变线程安全字符串拼接直接在字符串后追加 StringBuilder
【C++入门】C++ STL中string常用函数用法总结

目录前言 1 string使用 2 string的常见构造 3 string类对象的访问及遍历迭代器遍历访问 4 string类对象的容量操作 4 1 size和length 4 2 clear empty和capacity 4 3
【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
华为OD机试2024年最新题库（C++）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 C 解法问1 考
2024年华为OD机试真题-转盘寿司-Java-OD统一考试（C卷）

题目描述寿司店周年庆正在举办优惠活动回馈新老客户寿司转盘上总共有n盘寿司 prices i 是第i盘寿司的价格如果客户选择了第i盘寿司寿司店免费赠送客户距离第i盘寿司最近的下一盘寿司 j 前提是prices j lt prices
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作

问题描述已知一个n n的矩阵方阵n lt 100 把矩阵主副对角线上的元素值加上x 然后输出这个新矩阵输入格式一行两个变量用空格隔开代表n和x 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式输出新矩阵每个数字5个
单向不带头链表的使用

单向不带头链表的使用链表的创建 typedef struct LNode SLDataType data struct LNode next LNode LinkList 按位查找 LNode GetElem LinkList L int
华为OD机试2024年最新题库（Java）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 Java 解法问
「优选算法刷题」：快乐数

一题目编写一个算法来判断一个数 n 是不是快乐数快乐数定义为对于一个正整数每一次将该数替换为它每个位置上的数字的平方和然后重复这个过程直到这个数变为 1 也可能是无限循环但始终变不到 1 如果这个过程结果为 1 那么这个
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
高精度运算合集，加减乘除，快速幂，详细代码，OJ链接

文章目录零前言一加法高精度加法步骤 P1601 A B 二减法高精度减法步骤
【算法】使用BFS算法（队列、哈希等）解决最短路径问题（C++）

文章目录 1 前言 1 1 什么是最短路问题 1 1 1 什么是权值 1 2 如何解决此类最短路径 1 3 BFS解最短路径前提 FloodFill 洪流问题 2 算法题

随机推荐

数据结构与算法实验-实验一：线性表基本操作

线性表基本操作文章目录线性表基本操作题目1 题目2 题目3 题目1 线性表是最常见和常用的ADT 假设线性表的元素为整数请基于顺序存储结构实现线性表ADT 基本功能包括 1 建立线性表输入有两行第一行是一个整数n 线性表的长度
SpringMVC自定义视图完成步骤和视图解析的源码剖析

自定义视图完成步骤 7 2 1自定义视图完成步骤 1 自定义视图创建一个 View 的 bean 该 bean 需要继承自 AbstractView 并实现 renderMergedOutputModel 方法 2 并把自定义 View
【项目实战】在win10上安装配置Hadoop的环境变量

一说明注意该教程适用于远程连接Linux上的Hadoop集群因此本步骤是不需要在本地再下载hadoop的在win10操作系统上运行Hadoop以及其相关依赖包比如Hbase依赖包时我遇到的情况是我需要使用SpringB
素数（埃式筛法、线性筛法）

文章目录素数判断方法埃式筛法线性筛法区间筛法质因数分解例题第一题第二题第三题素数判断方法最简单的就是从 2 n 1 都去与 n 取余看是否能整除 bool prime int n for int i 2 i lt n
使用linuxdeployqt在linux下进行Qt打包发布(超详细)

首先来说下本教程实现的功能在linux下对开发的Qt应用进行拷贝依赖文件so等并打成deb安装包实现可安装卸载安装完毕自动在开始菜单下和桌面添加快捷方式卸载后自动删除快捷方式以及删除应用生成的log文件测试环境 ubu
自学Android资料大全

学习级别很多人都往往划分成入门初级中间骨灰级等这里就简单地划分为两级基础篇和进阶篇另外本文涉及到的所有书籍都是在学习过程中所读过的比较经典的一些书籍一基础篇看书的姿态学习过程往往大家都需要看书网上一搜往往会有一大
浪潮服务器更换硬盘_携手希捷，浪潮领先业界完成希捷银河（Exos）X18企业级硬盘评测...

全球领先的数据存储解决方案提供商希捷科技 NASDAQ STX 宣布携手浪潮完成对希捷银河 Exos X18企业级硬盘的评估该硬盘拥有目前业界最高的18TB超大容量性能卓越用于承载大规模数据中心的海量数据双方在实际工作负载环境中测
Python @函数装饰器及用法（超级详细）

使用符号引用已有的函数比如 staticmethod classmethod 后可用于修饰其他函数装饰被修饰的函数那么我们是否可以开发自定义的函数装饰器呢答案是肯定的当程序使用函数比如函数 A 装饰另一个函数比如函数 B
AcWing 420. 火星人

y总讲得很好学到很多所以安利一下转载自Acwing yxc 算法贪心全排列 O nm O nm 这道题目可以直接用next permutation函数来做这里我们考虑一下next permutation函数的原理然后手动实现一遍
c++ modbusTCP

Modbus TCP是一种基于TCP IP协议的Modbus协议它允许Modbus协议通过以太网进行通信在C 中可以使用第三方库来实现Modbus TCP通信例如libmodbus和QModbus 使用libmodbus库实现Mod
介绍一种巧妙的删除程序自己的方法

介绍一种巧妙的删除程序自己的方法 vcbear 近日看到网友询问如何实现程序运行之后把自己删除的方法不知大家对木马甚么的兴趣实在太浓还是想要这样的效果用户只要一运行程序可执行文件就没有了可是程序还是在跑胆小的只怕要喊鬼呀老婆
Pytorch英文官方文档学习笔记(三、Torch.nn及torch.optim)

一 nn Module的使用 Every module in PyTorch subclasses the nn Module 自己定义的每个module都一定是nn Module的子类 pytorch在nn Module中实现了 cal
lod地形

lod地形 2014 05 17 23 29 1471人阅读评论 0 收藏举报分类图形学 17 OGRE相关 75 目录 http blog sina com cn s blog 5e3213f30100zxet html 最近在看
对于同步和非同步，阻塞和非阻塞，BIO，NIO的概念的回顾

同步和异步同步和异步其实是指CPU时间片的利用主要看请求发起方对消息结果的获取是主动发起的还是被动通知的如下图所示如果是请求方主动发起的一直在等待应答结果同步阻塞或者可以先去处理其他事情但要不断轮询查看发起的请求是否有应答
阿里云服务器实现 frp 内网穿透

更多精彩内容请访问我的新博客站点前言前几天在一台具有公网IP的 vultr 云服务器上实现了 frp 内网穿透参考链接可以从寝室 ssh 登录到教研室的服务器但是由于 vultr 的云服务器位于国外的节点连接速度太慢了导致连接
信息采编功能扩展开发心得

AEAI Portal门户为前端页面集成层而设计在使用上简单便捷即使是非技术人员通过操作文档也能够很好地将网站配置出来不需要自身有很强的代码能力同时门户平台搭配数通畅联的其他产品和组合方案能够帮助企业快速搭建集成的内容丰富
GoLand之学习之路--持续更新

GoLand之学习之路持续更新基础包 time 获取当前时间 Bytes 多个 byte数组合并成一个 byte 高级用法 interface 得到调用者函数名 pprof sync Once 命令行参数实例使用小技巧 string和
H264解码深度解析——DM8168 OMX从H264文件读取一帧数据(do chunking of h264)

源码来源 TI DM8168 EZSDK OMX examples decode display 基本执行流程如下 Decode GetNextFrameSize H264 ParsingCtx pc 函数源码加注释如下 Decode
Linux vim使用方式学习纪要

vim学习在Linux下工作和学习离不开vi和vim的使用巧妙记住各种模式下的各种指令不仅可以在工作中大大提高效率还能装一个满分的哔我比较菜只会下面最常用的4种模式中的部分组合技能不过好像在我的开发工作中已经完全足够了模式
C++学习第八篇——字典树

学习了之前的树状结构接下来就可以利用树状结构存储数据了首先什么是字典树字典树就是利用树的结构按照字典的原理进行存储的数据结构树的结构我们了解了字典是什么样的呢我们通常去查英文单词的时候往往都是英文字母a b c d x y z

C++学习第八篇——字典树

C++学习第八篇——字典树 的相关文章

随机推荐

热门标签

C++学习第八篇——字典树的相关文章