【哈夫曼树】

2023-11-11

前言

哈夫曼树又称最优二叉树，可以对带权节点进行编码并且保证每个数据的编码都不会是其他数据的前缀，保证了编码的唯一性，因此，哈夫曼编码又称为前缀码。
（注意：哈夫曼编码方式是可以根据要求改变的，所以按照方案1编码的数据需要按照方案1的编码要求进行解释，否则可能得不到正确的结果）
由于哈夫曼树中只有没有孩子的叶子节点和有两个孩子的二叉节点，根据n0=n2+1，得到总节点数N：N=2*n0+1
我们可以创建哈夫曼树编码表，前n0个为待编码节点，后N-n0个为parent节点，由于是用数组存放，并且它们的位置不会改变，孩子和双亲指针都用下标表示即可。
这里我们规定：左孩子的权值要小于右孩子，并且左孩子编码为0，右孩子编码为1，之后就是连接叶子节点并且找到对应的编码即可。

1.哈夫曼树结构


#include<stdio.h>
#include<stdlib.h>
#include<string.h>

typedef struct HTNode
{
	char data;         // 数据
	int weight;     // 权值
	int lchild;			 // 左孩子下标
	int rchild;			//右孩子下标
	int parent;			//父亲节点下标，设置父节点是为了从叶子结点向上查找获取哈夫曼编码
}HTNode, * PHT;

typedef char** PPCHAR;

2.初始化

我们这里将数据放到数组中并且在后序操作中不改变数据的位置，可以方便之后的操作。

void InitHuffmanNode(PHT hf, int con)  // con为待编码节点个数
{
	for (int i = 0; i < con; i++)
	{
		printf("请输入节点的数据和权值：");
		scanf("%c %d", &hf[i].data, &hf[i].weight);            // 前con个节点为待编码节点
		getchar();
		hf[i].lchild = hf[i].rchild = hf[i].parent = -1;  //  初始化为空，此时每个节点都是独立的
	}
	//  后面的节点可以在连接时赋值
}

3.构造哈夫曼树

每次选出两个权值最小并且没有父节点的节点连接。

void CreateHuffman(PHT& hf, int con)
{
	for (int i = 0; i < con - 1; i++)  // 连接次数
	{       
		int minsub1 = 0;             // 第一个节点的下标
		int minweight1 = INT_MAX;     // 第一个节点的权值，找到比它小的就交换
		int minsub2 = 0;
		int minweight2 = INT_MAX;

		for (int j = 0; j < con + i; j++)  // 选取节点时的范围，由于会不断设置父节点，所以每连接一次节点总数多一个
		{
			if (hf[j].parent == -1 && hf[j].weight < minweight1)  // 没有父节点，权值小
			{
				minweight1 = hf[j].weight;
				minsub1 = j;
			}
		}

		for (int j = 0; j < con + i; j++)  // 选取第二个节点
		{
			if (hf[j].parent == -1 && j != minsub1 && hf[j].weight < minweight2) // 没有父节点，和第一个不重复，权值小
			{
				minweight2 = hf[j].weight;
				minsub2 = j;
			}
		}

		// 连接
		hf[con + i].weight = hf[minsub1].weight + hf[minsub2].weight;  // 赋权值
		hf[con + i].lchild = minsub1;    // 连接两个子节点
		hf[con + i].rchild = minsub2;
		hf[con + i].parent = -1;

		hf[minsub1].parent = con + i;     // 为子节点赋值父节点
		hf[minsub2].parent = con + i;
	}
}

4. 获取Huffman编码

我们要找到各个节点的哈夫曼编码，就需要先找到该节点，然后从该节点往上走到根节点，记录下走过的路径，就是它的哈夫曼编码。


void GetHuffmanCode(PHT hf, PPCHAR str, int* weight, int con)
{

	char* tmp = (char*)malloc(con);    // 记录每个叶子结点的编码
	if (tmp == NULL)
		exit(-1);

	tmp[con - 1] = '\0';         //   字符串结束
	// 叶子结点位置就是前con个
	for (int i = 0; i < con; i++)
	{
		int t = con - 2;        // tmp有效下标
		int child = i;              //   从叶子结点向上遍历
		int parent = hf[i].parent;
		weight[i] = hf[i].weight;  // 权值
		int len = 0;     // 记录经过的路径个数
		while (parent != -1)
		{
			len++;
			if (hf[parent].lchild == child)    //   左孩子编码为‘0’，右孩子编码为‘1’
				tmp[t--] = '0';
			else
				tmp[t--] = '1';

			child = parent;        // 孩子和父亲都向上走，更新下标
			parent = hf[parent].parent;
		}
		weight[i] *= len;                     //    该节点的WPL

		str[i] = (char*)malloc(len + 1);  //  编码和 '\0' 总数
		if (str[i] == NULL)
			exit(-1);

		strcpy(str[i], tmp + t + 1);         //  将有效字符拷贝过去
	}

	free(tmp);
}

整体代码

#include<stdio.h>
#include<stdlib.h>
#include<string.h>

typedef struct HTNode
{
	char data;         // 数据
	int weight;     // 权值
	int lchild;			 // 左孩子下标
	int rchild;			//右孩子下标
	int parent;			//父亲节点下标，设置父节点是为了从叶子结点向上查找获取哈夫曼编码
}HTNode, * PHT;

typedef char** PPCHAR;

//  建立哈夫曼编码表
void InitHuffmanNode(PHT hf, int con)
{
	for (int i = 0; i < con; i++)
	{
		printf("请输入节点的数据和权值：");
		scanf("%c %d", &hf[i].data, &hf[i].weight);            // 前con个节点为待编码节点
		getchar();
		hf[i].lchild = hf[i].rchild = hf[i].parent = -1;  //  初始化为空，此时每个节点都是独立的
	}
	//  后面的节点可以在连接时赋值
}

 // 每次选出两个 权值最小 并且 没有父节点  的节点连接
void CreateHuffman(PHT hf, int con)
{
	for (int i = 0; i < con - 1; i++)  // 连接次数
	{       
		int minsub1 = 0;             // 第一个节点的下标
		int minweight1 = INT_MAX;     // 第一个节点的权值，找到比它小的就交换
		int minsub2 = 0;
		int minweight2 = INT_MAX;

		for (int j = 0; j < con + i; j++)  // 选取节点时的范围，由于会不断设置父节点，所以每连接一次节点总数多一个
		{
			if (hf[j].parent == -1 && hf[j].weight < minweight1)  // 没有父节点，权值小
			{
				minweight1 = hf[j].weight;
				minsub1 = j;
			}
		}

		for (int j = 0; j < con + i; j++)  // 选取第二个节点
		{
			if (hf[j].parent == -1 && j != minsub1 && hf[j].weight < minweight2) // 没有父节点，和第一个不重复，权值小
			{
				minweight2 = hf[j].weight;
				minsub2 = j;
			}
		}

		// 连接
		hf[con + i].weight = hf[minsub1].weight + hf[minsub2].weight;  // 赋权值
		hf[con + i].lchild = minsub1;    // 连接两个子节点
		hf[con + i].rchild = minsub2;
		hf[con + i].parent = -1;

		hf[minsub1].parent = con + i;     // 为子节点赋值父节点
		hf[minsub2].parent = con + i;
	}
}


//  获取Huffman编码
void GetHuffmanCode(PHT hf, PPCHAR str, int* weight, int con)
{

	char* tmp = (char*)malloc(con);    // 记录每个叶子结点的编码
	if (tmp == NULL)
		exit(-1);

	tmp[con - 1] = '\0';         //   字符串结束
	// 叶子结点位置就是前con个
	for (int i = 0; i < con; i++)
	{
		int t = con - 2;        // tmp有效下标
		int child = i;              //   从叶子结点向上遍历
		int parent = hf[i].parent;
		weight[i] = hf[i].weight;  // 权值
		int len = 0;     // 记录经过的路径个数
		while (parent != -1)
		{
			len++;
			if (hf[parent].lchild == child)    //   左孩子编码为‘0’，右孩子编码为‘1’
				tmp[t--] = '0';
			else
				tmp[t--] = '1';

			child = parent;        // 孩子和父亲都向上走，更新下标
			parent = hf[parent].parent;
		}
		weight[i] *= len;                     //    该节点的WPL

		str[i] = (char*)malloc(len + 1);  //  编码和 '\0' 总数
		if (str[i] == NULL)
			exit(-1);

		strcpy(str[i], tmp + t + 1);         //  将有效字符拷贝过去
	}

	free(tmp);
}

void HuffmanCodePrint(PHT hf, PPCHAR str, int* weight, int con)
{
	printf("data\tweight\tcode\n");
	int i = 0;
	for (int i = 0; i < con; i++)
	{
		printf("%c\t%d\t%s\n", hf[i].data, weight[i], str[i]);
	}
}

int main()
{
	PHT hf;        // 节点数组
	PPCHAR str;     //  二级指针，字符数组数组
	int* weight;    // 存放每个叶子节点的带权路径长度
	int con = 0; // 叶子节点个数
	printf("请输入待编码结点个数：");
	scanf("%d", &con);
	getchar();   //吃掉换行

	hf = (PHT)malloc(sizeof(HTNode) * (con * 2 - 1));
	if (hf == NULL)
		exit(-1);

	str = (PPCHAR)malloc(sizeof(char*) * con);
	if (str == NULL)
		exit(-1);

	weight = (int*)malloc(sizeof(int) * con);
	if (weight == NULL)
		exit(-1);

	InitHuffmanNode(hf, con);
	CreateHuffman(hf, con);
	GetHuffmanCode(hf, str, weight, con);
	HuffmanCodePrint(hf, str, weight, con);

	free(hf);
	for (int i = 0; i < con; i++)
		free(str[i]);
	free(str);
	free(weight);
	return 0;
}

运行实例：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【哈夫曼树】的相关文章

使用 CMake 时如何导出 Emscripten 中的 C 函数

In 本教程 https emscripten org docs porting connecting cpp and javascript Interacting with code html interacting with code
在 CPP 类中将 C 函数声明为友元

我需要在 C 函数中使用类的私有变量我正在做这样的事情 class Helper private std string name public std getName return name friend extern C void in
Rx.NET 中是否有一个Subject 实现，其功能类似于BehaviourSubject，但仅在值发生更改时才发出？

有没有Subject https learn microsoft com en us previous versions dotnet reactive extensions hh229699 v vs 103 Rx NET 中的实现在功能
循环遍历 C 结构中的元素以提取单个元素的值和数据类型

我有一个要求我有一个 C 语言的大结构由大约 30 多个不同数据类型的不同元素组成 typedef struct type1 element1 type2 element2 type3 element3 type2 element4 1
当事件button.click发生时，如何获取按钮名称/标签？

我以编程方式制作按钮并将它们添加到堆栈面板中以便每次用户导航到页面时按钮都会发生变化我正在尝试做这样的事情当我单击创建的按钮时它将获取按钮的标签并转到正确的页面但是我无法使用 RoutedEventHandler 访问按钮元素
强制初始化模板类的静态数据成员

关于模板类的静态数据成员未初始化存在一些问题不幸的是这些都没有能够帮助我解决我的具体问题的答案我有一个模板类它有一个静态数据成员必须为特定类型显式实例化即必须专门化如果不是这种情况使用不同的模板函数应该会导致链接器错误这是
cpp.react库的C++源代码中奇怪的“->* []”表达式

这是我在文档中找到的 C 片段cpp react 库 https github com schlangster cpp react implicit parallelism auto in D MakeVar 0 auto op1 in g
RestSharp获取序列化输出

我正在寻找一种方法来访问 AddBody 调用的序列化结果我正在使用内置的 RestSharp 序列化器例子 class Foo public string FooField void SendRecord var f new Foo
语音识别编程问题入门

所以你们可能都看过钢铁侠其中托尼与一个名为贾维斯的人工智能系统进行交互演示剪辑here http www youtube com watch v Go8zsh1Ev6Y 抱歉这是广告我非常熟悉 C C 和 Visual Basi
即使没有异步，CallContext.LogicalGetData 也会恢复。为什么？

我注意到CallContext LogicalSetData LogicalGetData不按照我期望的方式工作内部设置的值async方法得到恢复即使没有异步或任何类型的线程切换无论如何这是一个简单的例子 using System u
如何使用 Regex.Replace 从字符串中删除数字？

我需要使用Regex Replace从字符串中删除所有数字和符号输入示例 123 abcd33输出示例 abcd 请尝试以下操作 var output Regex Replace input d string Empty The d标识符
不同 C++ 文件中的相同类名

如果两个 C 文件具有相同名称的类的不同定义那么当它们被编译和链接时即使没有警告也会抛出一些东西例如 a cc class Student public std string foo return A void foo a Stude
如何使用 ASP.NET Core 获取其他用户的声明

我仍在学习 ASP NET Core 的身份我正在进行基于声明的令牌授权大多数示例都是关于当前登录用户的就我而言我的 RPC 服务正在接收身份数据库中某个用户的用户名和密码我需要验证是否存在具有此类凭据的用户获取该用户的所
是否使用 C# 数据集？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我对 C 中的数据集概念有点困惑编码 ASP NET 站点但这并不重要在我的阅读中我了解到它们本质上用作我的应用程序和我的
在 C 中使用枚举而不是 #defines 作为编译时常量是否合理？

在 C 工作了一段时间后我将回到 C 开发领域我已经意识到在不必要的时候应该避免使用宏以便让编译器在编译时为您做更多的工作因此对于常量值在 C 中我将使用静态 const 变量或 C 11 枚举类来实现良好的作用域在 C 中
如何最好地以编程方式将 `__attribute__ ((unused))` 应用于这些自动生成的对象？

In my makefile我有以下目标它将文本 HTML 资源编译为unsigned char数组使用xxd i http linuxcommand org man pages xxd1 html 我将结果包装在匿名命名空间和标头保
将 Lambda 表达式树与 IEnumerable 结合使用

我一直在尝试了解有关使用 Lamba 表达式树的更多信息因此我创建了一个简单的示例这是代码如果作为 C 程序粘贴到 LINQPad 中它可以工作 void Main IEnumerable
EntityFramework 6.0.0.0 读取数据，但不插入

我创建了一个基于服务的数据库 folderName gt Add New Item gt Data gt Service based Database文件到 WPF 应用程序中然后我用过Database First方法并创建了Person
没有“对 *this”功能的右值引用的解决方法

我有一个围绕可移动对象的代理容器类并希望代理能够隐式生成对底层对象的右值引用但仅当代理本身被移动时我相信我将能够按照提案 n2439 实施此行为将移动语义扩展到 this http www open std org jtc1 sc2
为什么空循环使用如此多的处理器时间？

如果我的代码中有一个空的 while 循环例如 while true 它将把处理器的使用率提高到大约 25 但是如果我执行以下操作 while true Sleep 1 它只会使用大约1 那么这是为什么呢更新感谢所有精彩的回复但我

随机推荐

Nacos启动报错

Nacos启动报错问题的解决方案 nacos官网得知环境要求为jdk1 8 maven3 2 x 为了避免采坑版本尽量使用官网推荐的直接上报错如下 org springframework beans factory Unsatisfi
分配给套接字的IP地址与端口号

文章目录 1 网络地址 Internet Address 2 网络地址分类与主机地址边界 3 用于区分套接字的端口号 IP 是 Internet Protocol 网络协议的简写是为收发网络数据而分配给计算机的值端口号并非赋予计算机的
五年程序员人生的点点滴滴

转自 http blog csdn net linux loajie article details 7672455 和大家一样我也是一名普通的程序员很快工作五年了现在依然记得大学时软件工程老师曾说过的一句话大概是这样的工作五年之
如何在windows下安装与配置Appium

如何在windows下安装与配置Appium appium是一款open source 移动自动化测试框架既支持Android 也支持IOS 工具原料 JDK adt bundle windows node python appium
Grafana（据说全网最详细配置教程）

见我笔记 https www wolai com fishman tolearn ccb6Z7P4kBr1JQ3m1r2CLs theme light
Java中的序列化和反序列化

java对象序列化是指将java对象转换为字节序列的过程而反序列化则是将字节序列转换为java对象的过程我们知道不同进程程序间进行远程通信时可以相互发送各种类型的数据包括文本图片音频视频等而这些数据都会以二进制序列的形式
Blob，ArrayBuffer，File，FileReader，Buffer，TypeArray 的作用和区别

Blob Binary Large object 二进制大型对象是一个相对high level的概念一个Blob对象可以包含一个或多个连续内存通常是由一个或多个ArrayBuffer对象组成的数组 ArrayBufer 与 Buffe
kubernetes HPA使用及测试

一安装metrics server Metrics Server是Kubernetes内置的容器资源指标来源 Metrics Server从node节点上的Kubelet收集资源指标并通过Metrics API在 Kubernetes
TestNG基本注释二：基本注释解释

在TestNG基本注释一中我们给出来一个用eclipse IDE生成的TestNG测试类 package test java com testng test import org testng annotations Test impor
机器学习实战5-天气预测系列:利用数据集可视化分析数据，并预测某个城市的天气情况

大家好我是微学AI 最近天气真的是多变啊忽冷忽热今天再次给大家带来天气的话题机器学习实战5 天气预测系列我们将探讨一个城市的气象数据集并利用机器学习来预测该城市的天气状况该数据集包含年平均温度和湿度等信息一准备工作首先
【Linux】Ubuntu20.04版本安装谷歌中文输入法【教程】

Linux Ubuntu20 04版本安装谷歌中文输入法教程文章目录 Linux Ubuntu20 04版本安装谷歌中文输入法教程一下载fcitx googlepinyin 二配置Language Support Referen
java随机生成6位验证码的方法对比（这里列出三种）

第一种方式不推荐因为结果可能会出现错误 String code String valueOf new Random nextInt 1000000 这种方式有问题问题在于在连续生成多次的情况下可能会生成小于6位的验证码测试 fo
scrollIntoView 的使用

描述将调用此方法的元素滚动到浏览器窗口的可见区域 scrollIntoView 官方文档用法 element scrollIntoView 用法同 element scrollIntoView true element scrollIn
网络工程师--网络安全与应用案例分析

案例一某单位现有网络拓扑结构如下图所示实现用户上网功能该网络使用的网络交换机均为三层设备用户地址分配为手动指定案例分析一路由器AR2200的GE0 0 1接口地址为内网地址为确保内部用户访问Internet 需要在该设备配置
线上验证真的就是点点点吗？

最近测试了一个项目与其他4个后台有合作今天项目上线了一下配置错了一下数据错了真整的有点手忙脚乱于是整理了一个checklist 供后续备忘希望能对大家有所启发线上验证有些项目比较单一或许点点点就足够了但是遇到与其他项
SHELL脚本遍历文件夹下所有文件以及子文件夹

SHELL脚本遍历文件夹下所有文件以及子文件夹 dir 要设置为局部变量如果设置为全局变量在func递归时传入的参数会改变 dir的值将导致之后的文件目录错误为更改后的dir值当前目录情况执行完shell后附上代码 bin
从源码到原理剖析activity核心知识点

如何在onResume方法中获取到View的宽高有两种方式 post和addOnGlobalLayoutListener override fun onResume super onResume Log e onresume tabBot
新手使用~React+Antd^4.1.3+Hooks自定义筛选框

官网此版本的筛选组件为根据可爱的pm的要求需要添加全选确认筛选重置按钮此情景适用于后端所需要的的参数传递为多选数组的形式而非单个字符串引入需要的组件及包 import Table Button Checkbox Space
AAL：ATM 适配层（AAL0、AAL2、AAL3/4、AAL5）－－网络大典

ATM 适配层 AAL 主要负责 ATM 层与高层之间的信元转发过程从上层收到信息后 AAL 将数据分割成 ATM 信元从 ATM 层收到信息后 AAL 必须重新组合数据形成一个上层能够辨识的格式上述操作称之为分段与重组 SAR 它是
【哈夫曼树】

目录前言 1 哈夫曼树结构 2 初始化 3 构造哈夫曼树 4 获取Huffman编码整体代码前言哈夫曼树又称最优二叉树可以对带权节点进行编码并且保证每个数据的编码都不会是其他数据的前缀保证了编码的唯一性因此哈夫曼编码又称为前