【虾说区块链】什么是hash算法?什么是好的hash算法?

2023-10-26



欢迎收听「虾说区块链」。现在区块链这个概念在互联网上相当火热,这里简单做一个普及,不涉及项目推广投资,单纯地对区块链相关基础知识概念作一个说明讲解。本人区块链技术爱好者,结合相关区块链资料总结整理了「虾说区块链」,也是自己一个学习笔记,涉及相关内容如理解有误,也请及时指正。


1
hash算法


hash算法也称为散列函数算法,在区块链中应用的相当频繁,在说明hash算法之前先明确一个概念。

 

计算机在底层机器码是采用二进制的模式,所谓二进制简单来说就是底层以0/1来标识,所有数据传输记录都以010101的模式来存储记录,两种状态也可认为就是一个日常生活中的开关,1标识开,0标识关。那么计算机中最小的数据单位也就是这里说的0或者1,这里我们称为bit(比特或者位),8个bit组成一个字节。当然计算机中也有八进制、十六进制的表示,这里暂时不展开讨论。只明确底层一个二进制的概念。


2
hash算法应用



Hash算法广泛应用于计算机信息科学领域中,也是十分基础的密码学相关知识。

 

Hash表,也称散列表,学过计算机数据结构的都比较清楚这个概念。Hash表是根据关键码值(key、value)而进行直接访问的数据结构,把关键码值映射到表中中一个位置来访问记录,加快查找速度,这个映射的函数称为hash函数,存放记录的数组叫散列表。

 

先来看一个转换:touhezijindeyu经过各种hash加密后得到的值:



MD5加密:

5f1a4fc86d69f850bdd9d972a9b51011

SHA256加密:

b71718959b8a7673e8593bd6a21dc81eb5279e89fd4edc32d648ece57ed7056d

SHA512加密:

0264b0a70c46e7a05ba6fff156ff51738e0d39038fa662575e0a6603412c8c7119dba6aa76d294338a0156ee22cd10d379f5848b1a45a6027fdc5c47b0366198



Hash算法能把任意长度的二进制值映射为固定长度的二进制值,一般来说前一个二进制值我们成为明文,后面通过映射后得到的固定二进制值成为密文或者成为hash值。一旦在明文做任何修改,密文hash值就会有较大出入。

 

良好的hash算法需要满足:


1)快速定向:输入明文后,hash函数能在有限的时间和资源下计算出hash值。


2)难以逆推:得到密文hash值后,在规定的时间内无法推导出明文(注意是规定时间内,这个理论上和实际还是有一些区别)。


3)明文修改异常:明文稍作修改,密文hash值会有较大出入。


4)避免冲突:不同明文,难以出现相同密文hash值。

 

Hash函数一个映像的关系组,那么理论上会出现,明文x不等于y,那么f(x)=f(y)的情况。避免出现不同明文出现相同hash值,这种称为抗碰撞性,也就是上文说到的解决冲突。

 

散列函数的值需要尽可能的平均,同时需要良好的处理冲突的方法,一般解决冲突的方法如下:


1)线性探查法:发生冲突后,线性向前去探索,找到一个附近的空位置。这种方法会导致出现堆积现象,那么在存取的时候,无法明确同义词,那么盲目探查序列,这种探查法比较线性,原理较为明了,但是整个执行效率就会受到较大影响。


2)双散列函数法:在位置冲突后,再次使用一次散列函数进行计算,使得探查序列跳跃式分布。

 

常用的构造散列函数的方法:


1)直接寻址法:直接取key或者key的某个线性函数值为散列地址,那么H(key)=key或者H(key)=a*key+b,a、b为参数。


2)数字分析法:分析一组数据,发现有冲突可能,那么假设冲突后的数字来构成散列地址,这种方式事先找出数字的规律,然后尽可能利用数据来构造冲突几率低的散列地址。


3)平方取中法:取keyword平方后的中间几位作为散列地址。


4)折叠法:keyword切割,分成位数相同的几组,当然最后一组可不同,然后这几组的叠加和作为散列地址。


5)随机数法:选择一组随机函数,取keyword得随机值作为散列地址。


6)除留余数法:取keyword,然后被某个不大于散列列表表长m的数除后得到余数为散列地址。公式:H(key) = key MOD p, p<=m。不仅能够对keyword直接取模,也可在折叠、平方取中等运算之后取模。

 

Hash函数分类:


1)加法hash:把输入的元素一个个加起来的到最终结果。


2)位运算hash:通过利用各种位运算,移位或者异或来混合输入元素。


3)乘法hash:利用乘法的不相关性。比如乘以一个固定或者不停变化的数。


4)除法hash:和乘法的不相关性类似,但是除法效率较慢,所以应用较少。


5)查表hash:CRC系列相关算法。


6)混合hash:通过混合上述5种方式。

   

Hash算法应用:


1)校验文件:上述CRC校验和奇偶校验算法,防止数据篡改,MD5算法,目前听到的较多的一种校验文件完整性算法。


2)数字签名:由于非对称算法的运算速度,在常用数字签名协议中,单向的散列函数都是比较常用的,对于hash值,又会称为“数字摘要”进行数字签名。


3)挑战-认证模式:一般用于信道传输过程中,防止侦听破坏的一种方式。

 

Hash函数使用限制:


Hash函数中,不论输入的文件长度多少,输出结果都是一组固定长度的数字字符,结合加密方法的概念,hash算法是一个不可逆向的单项函数。文件有任意改动,即可检测出来。同时hash算法是一个无限大范围映射到一个有限小范围的模式,那么节省空间同时便于查找。


当然不是所有都适合hash算法,总结以下几个限制:


1)hash函数是大范围映射到小范围,故实际输入考虑和小范围相当或者更小,理论上尽量避免冲突。


2)hash函数是单向不可逆。


(音频内容来源:投河自尽的鱼


以下是我们的社区介绍,欢迎各种合作、交流、学习:)



点击“阅读原文”进入直播室听专栏音频


阅读原文
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【虾说区块链】什么是hash算法?什么是好的hash算法? 的相关文章

随机推荐

  • MAVEN 私有仓库搭建与配置

    一 nexus 下载安装 1 下载 官网地址 https www sonatype com nexus repository oss 由于XXX原因 官网地址可能无法下载 百度网盘 百度网盘 请输入提取码 提取码 ogjf 2 安装 lin
  • docker部署lnmp环境介绍

    lnmp 一 部署lnmp 二 测试nginx和php连接 三 测试php和mysql的连接 一 部署lnmp 1 网络规划 172 16 10 0 24 nginx 172 16 10 10 mysql 172 16 10 20 php
  • C++到底还能做什么?

    嗯 这是一位朋友发到我邮箱里面的 很奇怪 发到了gmail邮箱 而不是我常用的hotmail邮箱哈 我呢 试着回答一下 如果回答得不好 叫做肖某人学艺不精 回去重新学习再来过哈 呵呵 一家之言哈 欢迎拍装 原文如下 肖老师您好 我现在是一名
  • AngularJS 通过事件实现跨作用域传值

    跨作用域传值 跨作用域传值 可以通过 子作用域共同使用父作用域的变量或者使用 单例的service实现 这两种方式 在父级作用域或者 Service 单例的变量值改变的时候 无法实现把值再自动处理赋值给作用域 但是通过事件链 的方式就可以实
  • 页表项长度的计算方法

    Frame Number It gives the frame number in which the current page you are looking for is present The number of bits requi
  • 信息安全概念

    1 信息安全定义 国际标准化组织 lntemational Organization for Standardization IS0 息安全的定义为 为数据处理系统建立和采取技术 管理的安全保护 保护计算机硬件 软件 数据不因偶然的或恶意的
  • 创建一个报表服务器项目,创建报表服务器项目

    创建报表服务器项目 10 17 2017 本文内容 Azure DevOps Server 2020 Azure DevOps Server 2019 TFS 2018 TFS 2013 Azure DevOps Server 以前名为 V
  • 电影下载地址大集合,只要是电影就能找到

    看到很多人都想找一些奇葩 或者国内很少见的电影 你们还在百度 微盘上搜索么 还在人人影视上溜达么 以下收集各大电影网站 绝对能满足你们 如果你不是那么热爱电影 只是闲暇之余看看热门的新片 美剧 不求画质与速度的话 那么下面这几个网站已经能满
  • VB

    文章目录 变量定义 Sub过程 函数定义 控制台输入输出 switch case语句 IF语句 FOR循环语句 不等于 逻辑运算符 控制台输入回车不崩溃函数 获取外部库指针内容放到自定义类中 读ini文件 变量定义 int Dim 变量名
  • 深度学习学习率的调整

    20220626 0 引言 最近在做实验的时候 由于结果一直都不怎么好 我就在想是不是过拟合了 那就算不是过拟合 是不是根本没有学习到数据集中的信息呢 想到了这些事情 我就直接把测试集的效果跟随着训练过程直接打印出来了 当然 实际过程中 肯
  • 1.Linux命令-删除

    Linux的删除命令 在Linux下删除文件 我们使用rm命令 还有搭配相应的参数 具体的选择我们看下面看说明 rm 参数 文件名 参数说明 1 f force 忽略不存在的文件 强制删除 无任何提示 2 i interactive 进行交
  • windows下qtmqtt模块的编译安装-Qt5.12.12

    windows下qtmqtt模块的编译安装 Qt5 12 12 代码获取及编译环境 代码获取 方式1 方式2 配置编译环境 编译安装 代码获取及编译环境 代码获取 方式1 直接git拉取至本地 git clone https github
  • PyTorch显存机制简要分析

    显存开销 显存占用约为element个数的4倍 注意不会将空闲的显存释放 模型参数 模型参数的梯度 优化器状态 跟踪每个权重参数 比如记录动量 中间结果 前向传播时计算的中间结果 显存分析方法 No Nvidia smi PyTorch中即
  • 《JavaScript设计模式》初次笔记——wsdchong

    JavaScript设计模式 初次笔记 前言 设计模式一直久仰大名 但是没有去花时间去了解 于是今天特意花时间去看 JavaScript设计模式 2013年6月出版 和w3cschool上的设计模式 然后做了一些笔记 以 JavaScrip
  • 随机游走序列平稳吗_【问答】时间序列系列(一)—— 平稳序列

    编写 果壳屋 什么是平稳 非平稳序列 如果时间的变化不会导致分布的变化 我们谈论的是分布统计属性 如均值 方差和协方差 我们就把时间序列称为为平稳的 stationary 这并不意味着序列不会随时间而变化 只是它的变化方式本身不会随时间而变
  • mybatis实现继承映射

    ORM 框架的优势在于能让我们利用面向对象的思维去操作数据库 hibernate 作为重量级的 ORM 框架对面向对象的支持很强大 作为半自动化的 mybatis 对面向对象的支持也是很完备的 这篇文章就来讨论一下如何利用 mybatis
  • Vue的路由

    一 Vue的路由 1 路由 路由 从源页面到目的页面的决策过程 2 前端路由 前端路由 在前端页面中维护的路由规则 1 hash 在地址中以 分隔页面 2 history 在地址中以 分隔页面 3 VueRouter路由 VueRouter
  • 今天来聊一聊在人工智能技术发展中起到重要作用的蒸馏算法

    人工智能技术的迅猛发展已经带来了诸多突破和应用 但同时也面临着一些挑战 例如深层网络的复杂性和高计算成本 为了应对这些问题 蒸馏算法作为一种有效的知识传递方法被提出并广泛应用于人工智能领域 本文将深入探讨蒸馏算法的原理 关键技术以及其在人工
  • python的setup.py文件及其常用命令

    http www 2cto com kf 201209 153517 html 编写setup py文件 获取帮助 python setup py help commands python Standard commands build b
  • 【虾说区块链】什么是hash算法?什么是好的hash算法?

    欢迎收听 虾说区块链 现在区块链这个概念在互联网上相当火热 这里简单做一个普及 不涉及项目推广投资 单纯地对区块链相关基础知识概念作一个说明讲解 本人区块链技术爱好者 结合相关区块链资料总结整理了 虾说区块链 也是自己一个学习笔记 涉及相关