《区块链技术与应用》学习笔记10——ETH数据结构

2023-11-19

在以太坊中,有三棵树的说法,分别是状态数、收据树和交易树。

一、引入

我们要实现从账户地址到账户状态的映射。在以太坊中,账户地址为160位,表示为40个16进制数。状态包含了余额(alance)、交易次数(nonce),合约账户中还包含了code(代码)、存储(storge)。

  • 直观来看,其本质上为Key-value键值对,所以直观想法便用哈希表实现。若不考虑哈希碰撞 ,查询直接为常数级别的查询效率。但采用哈希表,难以提供Merkle proof。
  • 需要记住的是,在BTC和以太坊中,交易保存在区块内部,一个区块可以包含多个交易。通过区块构成区块链,而非交易。

二、思考如何组织账户的数据结构

  1. 像BTC中,将哈希表的内容组织为Merkle Tree?
    当新区块发布,哈希表内容会改变,如果这样,每当产生欣区块,都需要重新组织Merkle Tree,很明显这是不现实的。需要注意的是,比特币系统中没有账户概念,交易由区块管理,而区块包含上限为4000个交易左右,所以Merkle Tree不是无限增大的。而ETH中,Merkle Tree来组织账户信息,很明显其会越来越庞大。
    实际中,发生变化的仅仅为很少一部分数据,我们每次重新构建Merkle Tree代价很大。
  2. 那我们不要哈希表了,直接使用Merkle Tree,每次修改只需要修改其中一部分可以吗?
    实际中,Merkle Tree并未提供一个高效的查找和更新的方案。此外,将所有账户构建为一个大的Merkle Tree,为了保证所有节点的一致性和查找速度,必须进行排序。
  3. 那么经过排序,使用Sorted Merkle Tree可以吗?
    新增账户,由于其地址随机,插入Merkle Tree时候很大可能在Tree中间,发现其必须进行重构。所以Sorted Merkle Tree插入、删除(实际上可以不删除)的代价太大。

三、trie(字典树、前缀树)

在这里插入图片描述
特点:
1. trie中每个节点的分支数目取决于Key值中每个元素的取值范围(图例中最多26个英文字母分叉+一个结束标志位)。
2. trie查找效率取决于key的长度。实际应用中(以太坊地址长度为160byte)。
3. 理论上哈希会出现碰撞,而trie上面不会发生碰撞。
4. 给定输入,无论如何顺序插入,构造的trie都是一样的。
5. 更新操作局部性较好
缺点
trie的存储浪费。很多节点只存储一个key,但其“儿子”只有一个,过于浪费。

四、Patricia trie(Patricia tree)

在这里插入图片描述
Patricia trie就是进行了路径压缩的trie。如果新插入单词,原本压缩的路径可能需要扩展开来。树中插入的键值分布较为稀疏的情况下,可见路径压缩效果较好。
在以太坊系统中,160位的地址存在2^160 种,该数实际上已经非常大了,和账户数目相比,可以认为地址这一键值非常稀疏。
因此,我们可以在以太坊账户管理种使用Patricia tree这一数据结构!但实际上,在以太坊种使用的并非简单的PT(Patricia tree),而是MPT(Merkle Patricia tree)。

五、MPT(Modified Patricia tree)

下图为以太坊中使用的MPT结构示意图。右上角表示四个账户(为直观,显示较少)和其状态(只显示账户余额)。(需要注意这里的指针都是哈希指针)
在这里插入图片描述

每次发布新区块,状态树中部分节点状态会改变。但改变并非在原地修改,而是新建一些分支,保留原本状态。如下图中,仅仅有新发生改变的节点才需要修改,其他未修改节点直接指向前一个区块中的对应节点。
在这里插入图片描述
所以,系统中全节点并非维护一棵MPT,而是每次发布新区块都要新建MPT。只不过大部分节点共享。

为什么要保存原本状态?为何不直接修改?
为了便于回滚。如下1中产生分叉,而后上面节点胜出,变为2中状态。那么,下面节点中状态的修改便需要进行回滚。因此,需要维护这些历史记录。
在这里插入图片描述

六、交易树和收据树

  • 每次发布一个区块时,区块中的交易会形成一颗Merkle Tree,即交易树。
  • 此外,以太坊还添加了一个收据树,每个交易执行完之后形成一个收据,记录交易相关信息,便于快速查询执行结果。
  • 交易树和收据树上的节点是一一对应的。
    MPT的好处是支持查找操作,通过键值沿着树进行查找即可。对于状态树,查找键值为账户地址;对于交易树和收据树,查找键值为交易在发布的区块中的序号。
    交易树和收据树只将当前区块中的交易组织起来,而状态树将所有账户的状态都包含进去,无论这些账户是否与当前区块中交易有关系。
    多个区块状态树共享节点,而交易树和收据树依照区块独立。

交易树和收据树的用途:

  1. 向轻节点提供Merkle Proof。
  2. 更加复杂的查找操作(例如:查找过去十天的交易;过去十天的众筹事件等)

七、Bloom filter(布隆过滤器)

支持较为高效查找某个元素是否在某个集合中
最笨:元素遍历,复杂度为O(n)——轻节点不能用
方法:给一个大的集合,计算出一个紧凑的“摘要”
Bloom filter特点:有可能出现误报,但不会出现漏报。
Bloom filter变种:采用一组哈希函数进行向量映射,有效避免哈希碰撞

例:如下图,给定一个数据集,其中含义元素a、b、c,通过一个哈希函数H()对其进行计算,将其映射到一个其初始全为0的128位的向量的某个位置,将该位置置为1。将所有元素处理完,就可以得到一个向量,则称该向量为原集合的“摘要”。可见该“摘要”比原集合是要小很多的。
假定想要查询一个元素d是否在集合中,假设H(d)映射到向量中的位置处为0,说明d一定不在集合中;假设H(d)映射到向量中的位置处为1,有可能集合中确实有d,也有可能因为哈希碰撞产生误报。
在这里插入图片描述

如果集合中删除元素该怎么操作?
无法操作。也就是说,简单的Bloom filter不支持删除操作。如果想要支持删除操作,需要将记录数不能为0和1,需要修改为一个计数器(需要考虑计数器是否会溢出)。

八、以太坊中Bloom filter的作用

每个交易完成后会产生一个收据,收据包含一个Bloom filter记录交易类型、地址等信息。在区块block header中也包含一个Bloom filter,其为该区块中所有交易的Bloom filter的一个并集。
所以,查找时候先查找块头中的Bloom filter,如果块头中包含。再查看区块中包含的交易的Bloom filter,如果存在,再查看交易进行确认;如果不存在,则说明发生了“碰撞”。
好处是通过Bloom filter这样一个结构,快速大量过滤掉大量无关区块,从而提高了查找效率。

九、交易驱动的状态机

以太坊的运行过程,可以视为交易驱动的状态机,通过执行当前区块中包含的交易,驱动系统从当前状态转移到下一状态。当然,BTC我们也可以视为交易驱动的状态机,其状态为UTXO。
对于给定的当前状态和给定一组交易,可以确定性的转移到下一状态(保证系统一致性)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

《区块链技术与应用》学习笔记10——ETH数据结构 的相关文章

  • 局域网下ROS多机通信的网络连接配置

    1 在路由器设置中固定各机器IP地址 在浏览器中输入路由器的IP地址 例如TP LINK路由器的IP为 192 168 1 1 进入登录页面后 输入用户名和密码登录 用户名一般为admin 密码为自定义 在 基本设置 gt LAN设置 gt
  • WebRTC 之点对点连接——浏览器

    WebRTC 的精髓 点对点连接 上一篇文章中 主要讲了浏览器怎样获取用户设备上的视频流 并且显示在 HTML5
  • java以base64文件格式导出excel表格

    在项目中要求查询数据库并且用base64文件流的格式返回excel表格 自己试了好几种方法 最后找到的答案 错误方式 用HSSFWorkbook直接生成相对应的文件 然后用base64转化 这种解析出来的文件是打不开的 String enc
  • 上海万应云——大数据精准招商系统

    上海万应云数字科技有限公司 基于全国企业大数据与企业特有的经营数据 进行动态分析与整合 形成如下几个业务领域 1 针对地方政府 产业园 形成产业政策分析 产业链路图谱 区域经济报告 高潜企业挖掘 全面把握当地的产业经济状况 投融资实际落地情
  • [JAVA]将Set转换成int[]数组

    今天在写练习的时候 碰到了方法的返回值为int 可我却使用的是HashSet来实现 想return发现类型对不上的问题 于是尝试了toArray方法 但toArray方法返回的是Object类或者是一个包装类 就找到了这个set转换成int

随机推荐

  • 动态一键换肤实现思路和demo

    前言 浏览器切换样式无非是通过css 总共有以下三种方法 内联style 注入style 注入link 那么我们想要实现一键换肤 那么我们为了剥离干净dom和css 我们只能选择style和link这两种方法 核心思路 在html的head
  • Java反射机制和线程

    JAVA反射机制 已经加载过这个类 通过类名来找到这个类的所有相关信息 在运行时判断任意一个对象所属的类 在运行时构造任意一个类的对象 在运行时判断任意一个类所具有的成员变量和方法 在运行时调用任意一个对象的成员变量和方法 生成动态代理 反
  • 远程桌面dos开启

    lt DOCTYPE html PUBLIC WCDTD XHTML StrictEN httpwwwworgTRxhtmlDTDxhtml strictdtd gt 注册表内容 Windows Registry Editor Versio
  • 用 Java 实现的八种常用排序算法

    八种排序算法可以按照如图分类 前置知识 1 算法稳定性 在一个序列中 能保证两个相等的数 经过排序之后 其在序列的前后位置顺序不变 A1 A2 排序前 A1 在 A2 前面 排序后 A1 还在 A2 前面 2 时间复杂度 时间复杂度是用于衡
  • Sublimewebinspector 断点不能打上的解决方法

    最近老大在sublime上开发出了我们产品的开发包 这个开发包能像ZenCoding一样快速打出前端代码 这样开发者用我们产品的概率就大多了 但是对于产品中的js代码 现在还没有很好的工具 搬砖的我小有雄心壮志的想给我们的产品开发一个JS代
  • 生成专题4

    文章转自微信公众号 机器学习炼丹术 作者 陈亦新 欢迎交流共同进步 联系方式 微信cyx645016617 学习论文 Analyzing and Improving the Image Quality of StyleGAN 文章目录 4
  • vue学习语法校验笔记总结

    vue语法校验需要安装eslint plugins vue插件 插件安装完成后 进入 插件配置 即可找到刚才安装插件 它的对应的配置文件是 eslintrc js 选项对应说明如下 module exports extends plugin
  • ES6之Map和Set有什么不同?

    一 Map 1 定义 Map是ES6提供的一种新的数据结构 它是键值对的集合 类似于对象 但是键的范围不限于字符串 各种类型的值都可以当做键 Object结构是 字符串 值 的对应 Map结构则是 值 值 的对应 2 代码示例 Map本身是
  • Mybatis的注解方式开发

    目录 一 环境搭建与测试 二 注解方式的单表CRUD 三 注解方式的复杂关系映射 属性与列的对应关系 多表查询 一对一 一对多 四 注解方式使用二级缓存 前面的文章使用的都是XML配置的方式进行开发 当然 Mybatis也可以使用注解的方式
  • c++ for循环的新写法

    for循环遍历一个数组 string类 vector类等 老写法 include
  • gzip压缩的json文件在谷歌浏览器(chrome)中可以正常解析,但是在safari浏览器乱码

    gzip压缩的json文件在谷歌浏览器 chrome 中可以正常解析 但是在safari浏览器乱码 挺奇怪的一个问题 json数据通过gzip压缩之后 axios接收到的数据在chrome中是正常的 但是在safari中却是乱码 文件流 后
  • jsp页面中获取参数值

    1 GET方法用根据URL获取参数值 1 1 jsp页面 1 2 3 6 7 8 9 10
  • oracle 不完整恢复,Oracle——不完全恢复

    不完全恢复分为用户不完全恢复和RMAN不完全恢复 若联机重做日志文件或者归档日志文件有丢失 则只能进行不完全恢复 一 不完全恢复的分类 1 time recover选项 指定恢复到某个时间点 常用 2 cancel recover选项 停止
  • buuctf - crypto - Rabbit

    rabbit 加解密 在线Rabbit加密 Rabbit解密 在线工具
  • 把路由器设置为交换机或者二级路由设置联网

    五台电脑用了一个路由 还有一台没有连上 结果又买了一个路由 问问能把剩下的电脑接上吗 该怎么接法 1 做二级路由 把第二個路由器作为二级路由用 接线的方法就像你接第一个主路由器那样 从第一个路由器LAN口出来的一条网线接在第二个路由器的WA
  • 姿态估计之2D人体姿态估计 - (OpenPose) Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

    参见 论文翻译 openpose magic ll的博客 CSDN博客 OpenPose论文解读 知乎 Openpose论文阅读 jmucvm的博客 CSDN博客 openpose论文总结 htt789的博客 CSDN博客 OpenPifP
  • ELK配置记录(filebeat+kafka+Logstash+Elasticsearch+Kibana)

    一 简介 elk日志平台 日志收集 分析和展示的解决方案 满足用户对 志的查询 排序 统计需求 elk架构 filebeat 采集 kafka Logstash 管道 Elasticsearch 存储 搜索 Kibana 日志应用 各组件功
  • 离散仿真引擎基础作业与练习

    作业内容 一 简答题 1 解释 GameObjects 和 Assets 的区别与联系 2 下载几个游戏案例 分别总结资源 对象组织的结构 3 使用 debug 验证 MonoBehaviour 基本行为或事件触发条件 4 了解 GameO
  • zip.h解析

    返回值 define ZIP OK 0 define ZIP EOF 0 define ZIP ERRNO Z ERRNO define ZIP PARAMERROR 102 define ZIP BADZIPFILE 103 define
  • 《区块链技术与应用》学习笔记10——ETH数据结构

    在以太坊中 有三棵树的说法 分别是状态数 收据树和交易树 一 引入 我们要实现从账户地址到账户状态的映射 在以太坊中 账户地址为160位 表示为40个16进制数 状态包含了余额 alance 交易次数 nonce 合约账户中还包含了code