我正在了解 ZooKeeper 并查看备份 ZooKeeper 中存储的数据的选项。 ZooKeeper写入两个数据文件,快照和事务日志。人们经常提到快照是“模糊的”,需要在它们上重放事务日志以获得最新状态。
对于观察者来说,没有事务日志被保存到磁盘上。如果我要获取观察者(或没有事务日志的领导者/追随者)写入的快照,并将其放入新的独立 ZooKeeper 中,ZooKeeper 的状态是否能保证与快照写入磁盘时的状态相同?
换句话说,要将 ZooKeeper 备份到当前状态,您需要快照和事务日志。如果我满足于仅备份到拍摄快照的时间,那么仅快照就足够了吗?
不。快照文件不足以保证返回到之前的状态。事实上,快照文件甚至可能不代表树在任何时间点的状态。
来自 O'Reilly ZooKeeper 书中:
让我们通过一个例子来说明这一点。假设数据树只有两个 znode:/z 和 /z'。最初,/z 和/z' 的数据都是整数 1 现在考虑以下步骤序列:
- 开始快照。
- 序列化并将 /z = 1 写入快照。
- 将/z的数据设置为2(事务T)。
- 将/z'的数据设置为2(事务Tʹ)。
- 序列化并将 /z' = 2 写入快照。
该快照包含 /z = 1 和 /z' = 2。但是,从来没有一个时间点两个 znode 的值是这样的。不过,这不是问题,因为服务器会重播事务。它使用快照启动时已提交的最后一个事务来标记每个快照 - 称之为 TS。如果服务器最终加载快照,它将重播事务日志中 TS 之后的所有事务。在这种情况下,它们是 T 和 Tʹ 。在快照之上重放 T 和 Tʹ 后,服务器获得 /z = 2 和 /z' = 2,这是有效状态。
您可能会发现 ZooKeeper 数据结构中模糊快照是可以接受的,但如果您想保证有效的树,请同时获取快照和事务日志。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)