滚动校验(Rolling Checksum)算法

2023-05-16

滚动校验(Rolling Checksum)算法

Rsync中使用了一种滚动检验(Rolling Checksum)算法,用于快速计算数据块的检验值。它是一种弱校验算法,采用的是Mark Adler的adler-32校验,它的定义如下:

       a(k, l) = (∑Xi)  mod M

       b(k, l) = (∑(l - i +1)Xi) mod M

       s(k, l) = a(k, l) + 216 b(k, l)

上面公式中,s(k, l)表示数据块Xk, ..., Xl的滚动校验值,为了简化以及计算速度考虑,M取值为216。这种校验计算公式具有一个非常关键的特性,那就是后续校验值可以通过递推关系高效地计算获得。

      a(k+1, l+1) = (a(k, l) - Xk + Xl+1)) mod M

      b(k+1, l+1) = (b(k, l) - (l - k +1)Xk + a(k+1, l+1)) mod M

      s(k+1, l+1) = a(k+1, l+1) + 216 b(k+1, l+1)

因此,给定X1, ..., Xn的校验值,X1以及Xn+1,我们就可以快速地计算出X2, ..., Xn+1校验值。这样,利用这种性质我们就可以高效地计算数据块连续校验值,大幅减少checksum计算量。dedup util中,我在CDC和Sliding-block文件分块处理中使用了该校验值算法,性能得到大幅提升。

 

附Adler32_checksum算法实现:

[cpp]  view plain copy print ?
  1. /* 
  2.  *   a simple 32 bit checksum that can be upadted from either end 
  3.  *   (inspired by Mark Adler's Adler-32 checksum) 
  4.  */  
  5. unsigned int adler32_checksum(char *buf, int len)  
  6. {  
  7.     int i;  
  8.     unsigned int s1, s2;  
  9.     s1 = s2 = 0;  
  10.     for (i = 0; i < (len - 4); i += 4) {  
  11.         s2 += 4 * (s1 + buf[i]) + 3 * buf[i+1] + 2 * buf[i+2] + buf[i+3] +  
  12.           10 * CHAR_OFFSET;  
  13.         s1 += (buf[i+0] + buf[i+1] + buf[i+2] + buf[i+3] + 4 * CHAR_OFFSET);  
  14.     }  
  15.     for (; i < len; i++) {  
  16.         s1 += (buf[i]+CHAR_OFFSET);  
  17.         s2 += s1;  
  18.     }  
  19.     return (s1 & 0xffff) + (s2 << 16);  
  20. }  
  21. /* 
  22.  * adler32_checksum(X0, ..., Xn), X0, Xn+1 ----> adler32_checksum(X1, ..., Xn+1) 
  23.  * where csum is adler32_checksum(X0, ..., Xn), c1 is X0, c2 is Xn+1 
  24.  */  
  25. unsigned int adler32_rolling_checksum(unsigned int csum, int len, char c1, char c2)  
  26. {  
  27.         unsigned int s1, s2, s11, s22;  
  28.         s1 = csum & 0xffff;  
  29.         s2 = csum >> 16;  
  30.         s1 -= (c1 - c2);  
  31.         s2 -= (len * c1 - s1);  
  32.         return (s1 & 0xffff) + (s2 << 16);  
  33. }  


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

滚动校验(Rolling Checksum)算法 的相关文章

  • jar包和war包区别以及怎么部署

    什么是war和jar xff1f war包 是做好一个web应用后 xff0c 通常是网站 xff0c 打成包部署到容器中 jar包 xff1a 通常是开发时要引用通用类 xff0c 打成包便于存放管理 怎么打包 xff1f IDEA上面菜
  • cookie和session

    由于http是无状态的 xff0c 也就是不能做到会话保持 xff0c 那么就需要引入cookie和session来做会话保持 xff0c 存储用户信息 cookies是一种WEB服务器通过浏览器在访问者的硬盘上存储信息的手段 IE浏览器把
  • Sprinig Boot + Redis 如何实现接口幂等性

    幂等性 通俗的说就是一个接口 多次发起同一个请求 必须保证操作只能执行一次 可能出现的问题 xff1a 订单接口 不能多次创建订单 支付接口 重复支付同一笔订单只能扣一次钱 回调接口 可能会多次回调 必须处理重复回调 普通表单提交接口 因为
  • 线程池面试

    一 线程池是什么 线程池 xff08 Thread Pool xff09 构造参数有8个 xff0c 但是最核心的是3个 xff1a corePoolSize核心数 maximumPoolSize最大线程数 xff0c workQueue任
  • Raft的PreVote实现机制

    Raft的PreVote实现机制 1 背景 在Basic Raft算法中 xff0c 当一个Follower与其他节点网络隔离 xff0c 如下图所示 xff1a Follower 2在electionTimeout没收到心跳之后 会发起选
  • C、Java、Python到底优劣在哪里?

    C C是大部分转行编程或者是入门学习人员最开始接触的语言 xff0c 虽说C语言在内存管理上存在严重的缺陷 xff0c 尤其是 0 的设计被很多人吐槽是最大的败笔 xff0c 但是毫无疑问 xff0c 对那些要求最高的效率 xff0c 良好
  • LWIP 单网口多IP地址

    空间 ethernet input struct pbuf p struct netif netif 此函数有两个参数 xff0c p指向接收到的网络数据 xff0c netif则是指示哪个网络接口收到的数 据 xff0c 但是在LWIP内
  • C/C++优秀书籍清单

    转载自 xff1a https www cnblogs com kimiway p 3225767 html 书籍是码农进步的阶梯 读好书 好读书 干一行爱一行 除了工作还有生活 在陪伴家人同时 也不忘提高自己 为更好的生活努力 1 C程序
  • 一完整的HTTP事务是怎样的过程

    原文地址 xff1a http www cnblogs com renfanzi p 5838446 html 阅读目录 一次完整的HTTP事务是怎样一个过程 xff1f 一 域名解析 二 发起TCP的三次请求 TCP 为什么需要3次握手
  • Centos8中安装jdk1.8

    CentOS8 中原有安装OpenJDK1 8 属于JRE版本 xff0c 当前在编译打包Maven工程时报错 xff0c 查看错误原因 xff0c JAVA环境不满足导致编译失败 卸载系统自带OpenJDK xff0c 重新安装 卸载Op
  • 问vimscript转lua原因

    开始 xff1a 原以为是脚本语言翻译过去 xff0c 就是换lua了 xff0c 结果是错误的 问题 xff1a 转换的意义是什么 答案 xff1a 所有插件全部换lua写的提升性能 xff0c 部分插件使用原有的 官方资源 xff1a
  • iphone摄像头代替matebook 14D

    第一步下载软件 第二步 手机与电脑 连接同一个wifi 第三步 查看iphoneip 电脑软件录入ip
  • android安全框架工具drozer使用指南

    不贴图 xff0c 太麻烦 一 Drozer 工作环境搭建 下载drozer installer 2 3 4 zip 2 xff0c 解压缩 3 xff0c winddows上安装setup exe 手机安全agent apk 4 手机打开
  • FTP上传中文设置

    package com wq test import java io File import java io FileInputStream import org apache commons net ftp FTPClient impor
  • FTP上传中文文件到中文路径

    package com wq test import java io File import java io FileInputStream import org apache commons net ftp FTPClient impor
  • leveldb之log文件

    leveldb之log文件 1 log文件在LevelDb中的主要作用是系统故障恢复时 xff0c 能够保证不会丢失数据 因为在将记录写入内存的Memtable之前 xff0c 会先写入Log文件 xff0c 这样即使系统发生故障 xff0
  • springboot @Slf4j 只显示Error 日志,不显示INFO日志 和DEBUG 日志

    问题 xff1a springboot 使用 64 Slf4j 注解的 log debug log info log error 只显示ERROR日志 xff0c 不显示DEBUG和INFO日志 原因 xff1a application p
  • 盘点 | 2023年最值得学的编程语言TOP 5,Python再度夺冠!

    前言 在技术的推动发展中 xff0c 编程语言的作用功不可 目前在技术领域约有600种语言 xff0c 人们对编程语言的认识和掌握情况每年都在变化 与此同时 xff0c 新兴的编程语言往往具有引人注目的元素和功能 2023年热门的编程语言有
  • python socke ftp功能实现 shell命令,上传,下载

    python socke ftp功能实现 shell命令 xff0c 上传 xff0c 下载 网上教程多 xff0c 但是都不全 xff0c 只有下载代码 本人练习 xff0c 附加了注释 xff0c 帮助新人练习 一定要吃透socket来
  • jumpserver 修改源码实现密钥+密码

    背景 云主机登录 密钥 43 密码 xff0c jumpserver登录只能配置自动登录 xff0c 或者手动登录不能满足 修改 如果设置密码为chongzhi 就必须重新录入密码 vi opt coco coco proxy py 39行

随机推荐

  • uml学习过程7-顺序图

    描述强调消息时间顺序的交互图 对象 对象生命周期 消息 对象创建与销毁 动态建模 xff1a 顺序图 圆柱 xff1a 调用类 不表达逻辑判断 xff1a 例如 密码错误 xff0c 非空判断 这些用于活动图表达
  • springmvc错误跳转页面

    在做一个项目的时候 xff0c 为了界面美观及用户体验 xff0c 我们往往会设计自己的错误跳转页面 xff0c 而不是直接展示给用户一堆错误码 xff0c 为此我们需要配置自己的错误跳转页面 1 项目结构 2 web xml lt DOC
  • 下载进度条

    span class token doctype span class token punctuation lt span span class token doctype tag DOCTYPE span span class token
  • 域名绑定到github主页

    最近在通过网上的教程搭建自己的github主页 xff0c 虽然现在也是半成品 xff0c 但是其中有一些步骤以及参考的连接还是值得分享一下的 首先在godaddy上购买的 com域名 xff0c 因为看见大家都说购买国内的域名需要备案之类
  • c++面试宝典

    目录 一 多线程 二 指针 三 字符串 四 面向对象 五 基本用法 六 c 43 43 11 七 算法 c 43 43 面试必考多线程 xff0c 内存 xff08 智能指针 xff09 xff0c 常见算法 xff0c 设计模式 一 多线
  • ssh远程执行命令的方法

    设置免密登录之后 xff0c 通常ssh remote ip command 就可以方便的执行远程命令 如果遇到包含单引号或者双引号的命令 xff0c 执行不成功 xff0c 如 xff1a awk F 39 39 39 print 1 3
  • [海外上架必备][Android]Google原生代码崩溃符号生成的问题

    默认情况下 xff0c 原生代码库已从应用的发布 build 中移除 此移除操作包括移除应用所使用的所有原生库中包含的符号表及调试信息 移除原生代码库会显著缩减大小 xff1b 但是 xff0c 由于缺少信息 xff08 例如类和函数名称
  • “应版权方要求,文件无法下载”的解决方案

    应版权方要求 xff0c 文件无法下载 的解决方案 参考文章 xff1a xff08 1 xff09 应版权方要求 xff0c 文件无法下载 的解决方案 xff08 2 xff09 https www cnblogs com easyide
  • 分布式系统核心—日志

    分布式系统的核心组件 日志 有时也叫write ahead logs commit logs 或者事物 logs 通常指在应用所有的修改之前先写入日志 xff0c 一般会将重放日志 撤销日志都写进去 NoSQL数据库 KV存储 Hadoop
  • ctags使用方法 ctags的使用方法

    用 ctags 看代码时 xff0c 检索函数及变量使用的文件是 tags 文件 有时我们会定制检索的文件范围 xff0c 这时候就可以通过 ctags 命令的一些参数来控制 tags 文件的内容 1 xff1a 递归检索当前目录以下所有默
  • AFNetworking 介绍和简单实用

    AFNetworking github AFNetworking AFNetworking 是一个网络请求封装框架 xff0c 使用简单 xff0c 功能强大 xff1b 在AFNetworking 3 x版本 通过封装NSURLSessi
  • Tomcat端口冲突的解决方法

    1 输入以下两条命令 span class ruby span class hljs number 1 span dos窗口中输入 xff1a netstat ano findstr span class hljs number 8080
  • Spring 框架介绍和使用

    微信公众号 xff1a 运维开发故事 xff0c 作者 xff1a 老郑 历史的选择 Spring 作为一个基础的框架 xff0c 是在 Java EE 开发历史中 xff0c 是成千上万公司选择 单独使用 Spring 的非常少了 xff
  • xshell无法调用图形化的解决方法

    在xshell无法调用图形化界面 xff0c 使用VNC服务 xshell中调用图形化界面需要2个地址互通 xff0c 只有一端通无法传输图形化界面 xff08 本地没有获取IP xff09 但是vnc只需要和服务器端连通即可 1 首先我们
  • python3+requests请求方式application/x-www-form-urlencoded传递数组Arrary

    python3 43 requests传递比较简单的key value格式数据比较简单 导入 requests 包 import requests 表单参数 xff0c 参数名为 fname 和 lname myobj 61 39 fnam
  • 用Java远程执行shell命令出现java: command not found

    一 问题发现 xff1a 在使用jsch远程调用shell命令时 xff0c 提示java command not found 这个错误的意思是linux的环境变量里没有配置JAVA HOME的内容 但是我在Linux上查看了一下环境变量
  • Android Design Support Library

    1 Navigation View 对于应用程序 xff0c 它代表着一个标准的导航菜单 菜单内容可以由菜单资源文件填充 NavigationView通常放在一个DrawerLayout里面 lt xml version 61 34 1 0
  • 日常问题:解决nested exception is org.apache.ibatis.executor.ExecutorException: No constructor found问题

    今天在调试上周编写好得代码程序的时候 xff0c 在执行到mybatis获取某行数据转换成自定义的类型时 xff0c 抛出了异常 xff1a nested exception is org apache ibatis executor Ex
  • Abort message: ‘FORTIFY: FD_SET: file descriptor 1070 >= FD_SETSIZE 128‘

    问题现象 压力测试骁龙相机 xff0c 发现camera provicer 进程崩溃 无法正常打开相机 xff0c 只有重新启动设备 相关的log xff1a 03 23 08 17 08 592 15634 15634 F DEBUG s
  • 滚动校验(Rolling Checksum)算法

    滚动校验 Rolling Checksum 算法 Rsync中使用了一种滚动检验 Rolling Checksum 算法 xff0c 用于快速计算数据块的检验值 它是一种弱校验算法 xff0c 采用的是Mark Adler的adler 32