redis实现布隆过滤器

2023-05-16

Redis是一种基于内存的数据存储系统,具有高性能、高可用性、高扩展性等特点,因此被广泛用于实现布隆过滤器。

以下是一种基于Redis实现布隆过滤器的方案:

  1. 创建一个长度为m的位数组(bit array),并将所有位初始化为0。

  2. 选择k个不同的哈希函数,每个哈希函数可以将输入的字符串映射到位数组中的一个位置。

  3. 对于每个要加入布隆过滤器的字符串,将其分别传入k个哈希函数中,得到k个位置,并将这些位置上的位都设为1。

  4. 对于每个要查询的字符串,同样将其传入k个哈希函数中,得到k个位置,检查这些位置上的位是否都为1。如果存在某个位置上的位为0,则可以确定该字符串不在布隆过滤器中;如果所有位置上的位都为1,则可能存在误判,即该字符串可能在布隆过滤器中。

在Redis中,可以使用位操作命令bitop和bitcount实现上述操作。具体实现方式如下:

        1.创建一个长度为m的位数组,可以使用Redis的setbit命令将所有位初始化为0。

setbit my_filter 0 0    // 将my_filter中所有位都设置为0

        2.选择k个不同的哈希函数,并将每个字符串分别传入这k个哈希函数中,得到k个位置。可以使用Redis的bitop命令将这些位置上的位都设为1。例如,假设第一个字符串为"foo",k为3,哈希函数为h1、h2和h3,则可以执行以下命令:

bitop or my_filter h1("foo") h2("foo") h3("foo")    // 将my_filter中三个位置上的位都设为1

        3.对于每个要查询的字符串,同样将其传入k个哈希函数中,得到k个位置,检查这些位置上的位是否都为1。可以使用Redis的bitcount命令获取一个二进制字符串中为1的位数。例如,假设要查询的字符串为"bar",k为3,哈希函数为h1、h2和h3,则可以执行以下命令:

bitcount my_filter h1("bar") h2("bar") h3("bar")    // 获取my_filter中三个位置上为1的位数

如果所有位置上的位都为1,则可能存在误判;否则,可以确定该字符串不在布隆过滤器中。

需要注意的是,由于布隆过滤器存在误判的可能性,因此在使用时需要根据实际情况进行调整。同时,为了避免哈希函数之间的冲突,需要选择一组不同的哈希函数,并确保哈希函数的散列函数的输出值的分布尽可能均匀,以减少误判的可能性。此外,为了降低误判率,可以适当增加位数组的长度或选择更多的哈希函数。但是,这样也会增加存储和计算的成本,因此需要在误判率和资源消耗之间进行权衡。

下面是一个基于Java的Redis布隆过滤器的示例代码:

import redis.clients.jedis.Jedis;

public class RedisBloomFilter {
    private Jedis jedis; // Redis客户端对象
    private int m; // 位数组长度
    private int k; // 哈希函数个数

    /**
     * 构造函数
     * @param jedis Redis客户端对象
     * @param m 位数组长度
     * @param k 哈希函数个数
     */
    public RedisBloomFilter(Jedis jedis, int m, int k) {
        this.jedis = jedis;
        this.m = m;
        this.k = k;
    }

    /**
     * 添加字符串到布隆过滤器
     * @param str 待添加的字符串
     */
    public void add(String str) {
        for (int i = 0; i < k; i++) {
            int index = hash(str, i) % m;
            jedis.setbit("my_filter", index, true);
        }
    }

    /**
     * 判断字符串是否存在于布隆过滤器中
     * @param str 待查询的字符串
     * @return true表示可能存在,false表示一定不存在
     */
    public boolean contains(String str) {
        for (int i = 0; i < k; i++) {
            int index = hash(str, i) % m;
            if (!jedis.getbit("my_filter", index)) {
                return false;
            }
        }
        return true;
    }

    /**
     * 哈希函数
     * @param str 输入字符串
     * @param i 哈希函数序号
     * @return 哈希值
     */
    private int hash(String str, int i) {
        switch (i) {
            case 0:
                return str.hashCode();
            case 1:
                return MurmurHash.hash32(str.getBytes(), str.length(), 0xabcdef);
            case 2:
                return FNVHash.fnv1a_32(str.getBytes(), str.length());
            default:
                throw new IllegalArgumentException("Unsupported hash function");
        }
    }
}

其中,MurmurHash和FNVHash是两种哈希函数实现,可以从网络上找到其代码实现。

使用时,可以创建一个RedisBloomFilter对象,并调用其add方法添加字符串,或调用其contains方法查询字符串是否存在于布隆过滤器中。例如:

Jedis jedis = new Jedis("localhost", 6379);
RedisBloomFilter filter = new RedisBloomFilter(jedis, 1000000, 3);
filter.add("foo");
filter.add("bar");
System.out.println(filter.contains("foo")); // 输出true
System.out.println(filter.contains("baz")); // 输出false

需要注意的是,由于Redis是基于内存的存储系统,因此当存储的数据

量较大时,可能会对系统性能产生较大的影响。此外,在布隆过滤器中添加元素时,如果某个位已经被标记为1,则后续添加元素时可能会误判为已经存在。因此,应该根据实际需求选择合适的位数组长度和哈希函数个数,以及适时清空布隆过滤器中的位数组。

另外,需要注意的是,布隆过滤器在使用中可能会产生一定的误判率,即某个字符串被判定为存在于布隆过滤器中,但实际上并没有添加过。误判率的大小与位数组长度和哈希函数个数有关,通常可以通过数学模型计算得出。因此,在使用布隆过滤器时,应该根据实际情况设置合理的误判率,并在程序中对误判进行处理。

总之,Redis布隆过滤器是一种高效、低存储、低延迟的数据过滤器,适用于去重、缓存和限流等场景。通过合理地设置位数组长度和哈希函数个数,并在使用过程中注意误判率和性能问题,可以在保证准确性的同时提高系统的效率。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

redis实现布隆过滤器 的相关文章

  • linux中的文件移动

    Linux不同于Windows xff0c 在Windows操作系统中我们只需要傻瓜式的将文件用鼠标拖到目标文件夹即可 xff0c 但是在Linux中移动文件却不是那么的简单 以Ubuntu16 04为例说一下Linux中的文件的移动 1
  • android顶部回退按钮的实现

    最近看来好多关于android顶部导航栏回退的实现 如下图效果 点击返回上级页面 xff0c 网上的大部分都实现特别繁琐 xff0c 其实安卓自带BUFF 在Manifest清单文件中一句代码就能搞定 xff0c 特别easy xff0c
  • 树莓派与Android客户端进行socket通信

    首先 xff0c 需要对树莓派进行配置 xff0c 使其成为AP热点 xff0c 这里我用的树莓派3B自带wifi蓝牙模块 xff0c 树莓派3B作AP热点的方法具体参考https blog csdn net u014271612 arti
  • android客户端控制树莓派GPIO点亮LED灯

    首先需要android客户端与树莓派进行连接 xff0c 树莓派与android客户端利用wifi连接并进行socket通信请参考我的另一片文章 xff1a https mp csdn net postedit 79911322 树莓派与A
  • 百度2014校园招聘 软件研发工程师 笔试题

    一 简答题 xff08 本题共30 xff09 1 动态链接库和静态链接库分别有什么优缺点 xff1f xff08 10 xff09 2 轮询任务调度与抢占式任务调度的区别 xff1f xff08 10 xff09 3 请列出数据库中常用的
  • java基础编程案例

    java编程案例 案例一 xff1a 飞机票查看优惠系统案例二 xff1a 获取素数案例三 xff1a 验证码模块案例四 xff1a 数组元素的复制案例五 xff1a 评委打分案例六 xff1a 数字加密程序案例七 xff1a 模拟双色球系
  • Java基础之集合框架--Collections工具类之max()方法

    max 方法一个参数的源码 xff1a public static lt T extends Object amp Comparable lt super T gt gt T max Collection lt extends T gt c
  • python创建一个txt文件

    创建一个txt文件 xff0c 文件名为mytxtfile 并向文件写入msg 注意文件的路径不要错 xff0c 还有文件的格式 创建一个txt文件 xff0c 文件名为mytxtfile 并向文件写入msg def text create
  • Android--Jetpack的使用(一)

    目录 1 ViewModel 2 ViewModel 43 LiveData 3 ViewModel 43 LiveData 43 dataBinding 4 ViewModel 43 SavedStateHandle 43 LiveDat
  • Git 常用命令

    一 Git常用命令 1 配置用户名 xff08 上传代码的用户名 xff09 xff1a git config global user name 34 ljs 34 2 配置用户邮箱 xff08 其他作者联系你的邮箱 xff09 xff1a
  • 游戏开发图书推荐--我读过的技术经典图书

    很多同学问我学游戏开发应该看些什么书 xff0c 我在这里抛砖引玉 xff0c 给一份推荐表 xff0c 希望大家共同提高 由于本人英文不太好 xff0c 推荐的大部书籍都是国人编写的 xff0c 有些经典的外文图书可能是翻译不好 xff0
  • Git中使用.gitignore忽略文件的推送

    1 简介 在使用Git管理自己的代码版本时 xff0c 由于编译生成的中间文件 xff0c Git使用SHA 1算法来对文件进行加密 xff0c 进而得出来一个40位的十六进制加密字符串 325525d8b1f67b5ddd37956a8a
  • AFNetWorking3.0处理请求头和请求内容

    今天要处理用户的相关信息 xff0c 需要在HTTP请求中添加请求头 xff0c 网上大部分资料都是针对AFNetWorking2 0的 xff0c 我用3 0版本实现了相关功能 xff0c 见下面代码 首先是请求的URL xff0c sp
  • chrome浏览器安装插件,提示程序包无效

    chrome浏览器安装插件的时候 xff0c 如果提示 程序包无效 xff1a CRX HEADER INVALID xff0c 导致插件安装不上去 xff0c 这个时候该怎么办呢 xff1f 通常 xff0c 这种错误在chrome浏览器
  • viewpage+radiogroup

    lt xml version 61 34 1 0 34 encoding 61 34 utf 8 34 gt lt LinearLayout xmlns android 61 34 http schemas android com apk
  • 线程执行设置超时时间

    import java util concurrent 记录 xff0c 备忘 线程执行设置超时时间 public class Main2 定义线程池 xff0c 推荐手动创建线程池 xff1a https blog csdn net LL
  • Java集合工具类Collections常用方法详解

    文章目录 1 Collections介绍2 Collections常用方法2 1 reverse 2 2 sort 2 3 swap 2 4 min 和max 2 5 copy 2 6 fill 2 7 replaceAll 2 8 shu
  • 智慧小区智能物业管理系统综合解决方案

    因为传统的办公方式效率低 xff0c 工作强度大 人们需耗费大量的时间和精力去手工处理那些繁杂 重复的工作 xff0c 而手工处理的延时和差错 xff0c 正是现代化管理中应该去除的弊端 又由于物业管理企业的启动基金不足 xff0c 多种经
  • LAMP基础搭建

    目录 一 LAMP 1 LAMP环境 2 组成部分 xff08 1 xff09 Linux xff08 平台 xff09 xff08 2 xff09 Apache xff08 前台 xff09 xff08 3 xff09 Mysq xff0
  • python获取子窗口句柄

    2022 09 17 python获取子窗口句柄 python获取窗口句柄 python获取进程 python获取电脑微信小游戏的窗口句柄 上图为按键精灵的工具 python3 xff0c 简单的获取了下句柄 xff0c 想改改内存的 xf

随机推荐

  • Linux多线程编程(三)-----生产者与消费者(条件变量,信号量)

    Linux多线程编程 xff08 一 xff09 xff1a http blog csdn net llzk article details 55670172 Linux多线程编程 xff08 二 xff09 xff1a http blog
  • 微策略的笔试题

    觉得在收获Offer的季节应该为自己积累些人品了 xff0c 在这里将今天的情况向所有求Offer的童鞋分享下 从上个周末开始反应迟钝的我终于有了些求Offer的感觉 xff0c 几天参加了4场面试 xff0c 基本上没觉得有很大的挑战 x
  • 线程池定时任务添加任务以及停止线程

    最近有个需求 就是项目启动的时候需要创建个线程池去执行 而且有时间周期 而且根绝不同的情况可以随时通过接口停止该线程 1首先创建个线程池 默认核心为10 static ScheduledExecutorService threadPool
  • 冰冻三尺非一日之寒-自学篇 浅谈个人学习方法

    昨晚还在看比赛 xff08 war3 xff09 xff0c 小源跑过来问我明天1024 xff0c 不写篇文章么 xff0c 想想也是 xff0c 1024这也算个热点 xff0c 赶紧来蹭蹭 xff0c 哈 xff0c 开个玩笑 上次谈
  • 【附源码】Java计算机毕业设计社区团购服务系统(程序+LW+部署)

    项目运行 环境配置 xff1a Jdk1 8 43 Tomcat7 0 43 Mysql 43 HBuilderX xff08 Webstorm也行 xff09 43 Eclispe xff08 IntelliJ IDEA Eclispe
  • iOS---iOS10适配iOS当前所有系统的远程推送

    一 iOS推送通知简介 众所周知苹果的推送通知从iOS3开始出现 每一年都会更新一些新的用法 譬如iOS7出现的Silent remote notifications 远程静默推送 iOS8出现的Category 分类 也可称之为快捷回复
  • iOS总结_UI层自我复习总结

    UI层复习笔记 在main文件中 xff0c UIApplicationMain函数一共做了三件事 根据第三个参数创建了一个应用程序对象 默认写nil xff0c 即创建的是UIApplication类型的对象 xff0c 此对象看成是整个
  • 【疯狂造轮子-iOS】JSON转Model系列之一

    1 前言 之前一直看别人的源码 xff0c 虽然对自己提升比较大 xff0c 但毕竟不是自己写的 xff0c 很容易遗忘 这段时间准备自己造一些轮子 xff0c 主要目的还是为了提升自身实力 xff0c 总不能一遇到问题就Google 之前
  • 解决fastboot 刷 system.img 尺寸限制问题

    fastboot S xxxM flash system system img 其中 S 后面为单次上传大小 C platform tools gt fastboot S 300M flash system system img sendi
  • 修改Gnome Terminal窗口的默认大小

    修改Gnome Terminal窗口的默认大小 以前一直比较别扭的是 xff0c Gnome Terminal窗口打开时总那么小 曾经找半天也不知道在哪里改 xff0c 甚至在官方论坛里也没查到 今天偶然间想到那个Preferred App
  • 前端基础练习题

    变量命名规则 xff1a 1 只能由字母 数字 下划线 美元符号组成 xff0c 并且不能以数字开头 2 变量命名要有意义 xff0c 杜绝a01 b0046 3 变量遵循小驼峰规则 第一个单词全小写 xff0c 从第二个单词开始 xff0
  • Unity5-ABSystem(三):AssetBundle加载

    Unity特殊路径 ResourcesStreamingAssetsPathPersistentDataPathDataPath 同步加载 核心函数安卓平台下不能同步加载问题示例 异步加载 核心函数示例WWW异步加载 资源加载 核心函数 加
  • Unity5-ABSystem(五):AssetBundle内存

    AssetBundle内存占用 建议 实测 www加载实测LoadFromFile加载实测 建议 AssetBundle内存占用 先上图 xff0c Don t panic 我们从AssetBundle中加载资源一般会经过三个步骤 xff1
  • Java中String字符串长度

    String类是Java中最为常用的类 xff0c 我们知道String是个final类 xff0c 不能修改内容 但是String类型是否有长度限制呢 xff0c 下面来一探究竟 想要搞清楚这个问题 xff0c 首先我们需要翻阅一下Str
  • 安装BBR时出现Error: Install elrepo failed, please check it.

    安装BBR时出现Error Install elrepo failed please check it Press any key to start or Press Ctrl 43 C to cancel curl 35 SSL conn
  • mac卸载mysql教程(按照步骤可完全卸载)

    Mac下卸载mysql的方法 xff1a 大部分卸载是因为版本高 1 关闭mysql 查看mysql是否启动 xff1a ps ef grep mysql 2 输入 xff1a kill 9 然后回车 xff0c 关闭mysql 3 卸载
  • 全网最简单Win10桌面美化教程,只需4步!!

    时间过得真滴快呀 xff01 咋眼就10月了 不知道国庆期间 小伙伴们是外出旅游 还是宅在家里哪里也没去 或者更悲催一点 还在国庆加班抑或因为疫情正在隔离 无论大家处于任何状态 小七都要在这里祝大家 xff1a 国庆节快乐 吉祥话说完了 下
  • Pycharm配置Jupyter Notebook实现本地开发与调试

    Pycharm专业版中集成了Jupyter Notebook xff0c 方便用户编辑 xff0c 执行和调试Notebook代码 xff0c 并检查执行输出 个人感觉 xff0c 相比于Jupyter提供的网页编辑器 xff0c Pych
  • Zookeeper选举机制介绍

    ZooKeeper是一个高可用的分布式协调服务 xff0c 它的核心功能之一就是选举机制 当ZooKeeper集群中的一个节点宕机时 xff0c 需要通过选举机制来选出一个新的leader节点 xff0c 确保集群的正常运行 下面是ZooK
  • redis实现布隆过滤器

    Redis是一种基于内存的数据存储系统 xff0c 具有高性能 高可用性 高扩展性等特点 xff0c 因此被广泛用于实现布隆过滤器 以下是一种基于Redis实现布隆过滤器的方案 xff1a 创建一个长度为m的位数组 xff08 bit ar