【数据结构】HashMap

2023-11-12

参数

DEFAULT_INITIAL_CAPACITY

MUST be a power of two.

默认值为1<<4,aka16。

MAXIMUM_CAPACITY

MUST be a power of two <= 1<<30.

  1. HashMap规定了其容量必须是2的n次方,所以用位运算<<来控制HashMap的大小更方便,还提高了Java的处理速度。
  2. HashMap内部由Entry[]数组构成,而Java的数组下标是由Int表示的,所以HashMap最大的容量应该是不超过int最大值的一个2的指数幂,而最接近int最大值的2的指数幂用位运算符表示为1 << 30

ps. 一个4字节整数具有32位,其中数字部分由于有符号位而只能跨越31位,所以最大值是符号位为0,其余位为1的数,即 2 31 − 1 2^{31}-1 2311

loadFactor

即加载因子,默认0.75。
若填充比很大,说明利用的空间很多。
如果一直不进行扩容,链表就会越来越长,查找的效率就会很低。
扩容后,将原来链表数组的每一个链表分成奇偶两个子链表分别挂在新链表数组的散列位置,这就减少了每个链表的长度,增加查找效率。HashMap本来设计是以空间换时间,所以填充比没必要太大,但是填充比太小又会导致空间浪费,因此,若关注内存,填充比可以稍大,若关注查找性能,填充比可以稍小。

initialCapacity

即初始容量。

threshold

当map容量达到这个阈值时要进行resize。

方法

tableSizeFor

作用是返回大于输入参数且最近的2的整数次幂的数,比如输入10则返回16。

  • JDK1.8

    /**
     * Returns a power of two size for the given target capacity.
     */
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
    

    设cap=17,即二进制10001:
    - int n = cap - 1;:n=16,即二进制10000
    - n |= n >>> 1;:即n=10000|1000=11000
    - n |= n >>> 2;:即n=11000|110=11110
    - n |= n >>> 4;:即n=11110|1=11111
    - n |= n >>> 8;:即n=11111|0=11111
    - n |= n >>> 16;:即n=11111|0=11111

    以上操作保证了n的最高非零位后的每一位都是1

  • JDK15

    static final int tableSizeFor(int cap) {
        int n = -1 >>> Integer.numberOfLeadingZeros(cap - 1);
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
    
    • Integer.numberOfLeadingZeros的作用是返回输入参数(int类型)的“最高非零位(包括符号位)前的0的个数”,使用了二分法。
    • cap - 1的原因:主要是因为n + 1
      若不减1,当cap为 2 4 = 16 2^4=16 24=16时,n为-1>>>27,即31,最后返回 2 5 = 32 2^5=32 25=32,但事实上,应该返回16。

hash

该方法叫扰动函数

  • hashCode
    Object类中有一个hashCode()方法,是一个native方法,意味着方法的实现和硬件平台有关,默认实现和虚拟机有关,对于有些JVM,hashCode()返回的就是对象的地址,大多时候,JVM根据一定的规则将与对象相关的信息(比如对象的存储地址、对象的字段等)映射成一个数值并返回,例如HotSpot JVM中生成hash实现:hotspot/src/share/vm/runtime/synchronizer.cpp
    在Java中,hashCode()方法的主要作用是为了配合基于散列的集合(HashSet、HashMap)一起正常运行。当向集合中插入对象时,虽然可以调用equals()来逐个地进行比较,但该方法效率低下,因此,先比较hashCode再调用equals()会快很多。
  • 背景
  1. 若hashMap的Entry数组长度为16,那么就是取hash的低4位作为Entry数组的下标。
  2. 由于覆盖equals()时需要覆盖hashCode(),所以hashCode()有时并不十分完美,比如只和高位有关等等。
  • 问题
    如果只是取最后几位的Hash值的话,那么那些低位相同但高位不同的Hash值就会碰撞了。
    如果散列本身做得不好,分布上成等差数列的漏洞,恰好使最后几个低位呈现规律性重复,这就无比棘手。
  • 解决
    HashMap用了一种办法( 扰动 ):将Hash值的高16位右移(正好是32bit的一半)并与原Hash值取异或运算,这是为了混合原始哈希码的高位和低位,使得混合后的低位掺杂了高位的部分特征,这样高位的信息也被变相保留了下来。
    之所以是异或运算,而不是与或非,是因为&|都会使得结果偏向0或者偏向1。
  • JDK1.7
    static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }
    
    这样设计保证了对象的hashCode的32位值只要有一位发生改变,整个hash()返回值就会改变,高位的变化会反应到低位里。
  • JDK1.8
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    
    这样设计保证了对象的hashCode的高16位的变化能反应到低16位中,相比较而言减少了过多的位运算,是一种折中的设计。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【数据结构】HashMap 的相关文章

  • python使用KDDockWidget

    编译原理 KDDockWidget是一个C 库 通过shiboken转成python的绑定支持 针对特殊版本 需要在cmake文件中增加一些变量 注 本次编译 Qt版本统一指定为6 4 2 库支持Qt gt 5 12或6 2 0以上版本 下
  • yolov5数据集制作

    yolov5 数据集的格式 每个图像的标注信息存储在一个独立的txt文件中 每个txt文件的名称应该与其对应的图像名称相同 只是文件扩展名不同 例如 对于名为 image1 jpg 的图像 其标注信息应存储在名为 image1 txt 的t
  • FPGA微型板Verilog简单音频

    简单音调生成 该模块通过使用一个计数器生成一个1 kHz的信号 该计数器在CLK的每个刻度上都递增 当计数器达到32 000时 将切换输出BUZZER 并将计数器重置为0 音频输出 使用一个1 k 电阻器和一小段实心线将GPIO引脚P97和

随机推荐

  • Nginx多条件IF逻辑运算(与、或操作)不支持问题解决方法

    原文地址 Nginx多条件IF逻辑运算 与 或操作 不支持问题 BIGTREE Nginx配置不支持if条件的逻辑与 逻辑或运算 而且也不支持if嵌套 例如 if e request filename request uri apple b
  • 5 建立业务需求

    业务需求代表的是需求链的顶部 它们定义解决方案的愿景和实现该方案的项目范围 用户需求和功能需求和功能需求必须与业务需求建立的背景和目标保持一致 任何无助于项目达成业务目标的需求都不宜实现 如果项目没有清晰的定义和充分沟通方向 肯定会带来灾难
  • IDEA配置tomcat服务器

    需求背景 从Eclipse转IDEA后面对的第一个问题 就是要为IDEA配置tomcat服务 否则不可用 那么 功能需求 那么 该如何配置呢 1 点击 Edit Configurations 进入tomcat服务编辑页面 如下图所示 2 点
  • 漫谈数据库表设计及索引设计

    一 数据库表设计 在数据库表设计上有个很重要的设计准则 称为范式设计 什么是范式设计 范式来自英文Normal Form 简称NF MySQL是关系型数据库 但是要想设计 个好的关系 必须使关系满足一定的约束条件 此约束已经形成了规范 分成
  • 一阶RC低通滤波器(二)

    这篇文章补充下前面讲的一阶低通滤波器 在母线电压采样或是在电机的三相端电压采样时 往往是先分压 再经过RC低通滤波器 电路图如下 1 先求输出和输入的关系 Uao Ua 从上式可以看出系统相当于一个典型的一阶低通滤波器串联了一个R2 R1
  • python-opencv之形态学操作(腐蚀和膨胀)原理详解

    形态学操作作用 Removing noise Isolation of individual elements and joining disparate elements in an image Finding of intensity
  • frp login to server failed: i/o deadline reached

    使用kcp协议有时会出现这个问题 配置改为tcp即可
  • 【科研入门】会议、期刊、出版社、文献数据库、引文数据库、SCI分区、影响因子等基础科研必备知识

    大家好 我是洲洲 欢迎关注 一个爱听周杰伦的程序员 关注公众号 程序员洲洲 即可获得10G学习资料 面试笔记 大厂独家学习体系路线等 还可以加入技术交流群欢迎大家在CSDN后台私信我 本文目录 一 会议与期刊 二 如何辨别是否正规期刊or会
  • 进阶题解:链表相交,吊打代码随想录

    随想录解法 class Solution public ListNode getIntersectionNode ListNode headA ListNode headB ListNode curA headA ListNode curB
  • #pragma data_seg共享数据使用说明

    用 pragma data seg建立一个新的数据段并定义共享数据 其具体格式为 pragma data seg shareddata HWND sharedwnd NULL 共享数据 pragma data seg 1 pragma da
  • 样本方差为何除以n-1而不是n?

    很多人可能都会有疑问 为什么要除以n 1 而不是n 如果除以n 对样本方差的估计不是无偏估计 比总体方差要小 要想是无偏估计就要调小分母 所以除以n 1 那么问题来了 为什么不是除以n 2 n 3等 所以在这里彻底总结一下 首先交代一下无偏
  • wangEditor富文本编辑器+react+antd的使用

    1 github上发现富文本编辑器 官网地址及github地址 2 结合react antd的具体使用 案例使用场景 MyModal为弹窗 弹窗显示 编辑名称及描述 描述使用wangeditor富文本编辑器实现 MyModal js imp
  • 免费的HTML5连载来了《HTML5网页开发实例详解》连载(六)媒体查询

    响应式设计的另一个重要技术手段是媒体查询 如果只是简单的设计一个流式布局系统 那么可以保证每个网格按比例的放大和缩小 但有可能会使得在小屏幕下 如手机设备 网格太小而严重影响阅读 这样的设计称不上响应式设计 媒体查询可以来解决这一问题 媒体
  • VMware workstation 14.1.8 pro 下载地址 14最新版

    VMware Workstation 14 1 8 Pro 发布于2019年11月12日 官网下载地址如下 https download3 vmware com software wkst file VMware workstation f
  • linux如何查看安装了哪些软件

    linux查看安装了哪些软件的方法 1 利用 rpm qa 命令查看rpm方法安装的软件 2 利用 dpkg l 命令查看deb方法安装的软件 3 利用 yum list installed 命令查看yum方法安装的软件 本教程操作环境 l
  • python爬虫笔记

    python爬虫笔记 找到了一个网址 https blog csdn net belalds article details 80694126 1 使用requests库 import requests 导入requests库 respon
  • MetaMask 添加BSC、Polygon网络配置

    打开浏览器 点击MetaMask插件 选择网络 点击弹窗中的 Add Network 按钮 添加各网络配置如下 1 BSC Binance Smart Chain 主网 key value 网络名称 Network Name Binance
  • python3爬虫 selenium+pyquery爬取人才网简历实战

    不废话 直接贴代码 各位看官要是觉得可以的话 麻烦点个赞 import requests pymysql pyquery time from bs4 import BeautifulSoup from selenium import web
  • 【2022年第十三届蓝桥杯省赛个人题解】

    A 九进制转十进制 5分 题目描述 九进制正整数 2022 9 2022 9 2022 9 转换成十进制等于多少 AC代码 include
  • 【数据结构】HashMap

    文章目录 参数 DEFAULT INITIAL CAPACITY MAXIMUM CAPACITY loadFactor initialCapacity threshold 方法 tableSizeFor hash 参数 DEFAULT I