Java HashMap

2023-11-08

在这里插入图片描述

无知的我终于深入接触到了HashMap。。。。

如果有遇到有任何无法进展问题或者疑惑的地方，应该在讨论区留言或者其他途径以寻求及时的帮助，以加快学习效率或者培养独立解决问题的能力、扫清盲点、补充细节

HashMap

历程

1.7 数组 + 链表
1.8 数组 + （链表 | 红黑树）

HashMap-机制及特点

存储机制

传入“a”（key值）
根据“a”调用其hashCode()=>得到原始hash
根据原始hash调用其hash()=>得到二次hash
计算二次hash % 16（数组容量）=>得到桶下标
调用put()=>将“a”存储在了桶下标索引位置数组
如下图

好处就是 能够实现快速查找。这是因为“a”与存储到的数组位置一一对应

缺陷就是 不同的值可以储存到数组的相同的位置。这些值以链表的方式存储。如下图

解决上面所说的缺陷的两种思路

缩减链表的长度
使用红黑树的数据结构存储这些值

HashMap-通过扩容缩减链表的长度

做法

让元素个数到达数组容量的3/4。如下图

请添加图片描述

扩容缩减链表的长度原理是什么？

这是因为当数组扩容的时候，所有的元素会根据新的数组容量计算桶下标。如下图

请添加图片描述

缺陷是 如果值得原始hash一致，那么它们不会随着扩容而改变原来的桶下标。原因显而易见

HashMap-解决上一个缺陷的办法是红黑树化

如果当前数组容量没有 >= 64

使得它们的数量 > 红黑树化的 8 阈值 -> 数组自动扩容到64。这就意味着可能再次通过数组扩容而缩短链表的长度了。
如下图

请添加图片描述

如果当前数组容量 >= 64

使得它们的数量 > 红黑树化的 8 阈值 -> 链表红黑树化。
如下图

请添加图片描述

可知，红黑树是什么

每一个父结点的值比它的左孩子的大
每一个父结点的值比它的右孩子的小

红黑树能否提升查找效率？

根据上图，可以知道，如果要查找“8”，那么只需要比较3次。时间复杂度是O(log2^n) //原本的时间复杂度是O(n)

**红黑树中10、11的位置是怎么回事？**如下图

这是因为红黑树是按照字符串排序的

HashMap-回答面试题

底层数据结构，1.7和1.8有何不同？

何时会树化？

为什么不一开始树化？

在性能上，如果把短的链表转化为红黑树，查找性能不会提高
在内存占用上，红黑树的占用更高。这是因为其底层数据结构是treeNode实现的，而链表是node实现的

为什么要使用红黑树？

红黑树用来避免 DoS 攻击，防止链表超长时性能下降，树化应当是偶然情况，是保底策略
hash 表的查找，更新的时间复杂度是 O ( 1 ) O(1) O(1)，而红黑树的查找，更新的时间复杂度是 O ( l o g 2 ⁡ n ) O(log_2⁡n ) O(log2⁡n)，TreeNode 占用空间也比普通 Node 的大，如非必要，尽量还是使用链表

树化阈值为什么是“8”？

经过代码实验可以知道，不可能出现链表个数超过8的情况

那么链表个数超过8的情况是什么？

当受到恶意DOSS攻击时

=>hash 值如果足够随机，则在 hash 表内按泊松分布，在负载因子 0.75 的情况下，长度超过 8 的链表出现概率是 0.00000006，树化阈值选择 8 就是为了让树化几率足够小

HashMap-树退化链表-树元素个数

在扩容时，如果树元素个数 <= 6 则会退化为链表

as 扩容前

扩容后

不会因为扩容而退化的情况

HashMap-树退化链表-remove 树节点

remove 树节点前，若 root、root.left、root.right、root.left.left 有一个为 null ，移除之后会退化为链表。

as 移除前（此时左孙子都没了）

移除“7”后

as2

移除“8”、“6”、“3”后

HashMap-索引计算

计算步骤

首先，计算对象的 hashCode()
再进行调用 HashMap 的 hash() 方法进行二次哈希
- 二次 hash() 是为了综合高位数据，让哈希分布更为均匀
最后 & (capacity – 1) || % capacity 得到索引。//“& ”的效率更高。这是因为“%”类似于除法运算，耗费的时钟周期更多

引出问题-在最后一步骤使用 & (capacity – 1 =>得到索引的前提

capacity 是 2 的 n 次幂

数组容量为何是 2 的 n 次幂时更好

计算索引时，效率更高：如果是 2 的 n 次幂可以使用位与运算代替取模
扩容时，重新计算索引效率更高：
1. 如果hash & oldCap == 0 的元素留在原来位置
2. 否则新位置 = 旧位置 + oldCap //移动元素是一次性地，而不是一个个地不使用

数组容量是 2 的 n 次幂时的其他注意事项

如果 hash 表的容量不是 2 的 n 次幂，则不必二次 hash。这是因为二次 hash 是为了配合 容量是 2 的 n 次幂 这一设计前提，
容量是 2 的 n 次幂 这一设计计算索引效率更好，但 hash 的分散性就不好，需要二次 hash 来作为补偿，没有采用这一设计的典型例子是 Hashtable

@hash 的分散性不好证明如下

当值都是偶数时，那么奇数索引不会存放有值，都在偶数索引中，解决办法是用容量为质数的数组，此时也可以不用二次哈希

HashMap-二次哈希的作用

1.8 二次哈希源码

1.7 二次哈希源码

模拟 1.8 二次哈希源码

模拟 1.7 二次哈希源码

通过代码实验，可以知道二次哈希的作用是

使得链表的长度更短（或者说元素分布更均匀）

HashMap-put 与扩容

put 流程

HashMap 是懒惰创建数组的，首次使用才创建数组
计算索引（桶下标）
如果桶下标还没人占用，创建 Node 占位返回
如果桶下标已经有人占用
1. 已经是 TreeNode 走红黑树的添加或更新逻辑
2. 是普通 Node，走链表的添加或更新逻辑，如果链表长度超过树化阈值，走树化逻辑
返回前检查容量是否超过阈值，一旦超过进行扩容

1.7 与 1.8 的区别

链表插入节点时，1.7 是头插法，1.8 是尾插法
1.7 是大于等于阈值且没有空位时才扩容，而 1.8 是大于阈值就扩容
1.8 在扩容计算 Node 索引时，会优化

HashMap-负载(加载)因子为何是0.75f

在空间占用与查询时间之间取得较好的权衡
大于这个值，空间节省了，但链表就会比较长影响性能
小于这个值，冲突减少了，但扩容就会更频繁，空间占用也更多

HashMap-并发丢数据

创建两个线程，打算分别往“1”处存入数据

package day01.map;

import java.util.HashMap;

public class HashMapMissData {
    public static void main(String[] args) throws InterruptedException {

        HashMap<String, Object> map = new HashMap<>();
        Thread t1 = new Thread(() -> {
            map.put("a", new Object()); // 97  => 1
        }, "t1");

        Thread t2 = new Thread(() -> {
            map.put("1", new Object()); // 49 => 1
        }, "t2");

        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(map);
    }
}

设置断点，打算让“t2”线程先存入

让“t2”线程存入

再让“t1”线程存入

可以知道，“t1”线程存入的数据覆盖了之前“t2”线程存入的数据

HashMap-扩容死链

扩容死链（1.7 会存在）

1.7 源码如下：

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            Entry<K,V> next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

e 和 next 都是局部变量，用来指向当前节点和下一个节点
线程1（绿色）的临时变量 e 和 next 刚引用了这俩节点，还未来得及移动节点，发生了线程切换，由线程2（蓝色）完成扩容和迁移

线程2 扩容完成，由于头插法，链表顺序颠倒。但线程1 的临时变量 e 和 next 还引用了这俩节点，还要再来一遍迁移

第一次循环
- 循环接着线程切换前运行，注意此时 e 指向的是节点 a，next 指向的是节点 b
- e 头插 a 节点，注意图中画了两份 a 节点，但事实上只有一个（为了不让箭头特别乱画了两份）
- 当循环结束是 e 会指向 next 也就是 b 节点

第二次循环
- next 指向了节点 a
- e 头插节点 b
- 当循环结束时，e 指向 next 也就是节点 a

第三次循环
- next 指向了 null
- e 头插节点 a，a 的 next 指向了 b（之前 a.next 一直是 null），b 的 next 指向 a，死链已成
- 当循环结束时，e 指向 next 也就是 null，因此第四次循环时会正常退出

数据错乱（1.7，1.8 都会存在）
略

HashMap-key 的设计

key 的设计要求

HashMap 的 key 可以为 null，但 Map 的其他实现则不然（如treeMap、hashTable）
作为 key 的对象，必须实现 hashCode（为了更好的分布性而提高查找性能）和 equals（如果key不同，用于比较是否相同的对象），并且 key 的内容不能修改（不可变）
key 的 hashCode 应该有良好的散列性

如果 key 可变，例如修改了 age 会导致再次查询时查询不到

public class HashMapMutableKey {
    public static void main(String[] args) {
        HashMap<Student, Object> map = new HashMap<>();
        Student stu = new Student("张三", 18);
        map.put(stu, new Object());

        System.out.println(map.get(stu));

        stu.age = 19;
        System.out.println(map.get(stu));
    }

    static class Student {
        String name;
        int age;

        public Student(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String getName() {
            return name;
        }

        public void setName(String name) {
            this.name = name;
        }

        public int getAge() {
            return age;
        }

        public void setAge(int age) {
            this.age = age;
        }

        @Override
        public boolean equals(Object o) {
            if (this == o) return true;
            if (o == null || getClass() != o.getClass()) return false;
            Student student = (Student) o;
            return age == student.age && Objects.equals(name, student.name);
        }

        @Override
        public int hashCode() {
            return Objects.hash(name, age);
        }
    }
}

这是因为在查找时，需要根据key值计算索引来查找，但是修改key值后，会使得查找索引也发生改变

HashMap-String 对象的 hashCode() 设计

目标是达到较为均匀的散列效果，每个字符串的 hashCode 足够独特

//字符串中的每个字符都可以通过查询码表表现为一个数字，称为 S i S_i Si，其中 i 的范围是 0 ~ n - 1

不是直接相加这些数字，而是使用散列公式错开这些字符： S 0 ∗ 3 1 ( n − 1 ) + S 1 ∗ 3 1 ( n − 2 ) + … S i ∗ 3 1 ( n − 1 − i ) + … S ( n − 1 ) ∗ 3 1 0 S_0∗31^{(n-1)}+ S_1∗31^{(n-2)}+ … S_i ∗ 31^{(n-1-i)}+ …S_{(n-1)}∗31^0 S0∗31(n−1)+S1∗31(n−2)+…Si∗31(n−1−i)+…S(n−1)∗310

为什么每次乘于 31 而不是其他数字

31 代入公式有较好的散列特性
31 * h 可以被优化为
- 即 $32 ∗h -h $
- 即 2 5 ∗ h − h 2^5 ∗h -h 25∗h−h
- 即 h ≪ 5 − h h≪5 -h h≪5−h

证明 31 代入公式有较好的散列特性？

对比乘于 11 的效果

对比乘于 41 的效果

乘于 41 的分布性更好
但是计算性能更低，不能移位运算。这是因为其相邻的数字不是 2的n次幂
=>还是乘于 31 更好

涉及资料

满老师

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java systematic learning

学习

数据结构

哈希算法

Java

Java HashMap 的相关文章

Java：扩展类并实现具有相同方法的接口

可能无法完成以下操作我收到编译错误继承的方法 A doSomthing int 无法隐藏 B 中的公共抽象方法 public class A int doSomthing int x return x public interface
如何在java中将数组值排序为循环格式？

我的数组值如下 String value 1 2 3 4 5 6 7 8 9 10 假设如果我将值 5 传递给 tat 数组它应该按如下顺序排序 5 6 7 8 9 10 1 2 3 4 怎么办有人帮忙吗感谢你你需要的就是所谓的轮换
两个整数乘积的模

我必须找到c c a b mod m a b c m 是 32 位整数但 a b 可以超过 32 位我正在尝试找出一种计算 c 的方法而不使用 long 或任何 gt 32 位的数据类型有任何想法吗如果m是质数事情可以简化吗注
eclipse行号状态行贡献项是如何实现的？

我需要更新状态行编辑器特定的信息我已经有了自己的实现但我想看看 eclipse 贡献项是如何实现的它显示状态行中的行号列位置谁能指点一下哪里可以找到源代码提前致谢亚历克斯 G 我一直在研究它它非常复杂我不确定我是否了解完
如何调试“com.android.okhttp”

在android kitkat中 URLConnection的实现已经被OkHttp取代如何调试呢 OkHttp 位于此目录中 external okhttp android main java com squareup okhttp 当
Jframe 内有 2 个 Jdialogs 的 setModal 问题

当我设置第一个选项时我遇到了问题JDialog模态第二个非模态这是我正在尝试实现的功能单击测试对话框按钮一个JDialog有名字自定义对话框主要的将会打开如果单击是选项自定义对话框主其他JDialog named 自
将非 Android 项目添加到 Android 项目

我在 Eclipse 中有三个项目 Base Server 和 AndroidClient Base和Server是Java 1 7项目而AndroidClient显然是一个android项目基础项目具有在服务器和 Android 客户
如何在 Spring 中使 @PropertyResource 优先于任何其他 application.properties ？

我正在尝试在类路径之外添加外部配置属性资源它应该覆盖任何现有的属性但以下方法不起作用 SpringBootApplication PropertySource d app properties public class MyClass
Sun 在 EDT 之外做 GUI 工作的演示？

我正在看SplashDemo java http download oracle com javase tutorial uiswing examples misc SplashDemoProject src misc SplashDemo
如何仅从 Firestore 获取最新更新的数据？

在 Firestore 上发现任何更改时始终获取整个文档如何只获取最近更新的数据这是我的数据我需要在第一次加载时在聊天中按对象顺序例如 2018 09 17 30 40 msg和sendby 并且如果数据更新则仅获取新的msg和se
Java Applet 中的 Apache FOP - 未找到数据的 ImagePreloader

我正在研究成熟商业产品中的一个问题简而言之我们使用 Apache POI 库的一部分来读取 Word DOC 或 DOCX 文件并将其转换为 XSL FO 以便我们可以进行标记替换然后我们使用嵌入到 Java 程序中的 FOP 将
将人类日期（当地时间 GMT）转换为日期

我正在服务器上工作服务器正在向我发送 GMT 本地日期的日期例如Fri Jun 22 09 29 29 NPT 2018在字符串格式上我将其转换为日期如下所示 SimpleDateFormat simpleDateFormat ne
如何使用 JMagick 转换色彩空间？

如何使用 JMagick API 转换色彩空间例如 CMYK gt RGB 和 RGB gt CMYK None
Java继承，扩展类如何影响实际类

我正在查看 Sun 认证学习指南其中有一段描述了最终修饰符它说如果程序员可以自由地扩展我们所知的 String 类文明它可能会崩溃他什么意思如果可以扩展 String 类我是否不会有一个名为 MyString 的类继承所有 S
Jetty、websocket、java.lang.RuntimeException：无法加载平台配置器

我尝试在 Endpoint 中获取 http 会话我遵循了这个建议https stackoverflow com a 17994303 https stackoverflow com a 17994303 这就是我这样做的原因 publi
JDBC 时间戳和日期 GMT 问题

我有一个 JDBC 日期列如果我使用 getDate 则会得到 date 仅部分2009 年 10 月 2 日但如果我使用 getTimestamp 我会得到完整的 date 2009 年 10 月 2 日 13 56 78 890 这正
Java Swing - 如何禁用 JPanel？

我有一些JComponents on a JPanel我想在按下开始按钮时禁用所有这些组件目前我通过以下方式显式禁用所有组件 component1 setEnabled false 但是有什么办法可以一次性禁用所有组件吗我尝试禁用
Android S8+ 警告消息“不支持当前的显示尺寸设置，可能会出现意外行为”

我在 Samsung S8 Android 7 中收到此警告消息 APP NAME 不支持当前的显示尺寸设置可能会行为出乎意料它意味着什么以及如何删除它谢谢通过添加解决supports screens 机器人 xlargeScre
在java中以原子方式获取多个锁

我有以下代码注意为了可读性我尽可能简化了代码如果我忘记了任何关键部分请告诉我 public class User private Relations relations public User relations new Rela
Android View Canvas onDraw 未执行

我目前正在开发一个自定义视图它在画布上绘制一些图块这些图块是从多个文件加载的并将在需要时加载它们将由 AsyncTask 加载如果它们已经加载它们只会被绘制在画布上这工作正常如果加载了这些图片 AsyncTask 就会触发v

随机推荐

【Maven拉不到】Cannot resolve plugin org.apache.maven.plugins:maven-deploy-plugin:2.8.2

问题 Cannot resolve plugin org apache maven plugins maven deploy plugin 2 8 2 与本地原来的有冲突或者是有多个版本的解决办法 1 找到本地安装Maven的路径 2 找
Jenkins+Docker自动化部署Spring boot项目（三）搭建jenkins

Jenkins Docker自动化部署Spring boot项目三搭建jenkins 搭建jenkins jenkins我是通过下载镜像完成安装的建议使用docker hub的镜像它提供的版本比较新一开始为了图快我用了163镜像
Selenium进阶——解决web 自动化中上传文件的问题

在做ui自动化测试中经常会遇到上传文件或者图片的场景通常的解决方案是自动化工具 autoIT 在这里我介绍一种通过jdk自带api java awt Robot 来解决类似问题的方法 java awt Robot类主要用于模拟用户点击
Elasticsearch之利用bulk提高写入性能（含源码分析）

什么是bulk操作 bulk是批量的意思也就是把原来单个的操作打包好通过批量的api提交到ES集群下面是个示例单个操作 PUT my index 000001 doc 1 timestamp 2099 11 15T13 12 00
【原创】linux实时操作系统xenomai x86平台基准测试(benchmark）

一前言 benchmark 即基准测试通常操作系统主要服务于应用程序其运行也是需要一定cpu资源的一般来说操作系统提供服务一定要快否则会影响应用程序的运行效率尤其是实时操作系统所以本文针对操作系统来做一些基准测试看看在低端x
jquery 访问手机摄像头_jquery.webcam.js实现调用摄像头拍照兼容各个浏览器

jquery webcam js实现调用摄像头拍照兼容各个浏览器 1 demo 可直接复制使用需要在环境里运行 2 所需 js 文件和 swf 控件可在官方博客下载地址jQuery webcam js 拍照倒计时 var w 320
C语言：编程实现输入n和n个数，判断其中哪个数连续出现的次数最多

C语言编程实现输入n和n个数判断其中哪个数连续出现的次数最多分析代码分析需要设置的变量有 n 输入数字的个数 x 输入的数字 cur 当前输入的数 i 计数器 len 连续出现的次数 maxl 最大连续出现的次数 maxx 连续
springboot CGLib 方式实现AOP代理问题

在Spring Boot中引入AOP就跟引入其他模块一样非常简单只需要在pom xml中加入如下依赖 dependency gt
jQuery学习笔记 - 5 启用/禁用文本框

我使用的jQuery版本为jquery 3 3 1 js 下载地址 https code jquery com jquery 3 3 1 js 我使用的Chrome版本为 Version 63 0 3239 132 Official Bui
运行roscore出错：SyntaxError: invalid syntax

运行roscore出错 SyntaxError invalid syntax 背景系统为ubuntu16 04 自带python2 7和3 5 有一次用pip整理python包从根目录大量转移到用户目录之后运行roscore就出问题了
区块链工作量证明

简单实现代码思路具体代码在简单区块链实现https blog csdn net sinat 32023305 article details 82021024中改进 proofOfWork go package main import
[C++]win32输出当前系统时间函数，可用以程序计时

include
SQL数据库高级查询语句--去重，排序，分组查询，聚合函数，分组及综合查询

高级查询 distint order by limit select 语句中可以使用 distinct 关键字对查询的结果集进行去重 select distinct 列1 列n from table name 其他子句 order by
游戏开发unity编辑器扩展知识系列：自定义快捷键

参考 https blog csdn net q764424567 article details 108639136 总结快捷键指令 CTRL Shift Alt LEFT RIGHT UP DOWN 箭头上下左右 F1 F12 键盘
浩辰CAD 2021 Linux版全球首发，破局双重“封锁”

2020年9月29日国产操作系统CAD设计解决方案浩辰CAD 2021 Linux版正式发布作为国内领军的工业设计软件企业苏州浩辰软件股份有限公司以下简称浩辰软件自创建以来就一直坚持国产CAD软件的自主研发和技术创新经过近三十
FancyBox.js基于JQuery图集弹层插件用法

FancyBox是一款基于 jquery 开发的类 Lightbox 插件支持对放大的图片添加阴影效果对于一组相关的图片添加导航操作按纽该 lightbox 除了能够展示图片之外还可以展示 iframed 内容通过 css 自定义
小程序页面跳转、带参数跳转以及navigator跳转

一单纯的页面跳转跳转到的页面分 tabBar 页面和非tabBar 页面 url路径可以写相对和绝对路径 1 跳转到非导航页面用 wx navigateTo 方法 wx navigateTo url person goldcoin
手把手教你调用百度人脸识别API

在百度AI开放平台使用百度的人脸识别能力只需要三个核心步骤即可操作完成获取接口权限准备接口调用工具进行接口调用全部流程走通只需要十分钟时间获取接口权限获取接口权限是调用接口的前提主要分为以下几步 1 进入百度云的人脸识别控制
Android开发——APP ANR治理

一背景介绍 ANR Application Not Response 指应用程序无响应通常出现在主线程被阻塞时并伴随ANR弹窗出现 ANR发生时要么关闭当前app 要么等待然而等待的结果大概率还是继续ANR 最终需要杀掉应用进程 A
Java HashMap

无知的我终于深入接触到了HashMap 如果有遇到有任何无法进展问题或者疑惑的地方应该在讨论区留言或者其他途径以寻求及时的帮助以加快学习效率或者培养独立解决问题的能力扫清盲点补充细节目录 HashMap HashMap 机

Java HashMap

目录

HashMap

HashMap-机制及特点

HashMap-通过扩容缩减链表的长度

HashMap-解决上一个缺陷的办法是红黑树化

HashMap-回答面试题

HashMap-树退化链表-树元素个数

HashMap-树退化链表-remove 树节点

HashMap-索引计算

HashMap-二次哈希的作用

HashMap-put 与 扩容

HashMap-负载(加载)因子为何是0.75f

HashMap-并发丢数据

HashMap-扩容死链

HashMap-key 的设计

HashMap-String 对象的 hashCode() 设计

Java HashMap 的相关文章

随机推荐

热门标签

HashMap-put 与扩容