面试官问 : ArrayList 不是线程安全的,为什么 ?(看完这篇,以后反问面试官)

2023-10-27

前言

金三银四 ?

也许,但是。

近日,又收到金三银四一线作战小队成员反馈的战况 :

我不管你从哪里看的面经,但是我不允许你看到我这篇文章之后,还不清楚这个面试问题。

本篇内容预告:
 

ArrayList 是线程不安全的, 为什么 ?

① 结合代码去探一探所谓的不安全 

② 我们弄清楚为什么不安全(结合源码以及我的个人讲述)

③ 不止步于为什么, 我们得知道怎么办(方案以及结合源码分析)

ps:  这篇文章 注定篇幅很长, 我会从非常非常小白0基础的角度去 很啰嗦地去讲一些内容。

距离上一次 这么臭长去讲 list集合相关的问题,还是21年的时候 ,个人认为也是很有学习价值的,大家也可以看看,但是注意就是 ,别看着看着回不来了,也是上万文字+图片+源码分析的文章:

Java 移除List中的元素,这玩意讲究!

开整开整。

正文


 看看它的不安全 以及 为什么不安全


线程不安全 ,看看官腔怎么说:
 

线程不安全,是指不提供加锁机制保护,有可能出现多个线程先后更改数据造成所得到的数据是脏数据。

其实小白话就是 :

多线程操作的时候 ,容易出现与我们预想不一致的结果。

就比如说,你做好准备 接我两拳。

本来你以为 我是打完一拳再打一拳。

结果我直接一招双龙出海,两只手一起打你, 你顶得住么?(你根本防不住。)

开始结合代码一探究竟。


代码小栗子 ① :
 

    public static void main(String[] args) {

        int threadNum = 1;

        List<String> resultList = new ArrayList<>();
        for (int i = 0; i < threadNum; i++) {
            new Thread(() -> resultList.add(UUID.randomUUID().toString())).start();
        }
        System.out.println("我们最终得到的resultList大小:"+resultList.size());
    }

 代码简析:

大家猜想结果是多少 ? 

是 0 , 为什么不是 1 ? 为什么会出现 0 ? 不是往里面ADD 了一个元素么 ? 

  

如果说你对这个 0  的结果很意外的话, 兄弟,你完了。

(吓你的,你本来要完了,还好你今天遇到了我)。

对这个 0  的结果很意外,代表你对线程方面的基础知识,可能还没了解。

简析:


因为for 里面 开了一个新的线程 new Thread , 这个线程 负责往 list 里面 add 一个数据。
但是 我们的打印 list.size 是 主线程 , 也就是说,如果 在 新的线程 new Thread 没执行完add 方法, 主线程就执行打印的代码,

那么就是 0啊 。

所以就是说,我们 主线程 等一等,让 for循环里面的新的线程 new Thread 先插入数据。

    public static void main(String[] args) throws InterruptedException {

        int threadNum = 1;

        List<String> resultList = new ArrayList<>();
        for (int i = 0; i < threadNum; i++) {
            new Thread(() -> resultList.add(UUID.randomUUID().toString())).start();
        }
        sleep(1000);
        System.out.println("我们最终得到的resultList大小:"+resultList.size());
    }

可以看到结果是1了 :

接下来我们把线程数改成10(另外主线程等5秒,给足够的时间让这个10个线程好好竞争一下) ,我们来看看 所谓的不安全 的ArrayList 能出现什么 ‘不安全’

    public static void main(String[] args) throws InterruptedException {

        int threadNum = 10;

        List<String> resultList = new ArrayList<>();
        for (int i = 0; i < threadNum; i++) {
            new Thread(()->{
                resultList.add(UUID.randomUUID().toString().substring(0,8));
                System.out.println(resultList);
            }).start();
        }
        sleep(5000);
        System.out.println("我们最终得到的resultList大小:"+resultList.size());
    }

情况①:

正常运行的情况,可以看到 10个线程 不争不抢 :

 显然这是不符合我们文章主题的,我们要看的是不安全。

 

情况②:

有竞争,但是线程们 很友好,所以也没出什么幺蛾子(仅仅对于往list塞数据这个动作来说)

 

情况③:

10个线程 显然还是 太少了, 而且我电脑机子又好, 终于出现 ‘不安全’情况了 ,非常难得。

 

多线程操作 ArrayList 导致出现 add赋值 出现 null  情景分析 :

为什么会出现,先看看源码 ,

Object[] elementData  : 保存所有元素值的 数组
size :  elementData中存储的元素个数

 

 再看看 add 函数的 源码 :

 

 ensureExplicitCapacity ()函数:


将当前的新元素加到列表后面,判断列表的 elementData 数组的大小是否满足。

如果 size + 1 的这个需求长度大于 elementData 这个数组的长度,那么就要对这个数组进行扩容。

elementData[size++] = e :

e是传入的 值, 把这个值 赋值在 elementData数组的 size++ 位置 。

大家看出来问题没?

这两步没有和在一块操作。

也就说如果出现这个扩容的触发 和后面 赋值 并发情况 ,那么就有好戏看了。

ArrayList是基于数组实现,数组大小一旦确定就无法更改。 

ArrayList的扩容 将旧数组容器的元素拷贝到新大小的数组中(Arrays.copyOf函数)。


而 通过new ArrayList<>()实例的对象初始化的大小是0,所以第一次插入就肯定会触发扩容

 这里又必须给大家推荐一篇好文章了:

(没错也是我写的,但是看到这,你别去看这篇,跟着我现在的思路继续分析 这个null值出现的情景,实在很感兴趣,自己一会再看)
Java ArrayList new出来,默认的容量到底是0还是10 ?

 看看我们的截图, 第一个数据是 null 。


有趣。

第一个数据是 null (其实应该称为 执行扩容操作,并发导致出现null值 )分析 :

第一个线程A 插入数据时 属于首次add ,发现需要扩容, ok , 线程A 去扩容去了。

然后 我们是多线程操作场景, for循环第二次,触发new第二个线程B来了,线程B去add的时候,

因为线程A第一次扩容可能并没完成,所以导致 线程B 扩容所拿到list的elementDate是旧的,并不是线程A第一次扩容后对象, 线程B 拿到的 size还是 0 ,所以线程B 也认为自己是第一次add ,也需要扩容。

 
幻想一下 A 、B 线程的并发 一起进入扩容场景:

那么线程A 是第一次add的时候,他知道他要去扩容,   他自己 扩容 完,自己整了个list的新elementDate ,然后 就开始赋值 elementDate[size++] = A的UUID值。

线程A这个操作的过程中,线程 B 在做什么?

 线程 B一开始 不巧也是以为要扩容,他拿着一个旧的 list的elementDate 也整了一个新的数组

然后把 整个 list的 elementDate 引用指向 B线程自己弄出来的对象  

this.elementData = B新构建的对象(这对象全部值为null);

然后做什么?

然后 线程B 开始执行   elementDate[size++] = B的UUID值。


这里的好玩点是什么?

线程A 的值 赋值在 他创建出来的 elementDate 里面,然后触发 size++  。


但是线程 B 呢, 把 this.elementData 指向了自己的新弄出来的, 所以 A 的值 无情被抛弃, 但是 线程 B 开始赋值的时候,

看看这个size在源码里的情况:

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{

    transient Object[] elementData;

   //这是大家共用的 size 
    private int size;
}


 
size是大家共用的, size 被 线程A 加1了 ,所以就出现 线程 B 赋值的时候   执行 elementDate[size++] = B的UUID值,出来的结果是
 
 [null , B的UUID值] 

 

null 就是这么来的 !  能看到这的人,友情提示,你已经阅读了3500字。当然还没完事。

情况④:

java.util.ConcurrentModificationException 并发冲突

直接定位报错函数:

 

 这个其实 之前分析过:

modCount是修改记录数,expectedModCount是期望修改记录数;
初始化的时候 expectedModCount=modCount ;

ArrayList的add函数、remove函数 操作都有对modCount++操作,当expectedModCount和modCount值不相等, 那就会报并发错误了(其实这个不是仅仅是多线程的问题,是这个ArrayList 代码next函数的问题,更多细节可以有空看看 Java 移除List中的元素,这玩意讲究!)。 

那么到这 我们大概知道 这个 ArrayList的不安全 问题了, 说白了就是  2行代码没上锁操作。

怎么办? 怎么安全起来?

最简单的方式, 也是面经上经常看到的  使用 Vector :

List<String> resultList = new Vector<>();

看看vector怎么保证安全的:

 

其次 是 使用 Collections里面的synchronizedList :
 

List<String> resultList =Collections.synchronizedList(new ArrayList<>());

 看看synchronizedList 怎么保证安全的:

 

还有可以使用 CopyOnWriteArrayList :

 List<String> resultList  = new CopyOnWriteArrayList();

  看看CopyOnWriteArrayList 怎么保证安全的:

 ps:
CopyOnWriteArrayList 的set 也是上锁

 但是get 没有, 也就是说,get可能在多线程场景使用,拿到的是旧数据是可能的(也就是当前能读到的list里面的数据)

 

那么就CopyOnWriteArrayList的 set\add\get 函数,你能预料到它的不好点么?

1.set add 都选择使用了Arrays.copyOf复制操作 

 所以存在 内存占用以及耗时问题,当数组元素越来越多的时候。

2. get 多线程过程读取数据不是实时,那就可能出现 数据不一致问题,但是最终数据是一致的(读多写少就很合适)。

好了,该篇就到这吧。

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

面试官问 : ArrayList 不是线程安全的,为什么 ?(看完这篇,以后反问面试官) 的相关文章

随机推荐

  • 分布式系统详解--框架(Hadoop-单机版搭建)

    分布式系统详解 框架 Hadoop 单机版搭建 前面讲了这么多的理论知识 也有一些基础的小知识点 很简单的概括了一下 从这篇文章开始 就会进入到一个理论实践相结合中 这篇文章主要是讲的Hadoop 讲解它的基础认识 安装 常用命令 还有就是
  • 前缀和、差分和双指针 算法学习

    1 前缀和 1 1 算法原理 所谓前缀和 就是记录下前方所有数据之和 当所需中间数据时 可以通过o 1 的时间复杂度将数据求出 一维数组前缀和 求出1 i的所有项之和 由于当运算到第i位时 前i 1位已经运算完成 故a i a i a i
  • mysqldump备份数据库

    某项目的负责人要求我们拿出一个MYSQL的备份方案 查了一下资料 结合CSDN上的MYSQL备份工具 发现使用MYSQLDUMP命令进行数据库的备份 现在不考虑差异和增量备份 只做完全备份 该项目的工控机的系统环境 Windows2003
  • 使用Python中的pandas库,我们可以很方便地对数据进行处理和操作。本文将介绍如何使用iloc函数将DataFrame所有的数值重置为0或其他固定值。

    使用Python中的pandas库 我们可以很方便地对数据进行处理和操作 本文将介绍如何使用iloc函数将DataFrame所有的数值重置为0或其他固定值 步骤1 导入pandas库 首先需要导入pandas库 并且生成一个DataFram
  • Python编程题每日一练day1(附答案)

    Python编程题每日一练day1 Python编程题每日一练day2 附答案 题目一 游乐园的门票 题目二 寻找被污染的字符串 题目三 实现计算求最大公约数和最小公倍数的函数 题目四 实现判断一个数是不是素数的函数 题目五 输入两个正整数
  • 电子水尺在农田灌区渠道水位流量监测方案

    一 方案背景 农田灌区渠道流量监测系统是农田水利信息化建设的一个重要部分 也是高标准农田生产灌溉水资源灌溉监测的一部分 我们公司利用计算机技术 电子技术 软件技术 通信技术 研发并生产出了 用于农田及高标准农田灌区渠道灌溉使用的流量监测一体
  • oppo怎么修改dns服务器地址,OPPO R7/R7 Plus修改DNS图文教程

    OPPO R7 R7 Plus怎么修改DNS 以下是操作方法 1 进入WLAN设置界面 打开设置 WLAN 进入wlan设置界面 长按已经连接上的网络名称 2 找到 修改网络 接着弹出来一个选项框 选择 修改网络 勾选 显示高级选项 3 将
  • JS-词法作用域

    词法作用域 词法作用域就是定义在词法阶段的作用域 换句话说 词法作用域是由你在写代码时将变量和块作用域写在哪里来决定的 因此当词法分析器处理代码时会保持作用域不变 大部分情况下是这样的 作用域查找会在找到第一个匹配的标识符时停止 无论函数在
  • win10 防火墙导致mysql Can't connect to MySQL server on 'localhost' (10060)

    说明 本地是win10 mysql一直正常使用 今天不知道它抽什么风 连不上了 如下图 解决过程 先是net stop mysql 后net start mysql 提示mysql服务开启成功 但还是连不上 妈呀 接着查看3306端口 正常
  • 1.STM32简介

    STM32简介 STM32是ST公司基于ARM Cortex M内核开发的32位微控制器 STM32常应用在嵌入式领域 如智能车 无人机 机器人 无线通信 物联网 工业控制 娱乐电子产品等 STM32功能强大 性能优异 片上资源丰富 功耗低
  • IDEA打包deploy梳理

    我们有时候经常需要将本地的包deploy到私服上去 可能是snapshot的 也可能是release的 具体逻辑如下 deploy会涉及到两个仓库 一个是包下载仓库 一个是包上传仓库 完成一次deploy 我们要清楚这两个标签内的内容 包下
  • 成为Android高手必须掌握的28大项内容和10个建议

    一 成为Android高手必须掌握的8项基本要求 1 Android操作系统概述 1 Android系统架构 2 Android利用设计理念 3 Android 开源知识 4 Android 参考网站与权威信息 2 Android SDK及
  • 10分钟了解关键路径及如何求得关键路径

    文章目录 一 什么是关键路径 二 求解关键路径需要的4个描述量 三 如何求得关键路径 视频参考 6 6 4关键路径2 求解关键路径 一 什么是关键路径 引例 1 某项目的任务是对A公司的办公室重新进行装修 如果10月1日前完成装修工程 项目
  • 概率论与数理统计--假设检验

    参数估计能解决实际问题中分布类型已知时对位置参数进行估计的问题 可是还有许多问题参数估计无法解决 例如 某弓藏生产产品某项指标服从 N 2 0 N mu sigma 0 2 分布 经过技术改造后 mu与 2 0 sigma 0 2是否发生了
  • Mybatis typealiaspackage 通配符扫描方法

    最近两天项目需求研究了一下mybatis拦截器 对于Mybatis拦截器发现其功能强大 虽很灵活但是其内部对象转换太麻烦很多接口没有完全暴露出来 甚至不得不通过反射的方式去取其内部关联对象 可能Mybatis也不希望用户直接对其内部Stat
  • 服务器上数据盘不显示,云服务器不显示数据盘

    云服务器不显示数据盘 内容精选 换一换 当卸载数据盘时 支持离线或者在线卸载 即可在挂载该数据盘的云服务器处于 关机 或 运行中 状态进行卸载 弹性云服务器在线卸载磁盘 详细信息请参见在线卸载磁盘 裸金属服务器当前支持将SCSI类型磁盘挂载
  • 169.多数元素 C++

    ans1 先对数组排序 1 1 class Solution public int majorityElement vector
  • 前端web基础四:css简介

    1 什么是css css3 css的第三个版本 css是由很多模块构成 有些模块高于3或者低于3 但是现在w3c统一标准称为css3跟html5一样称html 一般我们说的css就是css3以后基本上不会改了 css 层叠样式表cascad
  • x264源码分析--dpb-size

    dpb size 参数含义 解码缓冲区大小 decode picture buffer 参数解析 OPT dpb size p gt i dpb size atoi value 代码逻辑 h gt param i dpb size x264
  • 面试官问 : ArrayList 不是线程安全的,为什么 ?(看完这篇,以后反问面试官)

    前言 金三银四 也许 但是 近日 又收到金三银四一线作战小队成员反馈的战况 我不管你从哪里看的面经 但是我不允许你看到我这篇文章之后 还不清楚这个面试问题 本篇内容预告 ArrayList 是线程不安全的 为什么 结合代码去探一探所谓的不安