并发编程系列之Fork/Join

2023-11-02

前言

上节我们讲了阻塞队列，Java中的并发容器就算有了个基本的认识，今天我们来介绍一种线程工作模式，叫Fork/Join，他是JDK7之后提供的一个并行执行框架，主要的思想我觉得是分而治之，将一个大的任务分成多个小的任务并行执行，然后等所有小任务执行完毕后汇总结果，完成任务执行，是不是觉得这种模式挺好的，也有不少类似场景可以适用吧，那还等什么，开始进入我们今天的并发之旅吧。

什么是Fork/Join？

Fork/Join从上图很容易理解他是一种分合思想，Fork/Join最常用的场景就用在工作窃取算法上，那么什么是工作窃取算法呢？我们来对这个算法有个简单的认识：

窃取算法指一个线程从其他队列中窃取任务来执行，当然前提是本线程自己队列中的任务已经执行完毕，就比如，我们在工作过程中，有两个工人，每人分配了10个任务，其中某一个人干活效率比较高，当他干活自己的工作后，发现同事还有任务要做，就去帮他做，但是你又不能从第一个任务开始，因为前面的任务你并不知道你同事已经完成到第几个了，所以你就索性从最后一个任务开始往前执行，这就是工作窃取算法，当然我讲的比较通俗，那在我们Java中呢，最好是使用双向队列来做这件事情，线程1和线程2分别执行队列1和队列2中的任务，无论谁先执行完，都从队列尾部去窃取任务执行，当2个队列都空了，则任务全部执行完毕。应用Fork/Join中场景如下：

窃取算法优点：充分利用线程的并行计算，减少线程间的竞争；

窃取算法缺点：在极端情况下，队列中只有一个任务时，可能会发生两个线程或者多个线程同时执行，发生竞争，当然这种情况发生概率很低，此外该算法还会消耗更多的系统资源；

Fork/Join的设计？

Fork/Join从上面我们已经知道该框架的核心主要就是2步，那我们来看看如何将这简单的2步设计好，并为我们所用吧，

第一步：分割任务，首先我们需要有一个fork类来把大任务分割成子任务，有可能子任务还是很大，所以还需要不停的分割，直到分割出的子任务足够小（具体有多小就要根据我们的实际情况和系统资源，合适的配置执行子任务的线程数，并不是越小越好，也不是越多线程执行就会越快，因为我们知道，线程上下文切换是要占用CPU调度时间的）；

第二步：执行任务并合并结果，分割的子任务分别放在双向队列里，然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里，启动一个线程从队列里拿数据，然后合并这些数据，进行汇总计算；

Fork/Join的使用？

了解了如何设计Fork/Join，接下来我们再来看看如何使用呢，我们要知道要使用这种模式，Fork/Join提供了下面两个类分别来完成第一步和第二步要做的事：

ForkJoinTask：首先创建一个ForkJoin任务，它提供在任务中执行fork()和join()操作的机制，通常我们不需要直接继承ForkJoinTask类，而是继承其子类即可：
- RecursiveAction：于没有返回结果的任务
- RecursiveTask ：用于有返回结果的任务
ForkJoinPool：ForkJoinTask需要通过ForkJoinPool来执行，任务分割出的子任务会添加到当前工作线程所维护的双端队列中，进入队列的头部。当一个工作线程的队列里暂时没有任务时，它会随机从其他工作线程的队列的尾部获取一个任务

下面我们以一个计算1+2+3+...的值：

public class ForkJoin extends RecursiveTask<Long> {
   // 计算1+2+3+...的值
   private int start;
   private int end;
   private final int DEFAULT_CAPACITY = 20;
   public ForkJoin(int start, int end) {
       this.start = start;
       this.end = end;
   }

   /**
    * 重载RecursiveTask的方法
    *
    * @return
    */
   @Override
   protected Long compute() {

       long sum = 0;
       //如果任务量在最大容量之内
       if (end - start < DEFAULT_CAPACITY) {
           for (int i = start; i <= end; i++) {
               sum += i;
           }
       } else {
           //如果超过了最大容量，那么就进行拆分处理
           //计算容量中间值
           int middle = (start + end) / 2;
           //进行递归
           ForkJoin fockJoinTest1 = new ForkJoin(start, middle);
           ForkJoin fockJoinTest2 = new ForkJoin(middle + 1, end);
           //执行任务
           fockJoinTest1.fork();
           fockJoinTest2.fork();
           //等待任务执行并返回结果
           sum = fockJoinTest1.join() + fockJoinTest2.join();
       }
       return sum;
   }

   public static void main(String[] args) {
       ForkJoinPool forkJoinPool = new ForkJoinPool();
       ForkJoin forkJoin = new ForkJoin(1, 100);
       //前面我们说过，任务提交中invoke可以直接返回结果
       long result = forkJoinPool.invoke(forkJoin);
       System.out.println("fock/join计算结果:" +result);
   }
}

Fork/Join的实现原理

Fork/Join的底层，要根据JDK版本来论，1.8之前和1.8及之后的底层实现不同，不过这些对于开发者来说都是透明的。

下面我们看下JDK1.7及之前版本的底层实现：

ForkJoinPool由ForkJoinTask数组和ForkJoinWorkerThread数组组成，ForkJoinTask数组负责存放程序提交给ForkJoinPool的任务，而ForkJoinWorkerThread数组负责执行这些任务。

public ForkJoinPool(int parallelism,
                       ForkJoinWorkerThreadFactory factory,
                       Thread.UncaughtExceptionHandler handler,
                       boolean asyncMode) {
       checkPermission();
               ...
       this.submissionQueue = new ForkJoinTask<?>[INITIAL_QUEUE_CAPACITY];
                 ...
       workers = new ForkJoinWorkerThread[n + 1];
       this.submissionLock = new ReentrantLock();
       this.termination = submissionLock.newCondition();
       StringBuilder sb = new StringBuilder("ForkJoinPool-");
       sb.append(poolNumberGenerator.incrementAndGet());
       sb.append("-worker-");
       this.workerNamePrefix = sb.toString();
   }

new ForkJoinTask<?>，我们再看下这个数组：

public final ForkJoinTask<V> fork() {
// 当我们调用ForkJoinTask的fork方法时，
// 程序会调用ForkJoinWorkerThread的pushTask方法异步的执行这个任务，然后立即返回结果
       ((ForkJoinWorkerThread) Thread.currentThread())
           .pushTask(this);
       return this;
   }

再看下pushTask方法：

// pushTask方法把当前任务存放在ForkJoinTask 数组queue里。
// 然后再调用ForkJoinPool的signalWork()方法唤醒或创建一个工作线程来执行任务
final void pushTask(ForkJoinTask<?> t) {
       ForkJoinTask<?>[] q; int s, m;
       if ((q = queue) != null) {    // ignore if queue removed
           long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
           UNSAFE.putOrderedObject(q, u, t);
           queueTop = s + 1;         // or use putOrderedInt
           if ((s -= queueBase) <= 2)
               pool.signalWork();
           else if (s == m)
               growQueue();
       }
   }

我们再看另一个方法Join方法：

// Join方法的主要作用是阻塞当前线程并等待获取结果
public final V join() {
// 它调用了doJoin()方法，通过doJoin()方法得到当前任务的状态来判断返回什么结果
       if (doJoin() != NORMAL)
           return reportResult();
       else
           return getRawResult();
   }

//已完成（NORMAL），被取消（CANCELLED），信号（SIGNAL）和出现异常（EXCEPTIONAL）
// 如果任务状态是已完成，则直接返回任务结果。
// 如果任务状态是被取消，则直接抛出CancellationException。
// 如果任务状态是抛出异常，则直接抛出对应的异常
private V reportResult() {
       int s; Throwable ex;
       if ((s = status) == CANCELLED)
           throw new CancellationException();
       if (s == EXCEPTIONAL && (ex = getThrowableException()) != null)
           UNSAFE.throwException(ex);
       return getRawResult();
   }

再看下dojoin方法：

// 首先通过查看任务的状态，看任务是否已经执行完了
// 如果执行完了，则直接返回任务状态
// 如果没有执行完，则从任务数组里取出任务并执行
// 如果任务顺利执行完成了，则设置任务状态为NORMAL
// 如果出现异常，则纪录异常，并将任务状态设置为EXCEPTIONAL  
private int doJoin() {
       Thread t; ForkJoinWorkerThread w; int s; boolean completed;
       if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
           if ((s = status) < 0)
               return s;
           if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {
               try {
                   completed = exec();
               } catch (Throwable rex) {
                   return setExceptionalCompletion(rex);
               }
               if (completed)
                   return setCompletion(NORMAL);
           }
           return w.joinTask(this);
       }
       else
           return externalAwaitDone();
   }

对于Fork/Join在jdk8中的底层，我们下次有时间再分析

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

并发编程

并发编程系列之Fork/Join 的相关文章

并发编程集合

转载自郑金维老师一 synchronized 一原子性有序性可见性 1 1 原子性数据库的事务 ACID A 原子性事务是一个最小的执行的单位一次事务的多次操作要么都成功要么都失败并发编程的原子性一个或多个指令在CPU执
并发编程系列之Exchanger

前言上面我们介绍了信号量再来说说交换者这个东西用的不是很多所以一般也不被经常关注但是我们还是最好了解下下面我将从什么是Exchanger以及如何使用Exchanger两个方面谈谈这个用于线程间协调的工具类什么是Exchange
Cuda Streams的概述（一）-- Cuda介绍

最近在做有关Cuda的一个项目碰到匪夷所思的问题在异步的时候发现并没有达到预期的效果程序没有异步起来然后在网上找了一个Nvida的有关Cuda Streams的一个ppt 然后照着里面的提示使程序达到了异步的效果首先先回顾一下
Java 多线程事务回滚 ——多线程插入数据库时事务控制

背景日常项目中经常会出现一个场景同时批量插入数据库数据由于逻辑复杂或者其它原因我们无法使用sql进行批量插入串行效率低耗时长为了提高效率这个时候我们首先想到多线程并发插入但是如何控制事务呢直接上干货实现效果开启多条
Java多线程中常见错误梳理，新手程序员必看

很多Java新手在刚接触线程时都会被其复杂的知识点搞晕在实际应用中同样错误不断如何才能快速掌握多线程呢常见的Java多线程错误有哪些接下来就给大家分享Java新手学习入门中多线程失误梳理无论是客户端还是服务器端多线程Java程序
悲观锁(Synchronized)和乐观锁(CAS)

文章目录悲观锁和乐观锁 Synchronized Synchronized使用 Synchronized底层原理 Java1 6对Synchronized的优化 synchronized的等待唤醒机制 CAS CAS使用 CAS底层原理
【多线程】三种实现方案

目录 1 多线程中的并发和并行概念 2 多线程中的进程和线程概念 3 多线程的实现方案 3 1 方式1 继承Thread类的方式进行实现 3 2 方式2 实现Runnable接口 3 3 方式3 Callble和Future 可以获取返回结
单例模式的4种写法

单例模式是开发过程中常用的模式之一首先了解下单例模式的四大原则构造方法私有以静态方法或枚举返回实例确保实例只有一个尤其是多线程环境确保反射或反序列化时不会重新构建对象饿汉模式饿汉模式在类被初始化时就创建对象以空间换时间故
多线程-Thread类的常用方法及使用场景

众所周知操作线程就必须熟读线程的API方法万一你开个多线程刹不住车就歇菜了下面就介绍一些API基本用法包括sleep join yield interrupt sleep 让当前线程睡一会原生用法Thread sleep 毫秒会
JUC三连问

1 进程和线程的区别 1 进程是资源分配的基本单位线程是程序执行的最小单位 2 一个进程包括多个线程 3 每个进程都有自己的内存和资源一个进程中的线程会共享这些内存和资源每个线程都有单独的栈内存和寄存器 2 并行和并发的区别并行指
场景题之最快返回结果

场景题之最快返回结果问题描述输入中文最快从百度翻译谷歌翻译有道翻译获取结果返回代码实现思路采用CompletableFuture实现多个CompletableFuture可以串行执行也可以并行执行其中anyOf 方法只
JUC常用到的类

JUC java util concurrent 并发包中包含了许多并发编程中需要用到的类锁如ReentratLock ReadWriteLock ReentrantLock重入锁可以替代synchronized使用并且有更多强大的
Java并发编程系列 - Java内存模型

Java并发编程可见性原子性有序性 Java内存模型如何解决可见性有序性并发问题产生的根源可见性原子性有序性可见性 Java内存模型的主要目标是定义程序中变量的访问规则即在虚拟机中将变量存储到主内存或者将变量从主内存取出
【并发】并发

并发进程和线程进程资源分配的基本单位可以理解为在内存中运行的程序每个进程都有独立的内存空间一个进程包含多个线程线程任务执行的基本单位负责进程中任务的执行每个线程共享进程的内存空间一个线程使用时其他线程必须等待用户
Sentinel客户端调用并发控制

前言当链路中某个应用出现不稳定导致整个链路调用变慢如果不加控制可能导致雪崩这种情况如何处理呢一慢调用现象分析在分布式链路中调用中调用关系如下 methodA1与methodA2在同一个应用中链路标号调用链链路1 met
Java 线程池的submit的使用与分析.md

在Java5以后通过Executor来启动线程比用Thread的start 更好在新特征中可以很容易控制线程的启动执行和关闭过程还能使用线程池的特性上一篇我们介绍了线程池的基本用法和特性我们用的最多的是ExecutorServ
CUDA编程问题记录：能否用CPU多线程调用CUDA核函数

问题能否在主机端创建CPU多线程在每个线程里调用设备端核函数的caller函数进而实现进一步的并行运行例如有5张图片对于每张图片都有N个GPU线程对其进行像素操作但是此时是逐一对这5张图片处理的想在主机端创建5个CPU线程每
synchronized的作用和用法

郁闷参考 synchronized的作用和用法 Java中Synchronized的使用文章目录简单介绍用法实战实例修饰代码块修饰普通方法修饰静态方法简单介绍 synchronized关键字是用来控制线程同步的就是在多线
接口并发性能测试开发之：从测试方案设计、测试策略、指标分析到代码编写，这一篇全搞定。

并发接口性能设计思路与代码编写 1 引言 2 并发测试定义 3 并发测试分类 4 设计思路整理 5 测试方案设计 6 指标分析 7 代码实战 8 总结 1 引言这篇是我3月份在公司内部做的技术分享内容由于我在公司内部分享的内容较多以及
并发编程系列之自定义线程池

前言前面我们在讲并发工具类的时候多次提到线程池今天我们就来走进线程池的旅地首先我们先不讲线程池框架Executors 我们今天先来介绍如何自己定义一个线程池是不是已经迫不及待了那么就让我们开启今天的旅途吧什么是线程池线程池可

随机推荐

上MES系统的目的是什么？

上MES系统的目的是什么实现透明制造柔性制造精益制造创新制造观点太空洞太空洞太空洞开发者的观点计划质量生产物流一体化管理要接地气客户说aps需要前台傻瓜后台智能操作APS的起码有点水准的人吧太傻瓜能操作
pt_session流程

pt 即 prime time 数字IC后端设计人员用于check pr之后的path timing 的重要工具在从后端拿到pt session的前提下确认sdc或者cdc sdc是否有语法问题等完成脚本的快速迭代确保前端交付质量
vue前端实现打印功能

方案一 window print 这个命令默认打印整个页面的内容所以如果想要实现局部打印功能的话就要重新给body赋值并且后续执行完之后再还原回去这样的话会造成一些非预期的结果很麻烦并且在当前也操作 window docume
剪映VS会声会影哪个好用，视频剪辑软件剪映会声会影之间对比之

随着网络视频的发展越来越多的人开始学习视频剪辑毕竟技多不压身而在众多剪辑软件中剪映和会声会影是很适合新手使用的软件那剪映与会声会影的区别有哪些剪映会声会影哪个好用下面就仔细说说一剪映与会声会影的区别在剪辑功能上剪映和会
武装突袭3fps服务器不稳定,《武装突袭3》深不见底：史上最硬核、最复杂的FPS游戏...

武装突袭3 深不见底史上最硬核最复杂的FPS游戏武装突袭3是一个硬核的而且复杂的游戏我玩了一千六百多个小时但依然没有玩透它如果用一个词来形容ARMA3那么就是深不见底大多数人在这里只能在某一个领域成为专家所以如果你准备入手武装
gensim中TaggedDocument 怎么使用

我有两个目录我想从中读取它们的文本文件并给它们贴上标签但我不知道如何通过taggedDocument来实现这一点我以为它可以作为标记文档 strings labels 工作但这显然不起作用 from gensim import mo
超级账本PBFT（拜占庭容错）算法详解

上一章我们从分布式系统的角度简单叙述了一下 IBM HyperLedger fabric 的一些基本概念架构和协议信息其中最为核心的部分就是共识算法 consensus plugin fabric推荐并实现的就是PBFT这一经典算法 B
弱监督学习--半监督学习(3):Mean teachers are better role models

前言论文链接 https arxiv org pdf 1703 01780 pdf github https github com CuriousAI mean teacher Mean Teacher 模型是由芬兰的一家AI初创公司在2
c语言怎样的序列满足堆,C语言堆排序法谁能通俗易懂又清晰地讲解一下？谢谢...

您可以找本数据结构的书看看比如清华严尉敏的数据结构以下摘抄于 http student zjzk cn course ware data structure web paixu paixu8 4 2 1 htm 这个网站的讲解挺不错
Android OpenGL ES2.0(一):详细讲解如何绘制一个三角形

一 Android OpenGL ES2 0简介 1 什么是OpenGL OpenGL 全写Open Graphics Library 是指定义了一个跨编程语言跨平台的编程接口规格的专业的图形程序接口它用于三维图像二维的亦可是一个功
缓存怎么测试？

1 缓存的介绍平时用的Redis缓存是一款高性能的内存型键值对 key value 数据库是高并发场景常用一款存储中间件其主要用于缓存热点数据减少DB的请求IO 其场景使用主要有分布式锁全局ID 计数器限流消息队列购物车
垃圾回收机制

目录一为什么要有垃圾回收二垃圾回收主要回收哪个内存区域三垃圾判断算法 1 引用计数法 2 可达性分析法四垃圾回收算法 1 标记清除算法 2 标记整理算法 3 复制算法 4 分代收集算法一为什么要有垃圾回收在 JVM
DRF请求与响应

目录 Request类常用参数 Response类请求编码与相应编码相应编码 Request类经过rest framwork 传入视图函数的request已经不是原来的request了而是Request的类产生的对象request
Docker 安装 Nginx（三）

Nginx 是一个高性能的 HTTP 和反向代理 web 服务器同时也提供了 IMAP POP3 SMTP 服务以前没有用Docker时直接在服务器中下载安装修改配置运行Nginx 一套完整流程下来花费的时间也就那样但是自从
RabbitMQ - 消息堆积问题的最佳解决方案？惰性队列

目录一惰性队列 1 1 消息堆积问题 1 2 消息堆积问题的解决方法从消费者的角度从队列的角度 1 3 引入惰性队列 1 3 1 什么是惰性队列 1 3 2 惰性队列的使用 1 3 3 效果演示一惰性队列 1 1 消息堆积问题
StringUtils.isEmpty和StringUtils.isBlank用法

a target blank href http blog csdn net ocean20 article details 6674077 转载自 http blog csdn net ocean20 article details 66
Ubuntu22.04编译安装FFmpeg

FFmpeg介绍概述 FFmpeg是一款用C语言编写的跨平台免费开源多媒体处理工具该软件可实现音视频的采集编解码转码过滤以及流媒体相关操作等功能同时 FFmpeg也为其他多种语言和操作系统提供了开发组件包括Java Pytho
Android的init过程：init.rc解析流程

这几天打算看下安卓的代码看优秀的源码也是一种学习过程看源码的过程就感觉到安卓确实是深受linux内核的影响不少数据结构的用法完全一致花了一中午时间研究了下init rc解析过程做个记录 init rc 文件并不是普通的配置文件
Ant内置任务之unjar/untar/unwar/unzip

一概述 unjar untar unwar unzip是Ant内置任务用于解压zip war或jar文件 PatternSet用于选择从存档中提取的文件资源集合用于选择执行解压的存档文件 Unjar Unwar Unzip只支持基于文
并发编程系列之Fork/Join

前言上节我们讲了阻塞队列 Java中的并发容器就算有了个基本的认识今天我们来介绍一种线程工作模式叫Fork Join 他是JDK7之后提供的一个并行执行框架主要的思想我觉得是分而治之将一个大的任务分成多个小的任务并行执行然后等所

并发编程系列之Fork/Join

并发编程系列之Fork/Join 的相关文章

随机推荐

热门标签