为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？

2023-12-29

hashmap有两个键值对，它们不是由不同的线程并行处理的。


import java.util.stream.Stream;
import java.util.Map;
import java.util.HashMap;

class Ideone
{
    public static void main (String[] args) throws java.lang.Exception
    {
        Map<String, Integer> map = new HashMap<>();
        map.put("a", 1);
        map.put("b", 2);
        map.values().parallelStream()
              .peek(x -> System.out.println("processing "+x+" in "+Thread.currentThread()))
              .forEach(System.out::println);
    }
}

Output:

processing 1 in Thread[main,5,main]
1
processing 2 in Thread[main,5,main]
2

URL: https://ideone.com/Hkxkoz https://ideone.com/Hkxkoz

ValueSpliterator 应该尝试将 HashMap 数组拆分为大小为 1 的槽，这意味着两个元素应该在不同的线程中处理。

Source: https://www.codota.com/code/java/methods/java8.util.HMSpliterators https://www.codota.com/code/java/methods/java8.util.HMSpliterators$ValueSpliterator/%3Cinit%3E

将它们包裹起来之后ArrayList，它按预期工作。

        new ArrayList(map.values()).parallelStream()
              .peek(x -> System.out.println("processing "+x+" in "+Thread.currentThread()))
              .forEach(System.out::println);

output:

processing 1 in Thread[ForkJoinPool.commonPool-worker-3,5,main]
1
processing 2 in Thread[main,5,main]
2

正如中所解释的这个答案 https://stackoverflow.com/a/44802784/2711488，这个问题与以下事实有关：HashMap容量可能大于其大小，实际值根据哈希码分布在支持数组上。

对于所有基于数组的分割器，分割逻辑基本相同，无论您是流式传输数组还是流式传输ArrayList, or a HashMap。为了在尽力而为的基础上获得平衡的分割，每次分割将（索引）范围的一半，但在以下情况下HashMap，范围内的实际元素数量与范围大小不同。

原则上，每个基于范围的分割器都可以分割为单个元素，但是，客户端代码（即 Stream API 实现）到目前为止可能无法分割。甚至尝试拆分的决定也是由预期的元素数量和 CPU 核心数量决定的。

采取以下程序

public static void main(String[] args) {
    Map<String, Integer> map = new HashMap<>();
    map.put("a", 1);
    map.put("b", 2);

    for(int depth: new int[] { 1, 2, Integer.MAX_VALUE }) {
        System.out.println("With max depth: "+depth);
        Tree<Spliterator<Map.Entry<String, Integer>>> spTree
            = split(map.entrySet().spliterator(), depth);
        Tree<String> valueTree = spTree.map(sp -> "estimated: "+sp.estimateSize()+" "
            +StreamSupport.stream(sp, false).collect(Collectors.toList()));
        System.out.println(valueTree);
    }
}

private static <T> Tree<Spliterator<T>> split(Spliterator<T> sp, int depth) {
    Spliterator<T> prefix = depth-- > 0? sp.trySplit(): null;
    return prefix == null?
        new Tree<>(sp): new Tree<>(null, split(prefix, depth), split(sp, depth));
}

public static class Tree<T> {
    final T value;
    List<Tree<T>> children;

    public Tree(T value) {
        this.value = value;
        children = Collections.emptyList();
    }
    public Tree(T value, Tree<T>... ch) {
        this.value = value;
        children = Arrays.asList(ch);
    }
    public <U> Tree<U> map(Function<? super T, ? extends U> f) {
        Tree<U> t = new Tree<>(value == null? null: f.apply(value));
        if(!children.isEmpty()) {
            t.children = new ArrayList<>(children.size());
            for(Tree<T> ch: children) t.children.add(ch.map(f));
        }
        return t;
    }
    public @Override String toString() {
        if(children.isEmpty()) return value == null? "": value.toString();
        final StringBuilder sb = new StringBuilder(100);
        toString(sb, 0, 0);
        return sb.toString();
    }
    public void toString(StringBuilder sb, int preS, int preEnd) {
        final int myHandle = sb.length() - 2;
        sb.append(value == null? "": value).append('\n');
        final int num = children.size() - 1;
        if (num >= 0) {
            if (num != 0) {
                for (int ix = 0; ix < num; ix++) {
                    int nPreS = sb.length();
                    sb.append(sb, preS, preEnd);
                    sb.append("\u2502 ");
                    int nPreE = sb.length();
                    children.get(ix).toString(sb, nPreS, nPreE);
                }
            }
            int nPreS = sb.length();
            sb.append(sb, preS, preEnd);
            final int lastItemHandle = sb.length();
            sb.append("  ");
            int nPreE = sb.length();
            children.get(num).toString(sb, nPreS, nPreE);
            sb.setCharAt(lastItemHandle, '\u2514');
        }
        if (myHandle > 0) {
            sb.setCharAt(myHandle, '\u251c');
            sb.setCharAt(myHandle + 1, '\u2500');
        }
    }
}

你会得到：

With max depth: 1

├─estimated: 1 [a=1, b=2]
└─estimated: 1 []

With max depth: 2

├─
│ ├─estimated: 0 [a=1, b=2]
│ └─estimated: 0 []
└─
  ├─estimated: 0 []
  └─estimated: 0 []

With max depth: 2147483647

├─
│ ├─
│ │ ├─
│ │ │ ├─estimated: 0 []
│ │ │ └─estimated: 0 [a=1]
│ │ └─
│ │   ├─estimated: 0 [b=2]
│ │   └─estimated: 0 []
│ └─
│   ├─
│   │ ├─estimated: 0 []
│   │ └─estimated: 0 []
│   └─
│     ├─estimated: 0 []
│     └─estimated: 0 []
└─
  ├─
  │ ├─
  │ │ ├─estimated: 0 []
  │ │ └─estimated: 0 []
  │ └─
  │   ├─estimated: 0 []
  │   └─estimated: 0 []
  └─
    ├─
    │ ├─estimated: 0 []
    │ └─estimated: 0 []
    └─
      ├─estimated: 0 []
      └─estimated: 0 []

^{On ideone https://ideone.com/z3f1g0}

因此，如前所述，如果我们分割得足够深，分割器可以分割成单个元素，但是，两个元素的估计大小并不表明值得这样做。在每次分割时，它会将估计值减半，虽然您可能会说这对于您感兴趣的元素来说是错误的，但对于这里的大多数分割器来说实际上是正确的，因为当下降到最大级别时，大多数分割器代表一个空范围事实证明，将它们分开是一种资源浪费。

正如另一个答案中所述，该决定是关于平衡拆分工作（或一般准备工作）和预期并行化工作，而 Stream 实现无法提前知道这一点。如果您事先知道每个元素的工作量将非常高，为了证明更多的准备工作是合理的，您可以使用，例如new ArrayList<>(map.[keySet|entrySet|values]()) .parallelStream()强制平衡分割。通常，无论如何，对于较大的地图，问题会小得多。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？的相关文章

Java 字符串哈希码缓存

字符串不变性的优点之一是哈希码缓存以实现更快的访问在这种情况下如何处理具有相同哈希码的字符串的缓存在这种情况下它真的能提高性能吗在这种情况下如何处理具有相同哈希码的字符串的缓存被缓存的是字符串的哈希码它被缓存在私有的int字符
帮助我避免 JPA、Hibernate 和 MySQL 的连接超时

我正在使用 JPA Hibernate 作为提供者 Glassfish 和 MySQL 开发中一切都运行良好但是当我将应用程序部署到测试服务器并让它运行大部分空闲过夜时我通常会在早上遇到这样的情况 2011 03 09T15 06
我们可以在不使用 main 方法、静态变量和静态方法的情况下在控制台上打印 java 消息吗？

public class Test param args 1st way public static void main String args TODO Auto generated method stub System out prin
Active MQ - HelloWorld 示例异常

我正在尝试运行 hello world 示例在这里找到 http activemq apache org hello world html I added activemq all 5 5 1 jar已经到图书馆了它构建成功但出现以下警
从字符串生成密钥？

我需要从字符串生成一个密钥以便我始终可以从同一字符串创建相同的密钥具体来说是一个Key对象这样我就可以用它来创建Cipher进而创建SealedObject 这在 Java 中可行吗我应该考虑什么类方法组合才能做到这一点对于 A
在java中将DataURL图像转换为图像文件

我在我的 java servlet 中接收图像 DataURL 它看起来像 data image jpeg base64 9j 4AAQSkZJRgABAQAAAQABAA 我需要将其另存为图像文件我该怎么做 The simplest w
如何在 JdbcTemplate 中创建 mySQL 存储过程

背景为了解决 MySql 中某些语句只允许在存储过程中出现的问题我尝试在 JdbcTemplate 提交的 sql 中创建运行然后删除存储过程一个简单的例子是这恰好是在 Spring Boot 中 Service public c
在 Java 中创建带注释的对象时收到通知

Intent 我有一个自定义 Java 注释 DynamicField public class RESTEndpointInvoker DynamicField key httpTimeout private long httpTimeo
反应式 Spring Webflux REST 控制器内部重定向

我正在为 spring 反应项目创建简单的控制器服务器在设置重定向到另一个位置时我在调用时发现错误http localhost 8080 There was an unexpected error type Internal Serve
两条腿的 OAuth 和 Gmail Atom feed

我们正在尝试让 2 legged OAuth 与 Gmail Atom feed 一起使用我们使用 John Kristian Praveen Alavilli 和 Dirk Ba lfanz 贡献的 Java 库 http oauth
bufferedinputstream 中标记读取限制有什么用

我是Java流的新手我想读取特定的文件内容然后需要从头开始读取我创建了一个 BufferedInputStream 但我对 BufferedInputStream mark int markLimit 的文档感到困惑文档说 publ
Elasticsearch - EdgeNgram + 突出显示 + term_vector = 不好的突出显示

当我使用带有edgengram min 3 max 7 front term vector with positions offsets的分析器时文档包含文本 CouchDB 当我搜索 couc 时我的亮点是 cpu 而不是 couc
获取包中声明的所有 Java 类的名称

我正在编写一个功能它将有助于将类放入我的程序的某个包中另外我只想要子类某个类的类我需要这些类才能调用它们的静态方法有没有一种自动的方法来做到这一点如果是的话速度慢吗如果我不清楚我想要的是这样的 ArrayList
Java 中更高级的泛型

假设我有以下课程 public class FixExpr Expr
while 之后无法访问的语句[重复]

这个问题在这里已经有答案了我只是修改代码在以下代码中出现错误 int x 1 System out println x x while true x System out println x x 错误在最后一行我可以知道错误错误无
Struts2中的变量声明

Struts2中如何声明变量并为该变量赋值使用设置标签
Lucene/Hibernate 搜索锁定异常

我使用 Hibernate Search 在 Web 应用程序上索引和全文搜索项目没有问题来自我的 pom xml
如何列出Resources文件夹中的所有文件（java/scala）

我正在编写一个函数需要访问资源中的文件夹并循环遍历所有文件名如果这些文件符合条件则加载这些文件 new File getClass getResource images sprites getPath listFiles 返回空指针
使用正则表达式匹配阿拉伯文文本

我试图使用正则表达式仅匹配阿拉伯语文本但出现异常这是我的代码 txt matches P Arabic 这是例外情况线程 main 中的异常 java util regex PatternSyntaxException 索引 9 附近
使用 PDFBox 在 Android 中创建 PDF

我正在尝试通过我的 Android 应用程序创建 PDFPDFBoxapi 但出现以下错误 java lang NoClassDefFoundError org apache pdfbox pdmodel PDDocument 我已经将以下

随机推荐

TypeError：“Tensor”对象不支持 TensorFlow 中的项目分配

我尝试运行这段代码 outputs states rnn rnn lstm cell x initial state initial state sequence length real length tensor shape output
在 ORMLite 中为一个类创建多个表

我在 Android 上使用 ORMLite 并有以下问题是否可以基于单个 Java 类创建多个表这些表应该仅在名称上有所不同并且应该通过名称访问它们例如如果我有一堂课 public class Order DatabaseFie
标签和文本块之间的区别

根据训练套件两者有什么区别Label控制和TextBlock控制因为两者都是内容控件并且只显示文本 TextBlock 不是控件虽然TextBlock位于 System Windows Controls 命名空间中它不是一个控件它
scipy.io：无法写入 wavfile

我在将 2d numpy 数组写入波形文件音频时遇到问题根据文档我应该写一个 2d int16 numpy 数组 https docs scipy org doc scipy 0 18 1 reference generated sc
使用 PHP 进行树形图可视化？

除了 PHP 之外几乎所有语言似乎都有 TreeMap 的示例有人有一些基本代码的链接吗 http www neurofuzzy net 2006 04 28 treemap php source code http www neuro
向 DOM Element 对象添加属性有什么问题？

我一直在寻找一个直接的答案我可以想到很多可能性但我想知道真正的原因 jQuery 提供了 data 方法来将数据与 DOM Element 对象关联起来是什么使得这有必要直接向 DOM 元素对象添加属性或方法是否存在问题它是什
使用 CUDA 并行实现多个 SVD

我是使用 GPU 并行编程的新手因此如果问题广泛或模糊我深表歉意我知道 CULA 库中有一些并行 SVD 函数但是如果我有大量相对较小的矩阵需要分解应该采取什么策略例如我有n有维数的矩阵d n很大并且d是小如何并行化这个过程
Python pandas 无法读取带有一些奇怪编码和分割窗格的旧 Excel 文件

我正在尝试将旧的 Excel 文件导入 pandas 该文件是由 CropSyst 软件使用旧格式我不知道生成的并且默认情况下具有分割窗格这是快照一个解决方案可能是用excel打开文件并将其保存在xlsx中这样pandas可以毫
将 div 的高度设置为较大的值

我的身高限制有问题 div div 在某些网络浏览器中例如 Firefox 我有这样的 JavaScript 代码 MyDiv css height 20000000px 20 000 000 pixel height 但我看到heigh
python 脚本的管道输出

我在跑 sample py url http blah com没有错误但如果我运行 sample py url http blah com wc l或类似的我收到错误 UnicodeEncodeError ascii codec can
TypeScript 的 Angular 框架错误 - “没有将 exportAs 设置为 ngForm 的指令”

我在使用 TypeScript 的 Angular2 forms 框架时不断收到此错误没有directive将 exportAs 设置为 ngForm 这是我的代码项目依赖 dependencies angular common 2 0
将 grid.arrange 中的两个 ggplot 保存为 eps 文件格式

我在 RStudio 工作有两个 ggplot 称它们为plot1 和plot2 我想将它们排列在另一个之上并保存为 eps 格式我已阅读以下有关该主题的帖子使用 R 将图形导出到 eps 文件 https stackoverflow
React Native 动画 - 如何用动画将文本从中心移动到左侧？

我需要用动画将文本从中心移动到左侧我不能使用 screenWidth 2 和 marginLeft 来做到这一点因为这样我需要了解文本长度和其他内容才能将其放在中心也许有一种方法可以将 Interpolate 与 justifyCon
使用 RMagick 从 https 读取 pdf 会出现未经授权的错误

我正在尝试阅读 pdf 并将第一页保存为图像此方法适用于http 但不适用于https require RMagick url http www ke tu darmstadt de publications reports tud ke
如何构建 C# WinForms 模型-视图-呈现器（被动视图）程序？

我正在设计一个具有以下基本思想的 GUI 类似于 Visual Studio 的基本外观和感觉文件导航控制选择器用于选择编辑器组件中显示的内容 Editor 记录器错误警告确认等现在我将使用 TreeView 进行文件导航
从 Java bean 获取数据以显示在 JSP 页面上 [重复]

这个问题在这里已经有答案了我有一个论坛用户可以在其中注册详细信息并将其发送到 Servlet 然后发送到 Java bean 我遇到的问题是当请求 Java bean 时我无法将数据显示在另一个 JSP 页面上所以CreateA
C 反转无符号整数中的位

我正在使用按位运算符将无符号整数转换为二进制当前执行整数 1 来检查位是 1 还是 0 并输出然后右移 1 以除以 2 但是这些位以错误的顺序返回相反所以我想在开始之前反转整数中的位顺序有没有一种简单的方法可以做到这一点例子
如何在扩展弹出窗口中加载外部 JavaScript

我正在尝试构建一个页面操作扩展并且需要从弹出窗口加载外部 JavaScript 库它需要来自外部域以便发送正确的 cookie 但是我收到此错误消息拒绝加载脚本 http api flattr com js 0 6 load js
UITabBarItem.title 与 UINavigationController.title

我分配了一个带有标题 initWithTitle 的 UITabBarItem 并将其连接到 UINavigationController 我发现如果导航控制器的根视图控制器有自己的标题那么该标题将永久替换选项卡栏项目上指定的标题例如
为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？

hashmap有两个键值对它们不是由不同的线程并行处理的 import java util stream Stream import java util Map import java util HashMap class Ideone

为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？

为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？ 的相关文章

随机推荐

热门标签

为什么 Hashmap.values().parallelStream() 不能并行运行，而将它们包装在 ArrayList 中可以工作？的相关文章