将列表沿元素拆分为子列表

2024-05-07

我有这个清单（List<String>):

["a", "b", null, "c", null, "d", "e"]

我想要这样的东西：

[["a", "b"], ["c"], ["d", "e"]]

换句话说，我想使用将我的列表拆分为子列表nullvalue 作为分隔符，以获得列表的列表 (List<List<String>>）。我正在寻找 Java 8 解决方案。我尝试过Collectors.partitioningBy但我不确定这就是我要找的。谢谢！

尽管已经有几个答案，并且已经接受了答案，但这个主题仍然缺少一些要点。首先，共识似乎是使用流解决这个问题只是一种练习，传统的 for 循环方法更可取。其次，到目前为止给出的答案忽略了使用数组或向量式技术的方法，我认为这种方法大大改进了流解决方案。

首先，给出一个常规的解决方案，供讨论和分析之用：

static List<List<String>> splitConventional(List<String> input) {
    List<List<String>> result = new ArrayList<>();
    int prev = 0;

    for (int cur = 0; cur < input.size(); cur++) {
        if (input.get(cur) == null) {
            result.add(input.subList(prev, cur));
            prev = cur + 1;
        }
    }
    result.add(input.subList(prev, input.size()));

    return result;
}

这大部分都很简单，但也有一些微妙之处。一点是挂起的子列表来自prev to cur始终开放。当我们遇到null我们关闭它，将其添加到结果列表中，然后前进prev。循环结束后，我们无条件关闭子列表。

另一个观察结果是，这是索引上的循环，而不是值本身的循环，因此我们使用算术 for 循环而不是增强的“for-each”循环。但它表明我们可以使用索引流式传输来生成子范围，而不是流式传输值并将逻辑放入收集器中（如Joop Eggen 提出的解决方案 https://stackoverflow.com/a/29098447/1441122).

一旦我们意识到这一点，我们就可以看到null输入中的是子列表的分隔符：它是左侧子列表的右端，它（加一）是右侧子列表的左端。如果我们能够处理边缘情况，就可以找到一种方法，在该方法中我们可以找到索引null元素出现，将它们映射到子列表，并收集子列表。

结果代码如下：

static List<List<String>> splitStream(List<String> input) {
    int[] indexes = Stream.of(IntStream.of(-1),
                              IntStream.range(0, input.size())
                                       .filter(i -> input.get(i) == null),
                              IntStream.of(input.size()))
                          .flatMapToInt(s -> s)
                          .toArray();

    return IntStream.range(0, indexes.length-1)
                    .mapToObj(i -> input.subList(indexes[i]+1, indexes[i+1]))
                    .collect(toList());
}

获取索引null发生是很容易的。绊脚石正在增加-1在左边和size在右端。我选择使用Stream.of进行附加，然后flatMapToInt将它们压平。（我尝试了其他几种方法，但这个似乎是最干净的。）

这里使用数组作为索引会更方便一些。首先，访问数组的表示法比访问列表的表示法更好：indexes[i] vs. indexes.get(i)。其次，使用数组可以避免装箱。

此时，数组中的每个索引值（最后一个除外）都比子列表的起始位置减一。紧邻右侧的索引是子列表的末尾。我们只需流式传输数组并将每对索引映射到子列表中并收集输出。

讨论

流方法比 for 循环版本稍短，但更密集。 for 循环版本很熟悉，因为我们一直在 Java 中做这些事情，但如果您还没有意识到这个循环应该做什么，那么它并不明显。在弄清楚什么之前，您可能必须模拟一些循环执行prev正在做什么以及为什么必须在循环结束后关闭打开的子列表。（我最初忘记了它，但我在测试中发现了这一点。）

我认为，流方法更容易概念化正在发生的事情：获取一个指示子列表之间边界的列表（或数组）。这是一个简单的两行流。正如我上面提到的，困难在于找到一种将边缘值固定到末端的方法。如果有更好的语法来执行此操作，例如，

    // Java plus pidgin Scala
    int[] indexes =
        [-1] ++ IntStream.range(0, input.size())
                         .filter(i -> input.get(i) == null) ++ [input.size()];

它会让事情变得不那么混乱。（我们真正需要的是数组或列表理解。）一旦有了索引，将它们映射到实际的子列表并将它们收集到结果列表中就很简单了。

当然，并行运行时这是安全的。

更新2016-02-06

这是创建子列表索引数组的更好方法。它基于相同的原理，但它调整索引范围并向过滤器添加一些条件，以避免必须连接和平面映射索引。

static List<List<String>> splitStream(List<String> input) {
    int sz = input.size();
    int[] indexes =
        IntStream.rangeClosed(-1, sz)
                 .filter(i -> i == -1 || i == sz || input.get(i) == null)
                 .toArray();

    return IntStream.range(0, indexes.length-1)
                    .mapToObj(i -> input.subList(indexes[i]+1, indexes[i+1]))
                    .collect(toList());
}

更新2016-11-23

我在 Devoxx Antwerp 2016 上与 Brian Goetz 共同发表了演讲“并行思考”（video https://www.youtube.com/watch?v=2nup6Oizpcw）介绍了这个问题和我的解决方案。所提出的问题有一个轻微的变化，即在“#”而不是空上分割，但在其他方面是相同的。在演讲中，我提到我对这个问题进行了一系列单元测试。我将它们作为独立程序附加在下面，以及我的循环和流实现。对于读者来说，一个有趣的练习是针对我在这里提供的测试用例运行其他答案中提出的解决方案，并查看哪些解决方案失败以及原因。（其他解决方案必须适应基于谓词的拆分，而不是基于 null 的拆分。）

import java.util.*;
import java.util.function.*;
import java.util.stream.*;

import static java.util.Arrays.asList;

public class ListSplitting {
    static final Map<List<String>, List<List<String>>> TESTCASES = new LinkedHashMap<>();
    static {
        TESTCASES.put(asList(),
                  asList(asList()));
        TESTCASES.put(asList("a", "b", "c"),
                  asList(asList("a", "b", "c")));
        TESTCASES.put(asList("a", "b", "#", "c", "#", "d", "e"),
                  asList(asList("a", "b"), asList("c"), asList("d", "e")));
        TESTCASES.put(asList("#"),
                  asList(asList(), asList()));
        TESTCASES.put(asList("#", "a", "b"),
                  asList(asList(), asList("a", "b")));
        TESTCASES.put(asList("a", "b", "#"),
                  asList(asList("a", "b"), asList()));
        TESTCASES.put(asList("#"),
                  asList(asList(), asList()));
        TESTCASES.put(asList("a", "#", "b"),
                  asList(asList("a"), asList("b")));
        TESTCASES.put(asList("a", "#", "#", "b"),
                  asList(asList("a"), asList(), asList("b")));
        TESTCASES.put(asList("a", "#", "#", "#", "b"),
                  asList(asList("a"), asList(), asList(), asList("b")));
    }

    static final Predicate<String> TESTPRED = "#"::equals;

    static void testAll(BiFunction<List<String>, Predicate<String>, List<List<String>>> f) {
        TESTCASES.forEach((input, expected) -> {
            List<List<String>> actual = f.apply(input, TESTPRED);
            System.out.println(input + " => " + expected);
            if (!expected.equals(actual)) {
                System.out.println("  ERROR: actual was " + actual);
            }
        });
    }

    static <T> List<List<T>> splitStream(List<T> input, Predicate<? super T> pred) {
        int[] edges = IntStream.range(-1, input.size()+1)
                               .filter(i -> i == -1 || i == input.size() ||
                                       pred.test(input.get(i)))
                               .toArray();

        return IntStream.range(0, edges.length-1)
                        .mapToObj(k -> input.subList(edges[k]+1, edges[k+1]))
                        .collect(Collectors.toList());
    }

    static <T> List<List<T>> splitLoop(List<T> input, Predicate<? super T> pred) {
        List<List<T>> result = new ArrayList<>();
        int start = 0;

        for (int cur = 0; cur < input.size(); cur++) {
            if (pred.test(input.get(cur))) {
                result.add(input.subList(start, cur));
                start = cur + 1;
            }
        }
        result.add(input.subList(start, input.size()));

        return result;
    }

    public static void main(String[] args) {
        System.out.println("===== Loop =====");
        testAll(ListSplitting::splitLoop);
        System.out.println("===== Stream =====");
        testAll(ListSplitting::splitStream);
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将列表沿元素拆分为子列表的相关文章

Java程序中的数组奇怪的行为[重复]

这个问题在这里已经有答案了我遇到了这个 Java 程序及其以意想不到的方式运行以下程序计算 int 数组中元素对之间的差异 import java util public class SetTest public static void
解决错误：日志已在具有多个实例的atomikos中使用

我仅在使用atomikos的实时服务器上遇到问题在我的本地服务器上它工作得很好我在服务器上面临的问题是 init 中出错日志已在使用中完整的异常堆栈跟踪 java lang RuntimeException Log already
JNI 不满意链接错误

我想创建一个简单的 JNI 层我使用Visual studio 2008创建了一个dll Win 32控制台应用程序项目类型带有DLL作为选项当我调用本机方法时出现此异常 Exception occurred during even
IntelliJ IDEA 创建的 JAR 文件无法运行

我在 IntelliJ 中编写了一个跨越几个类的程序当我在 IDE 中测试它时它运行良好但是每当我按照教程将项目制作成 jar 可执行文件时它就不会运行双击 out 文件夹中的文件时该文件不会运行并显示无法启动 Java J
Microsoft Graph 身份验证 - 委派权限

我可以使用 Microsoft Graph 访问资源无需用户即可访问 https developer microsoft com en us graph docs concepts auth v2 service 但是此方法不允许我访问需
请求位置更新参数

这就是 requestLocationUpdates 的样子我使用它的方式 requestLocationUpdates String provider long minTime float minDistance LocationLis
反思 Groovy 脚本中声明的函数

有没有一种方法可以获取 Groovy 脚本中声明的函数的反射数据该脚本已通过GroovyShell目的具体来说我想枚举脚本中的函数并访问附加到它们的注释 Put this到 Groovy 脚本的最后一行它将作为脚本的返回值 a la
如何在 JFreeChart TimeSeries 图表上显示降雨指数和温度？

目前我的 TimeSeries 图表每 2 秒显示一个位置的温度现在如果我想每2秒显示一次降雨指数和温度我该如何实现呢这是我的代码 import testWeatherService TestWeatherTimeLapseSer
检查 protobuf 消息 - 如何按名称获取字段值？

我似乎无法找到一种方法来验证 protobuf 消息中字段的值而无需显式调用其 getter 我看到周围的例子使用Descriptors FieldDescriptor实例到达消息映射内部但它们要么基于迭代器要么由字段号驱动一旦我有
尝试使用 Ruby Java Bridge (RJB) gem 时出现错误“无法创建 Java VM”

我正在尝试实现 Ruby Java Bridge RJB gem 来与 JVM 通信以便我可以运行 Open NLP gem 我在 Windows 8 上安装并运行了 Java 所有迹象至少我所知道的都表明 Java 已安装并可运行
使用 AWS Java SDK 为现有 S3 对象设置 Expires 标头

我正在更新 Amazon S3 存储桶中的现有对象以设置一些元数据我想设置 HTTPExpires每个对象的标头以更好地处理 HTTP 1 0 客户端我们正在使用AWS Java SDK http aws amazon com sdkf
将多模块 Maven 项目导入 Eclipse 时出现问题 (STS 2.5.2)

我刚刚花了最后一个小时查看 Stackoverflow com 上的线程尝试将 Maven 项目导入到 Spring ToolSuite 2 5 2 中 Maven 项目有多个模块当我使用 STS 中的 Import 向导导入项目时所
Java中未绑定通配符泛型的用途和要点是什么？

我不明白未绑定通配符泛型有什么用具有上限的绑定通配符泛型 stuff for Object item stuff System out println item Since PrintStream println 可以处理所有引用类型通
应用程序关闭时的倒计时问题

我制作了一个 CountDownTimer 代码我希望 CountDownTimer 在完成时重新启动即使应用程序已关闭但它仅在应用程序正在运行或重新启动应用程序时重新启动因此如果我在倒计时为 00 10 分钟秒时关闭应用程序
使用 SAX 进行 XML 解析 |如何处理特殊字符？

我们有一个 JAVA 应用程序可以从 SAP 系统中提取数据解析数据并呈现给用户使用 SAP JCo 连接器提取数据最近我们抛出了一个异常 org xml sax SAXParseException 字符引用是无效的 XML 字符
如何在 Maven 中显示消息

如何在 Maven 中显示消息在ant中我们确实有 echo 来显示消息但是在maven中我该怎么做呢您可以使用 antrun 插件
当单元格内的 JComboBox 中有 ItemEvent 时，如何获取 CellRow

我有一个 JTable 其中有一列包含 JComboBox 我有一个附加到 JComboBox 的 ItemListener 它会根据任何更改进行操作但是 ItemListener 没有获取更改的 ComboBox 所在行的方法当组合框
KeyPressed 和 KeyTyped 混淆[重复]

这个问题在这里已经有答案了我搜索过之间的区别KeyPressedand KeyTyped事件但我仍然不清楚我发现的一件事是 Keypressed 比 KeyTyped 首先被触发请澄清一下这些事件何时被准确触发哪个适合用于哪个目的
使用 pandas 单元格中列表的长度选择行[重复]

这个问题在这里已经有答案了我有一张表 df a b c 1 x y x 2 x z c d 3 x t e f g 只是想知道如何使用 c 列的长度选择行 such as df loc len df c gt 1 我知道这是不对的正确的
JAVA - 如何从扫描仪读取文件中检测到“\n”字符

第一次海报我在读取文本文件的扫描仪中读取返回字符时遇到问题正在读取的文本文件如下所示 test txt start 2 0 30 30 1 1 90 30 0 test txt end 第一行 2 表示两个点第二行位置索引 0 xp

随机推荐

是否可以静默运行 .NET Core 控制台应用程序（隐藏控制台窗口）？

我正在尝试为自己自动化一些任务并且编写了一些 NET Core 1 0 控制台应用程序其中之一是 BrowserRouter 一个简单的应用程序它基于 URL 模式决定当我单击 HTTP S 链接时要打开哪个浏览器浏览器配置文件
访问 Linux 线程（pthreads）的本地堆栈

我目前正在实现一个使用多线程但对总内存消耗有要求的应用程序我希望有一个主线程执行 I O 并有几个工作线程执行计算目前我在主堆栈上有几个可供工作人员访问的数据结构我使用 OpenMP 进行工作分配由于主工作者模式不能很好地与 O
cmake MSYS Makefiles 生成器丢失

我通过 pacman 安装了 cmake 3 2 3 当我尝试从 msys64 shell 中使用它时出现错误 cmake G MSYS Makefiles CMake Error Could not create named genera
Winform 没有.NET 框架？

我必须创建一些表单并将其作为直接 EXE 提供而不是安装程序它安装 NET 框架最终用户对此不满意他们想要可以直接打开和工作的东西我知道它可以作为网络完成但我正在寻找 winforms 吗请建议哪种工具技术可以处理这个问题
不使用 razor viewengine 进行 Nancy 本地化

目前我在 Nancy 使用 razor 作为我的视图引擎我可以在剃刀中像这样访问我的资源文件 Text text greeting 但我想切换到不同的视图引擎是否有其他支持 TextResource 的视图引擎在超级简单的视图引擎中本
将“密码”类型添加到 Google Apps 脚本输入框

是否可以将密码类型分配给 Google Apps 脚本输入框以便不显示文本以下工作正常但输入字段是一个简单的文本框并显示文本而不是 Browser inputBox Please enter your password 我有一个
将现有项目文件夹添加到 eclipse 中的项目资源管理器

这里可能是一个非常直接的解决方案但似乎找不到答案我最近将 Eclipse 工作区更改为我的 dropbox 文件夹这样我在大学时可以在上网本上工作在家时可以在桌面上工作我将所有项目文件夹从旧工作区复制并粘贴到 dropbox 工作
什么时候应该使用 ThrowHelper 方法而不是直接抛出？

什么时候适合使用投掷助手方法而不是直接抛出 void MyMethod throw new ArgumentNullException paramName ThrowArgumentNullException paramName void
这个角色是什么？ ➡️0080➡0099

这个字符是什么 u0080 u0099 这应该是撇号或单引号我如何将它使用 Ruby 转换为简单的单引号或者在网页中将其作为单引号正确显示 Thanks 这是一个印刷正确的撇号更准确地说是右单引号 U 2019 经过一些错误的字符代
CORS 与 Amazon S3 和 Cloudfront

我有一个托管在 Heroku 上的 Rails 应用程序它使用 CloudFront 以及托管在 S3 上的资产它完美地显示了资产尽管需要一些努力我的 Cloudfront 设置 Forward Headers Whitelist
为什么 C# 中没有“fieldof”或“methodof”运算符？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案它们可以如下使用 FieldInfo field fieldof string Empty MethodInfo method1 methodo
Spark 按列重新分区，每列动态分区数

如何根据列中的项目数对 DataFrame 进行分区假设我们有一个包含 100 人的 DataFrame 列是first name and country 我们希望为一个国家地区的每 10 个人创建一个分区如果我们的数据集包含 80
Android快速查找网络上所有本地设备

我正在制作一个 Android 应用程序需要能够查看本地网络设备名称或 IP 目前我可以扫描网络并找到设备的本地IP 然而由于时间太长用户在搜索网络时会看到黑屏加载几分钟这是我当前正在使用的代码 private ArrayList
WCF - 进行多次调用时随机客户端超时

我有一个WPF客户端通过以下方式请求数据WCF服务托管于IIS 7 服务方法调用存储过程 SQL 2012 using EF检索一些数据由于需要加载大量数据因此客户端会多次调用服务方法以分解数据加载并避免大量负载和超时我们使用生
为什么recycleview数据无法与服务器端数据库数据同步

我正在使用rest api向我在android中的应用程序提供数据对于数据库我正在使用phpmyadmin并在本地主机中执行此操作一切顺利但是当我在数据库中添加新数据时我的recycleview无法与数据库中的最新数据同步因此当
Android 上的 Skobbler 地图显示黑屏

我正在使用 Skobbler SDK 2 3 0 针对 Lollipop 在 Nexus 5 和 Galaxy S4 上进行测试在 Android Studio 1 0 2 上构建我有一个带有导航抽屉和片段的 MainActivity
Zend url：获取参数始终保留在 url 中

我在使用带有 get 参数的 Zend url 帮助器时遇到一些问题在一个视图中我有分页它在 get 中发送额外的参数所以在 url 中所以没关系但这是不行的即使我更改页面参数也始终保留在 url 中事实上 zend ur
将 xml 传递给 jquery 脚本时出现问题

我正在尝试使用 jsp 中的 bufferedReader 从本地路径读取 xml 并尝试将 xml 传递给 jquery 脚本如下所示
使用 Antlr4 解析任意分隔符

我尝试在 Antlr4 中创建一个接受正则表达式的语法由任意字符分隔与 Perl 中的类似我怎样才能实现这个目标需要明确的是我的问题不是正则表达式本身实际上我不在 Antlr 中处理而是在访问者中处理而是分隔符我可以轻松地为
将列表沿元素拆分为子列表

我有这个清单 List

将列表沿元素拆分为子列表

将列表沿元素拆分为子列表 的相关文章

随机推荐

热门标签

将列表沿元素拆分为子列表的相关文章