摸不着头脑,flatMap处理后居然无法去重(原来是数据库添加字段的时候多了个空格= =)

2023-11-12

前言

这应该是一个bug。这是一篇毫无营养的博客。

当我正在尝试从页面中获取作者时,发现之前应该被Set包装的作者字符串居然发生了重复,于是我赶紧回到源码处,并加了条log日志,开始排查问题

我的代码是这样的:

// 查作者(绝对也会有)
Set<String> collect2 = bookByCategoryId.stream().flatMap(book->{
	String author = book.getAuthor();
	String[] split = author.split(";");
	return Arrays.asList(split).stream();			
}).distinct().collect(Collectors.toSet());

bookByCategoryId是我的book集合。一本书的作者可能会有多个,我选择使用;(冒号),把每一个作者隔开。

问题来了,这是结果图:

在这里插入图片描述
分号使用得很成功,但无论是Set还是distinct,都无法完成去重。

于是我做了三个测试

第一个测试

使用原始字符集合测试:

在这里插入图片描述
毫无意外,测试成功了,使用distinct就可以圆满完成任务。

所以我猜测是不是因为自定义类型的问题?

第二个测试

使用自定义book(并和我的原始book一样,使用@Data注解)

在这里插入图片描述
开始测试:

在这里插入图片描述
这里使用的是Set,很完美的结果。

似乎回到原点了,我依然不清楚到底是什么导致我无法去重,于是我开始测试其他属性,例如:分类Id。

第三个测试

分类id:

在这里插入图片描述

这次总算没让我大跌眼镜,终于就在这时,我想起来了会不会是我复制粘贴的时候,字符串多了空格?导致匹配失败的?

我去数据库看了看,发现作者后面还真是多了一个空格,到此问题终于解决了。(小白落泪)。在知道原因后,看控制台也发现一个字符也确实比后面的多了一个空格。(恨不得给自己打一耳光,浪费了一个小时多的时间。比起人脑,机器是不可能出错的啊)


结尾的小总结

复制粘贴也不是一定可靠,尤其是在网页复制粘贴的时候(会有很多奇奇怪怪的空格)

处理字符串需要特别严谨:

  1. null和""不是一回事。
  2. 处理前应该把左右两边的空格去掉。

集合也是一样,null和size() == 0 也不是同一件事。

stream处理后的集合的值不可能会是null,但size()可能是0。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

摸不着头脑,flatMap处理后居然无法去重(原来是数据库添加字段的时候多了个空格= =) 的相关文章

  • Guice 忽略注入构造函数参数上的 @Nullable

    我正在使用 Guice v 3 0 并且有一个值被注入到构造函数中 该值可以为 null 因此我在构造函数中使用 Nullable 来自 javax annotations 注释了该参数 public MyClass Parameter1
  • 如何强制jar使用(或jar运行的jvm)utf-8而不是系统的默认编码

    我的Windows默认编码是GBK 而我的Eclipse完全是utf 8编码 因此 在我的 Eclipse 中运行良好的应用程序崩溃了 因为导出为 jar 文件时这些单词变得不可读 我必须在 bat 文件中写入以下行才能运行该应用程序 st
  • HAProxy SSL终止+客户端证书验证+curl/java客户端

    我希望使用我自己的自签名证书在 HAProxy 上进行 SSL 终止 并使用我创建的客户端证书验证客户端访问 我通过以下方式创建服务器 也是 CA 证书 openssl genrsa out ca key 1024 openssl req
  • 文本在指定长度后分割,但不要使用 grails 打断单词

    我有一个长字符串 需要将其解析为长度不超过 50 个字符的字符串数组 对我来说 棘手的部分是确保正则表达式找到 50 个字符之前的最后一个空格 以便在字符串之间进行彻底的分隔 因为我不希望单词被切断 public List
  • 为什么Iterator接口没有add方法

    In IteratorSun 添加了remove 方法来删 除集合中最后访问的元素 为什么没有add方法来向集合中添加新元素 它可能对集合或迭代器产生什么样的副作用 好的 我们开始吧 设计常见问题解答中明确给出了答案 为什么不提供 Iter
  • 如何检测图像是否像素化

    之前有人在 SO 上提出过这样的问题 在Python中检测像素化图像 https stackoverflow com questions 12942365 detecting a pixelated image in python还有关于q
  • Java:从集合中获取第一项

    如果我有一个集合 例如Collection
  • 当 minifyEnabled 为 true 时 Android 应用程序崩溃

    我正在使用多模块应用程序 并且该应用程序崩溃时minifyEnabled true in the installed模块的build gradle 以下是从游戏控制台检索到的反混淆堆栈跟踪 FATAL EXCEPTION Controlle
  • 在 Clojure 中解压缩 zlib 流

    我有一个二进制文件 其内容由zlib compress在Python上 有没有一种简单的方法可以在Clojure中打开和解压缩它 import zlib import json with open data json zlib wb as
  • Play.application() 的替代方案是什么

    我是 Play 框架的新手 我想读取conf文件夹中的一个文件 所以我用了Play application classloader getResources Data json nextElement getFile 但我知道 play P
  • Java - 从 XML 文件读取注释

    我必须从 XML 文件中提取注释 我找不到使用 JDOM 或其他东西来让它们使用的方法 目前我使用 Regex 和 FileReader 但我不认为这是正确的方法 您可以使用 JDOM 之类的东西从 XML 文件中获取注释吗 或者它仅限于元
  • IntelliJ 组织导入

    IntelliJ 是否具有类似于 Eclipse 中的组织导入功能 我拥有的是一个 Java 文件 其中多个类缺少导入 例子 package com test public class Foo public Map map public J
  • 避免 Java 中的重复导入:继承导入?

    有没有办法 继承 导入 Example 常见枚举 public enum Constant ONE TWO THREE 使用此枚举的基类 public class Base protected void register Constant
  • Lombok @Builder 不创建不可变对象?

    在很多网站上 我看到 lombok Builder 可以用来创建不可变的对象 https www baeldung com lombok builder singular https www baeldung com lombok buil
  • 如何从 Ant 启动聚合 jetty-server JAR?

    背景 免责声明 I have veryJava 经验很少 我们之前在 Ant 构建期间使用了 Jetty 6 的包装版本来处理按需静态内容 JS CSS 图像 HTML 因此我们可以使用 PhantomJS 针对 HTTP 托管环境运行单元
  • 如何处理 StaleElementReferenceException

    我正在为鼠标悬停工作 我想通过使用 for 循环单击每个链接来测试所有链接的工作条件 在我的程序中 迭代进行一次 而对于下一次迭代 它不起作用并显示 StaleElementReferenceException 如果需要 请修改代码 pub
  • Hadoop NoSuchMethodError apache.commons.cli

    我在用着hadoop 2 7 2我用 IntelliJ 做了一个 MapReduce 工作 在我的工作中 我正在使用apache commons cli 1 3 1我把库放在罐子里 当我在 Hadoop 集群上使用 MapReduceJob
  • 替换文件中的字符串

    我正在寻找一种方法来替换文件中的字符串而不将整个文件读入内存 通常我会使用 Reader 和 Writer 即如下所示 public static void replace String oldstring String newstring
  • JMS 中的 MessageListener 和 Consumer 有什么区别?

    我是新来的JMS 据我了解Consumers能够从队列 主题中挑选消息 那么为什么你需要一个MessageListener因为Consumers会知道他们什么时候收到消息吗 这样的实际用途是什么MessageListener 编辑 来自Me
  • 检查应用程序是否在 Android Market 上可用

    给定 Android 应用程序 ID 包名称 如何以编程方式检查该应用程序是否在 Android Market 上可用 例如 com rovio angrybirds 可用 而 com random app ibuilt 不可用 我计划从

随机推荐

  • Spring WebFlux编写响应式Controller接口

    文章目录 一 基本概念 1 什么是响应式编程 2 响应式流中的各个角色和关系 二 Reactor简介 1 Mono与Flux 三 Spring WebFlux 1 简介 2 构建响应式Controller 3 使用函数式编程模型编写API
  • docker--扩展学习-网络--命令--15

    docker 扩展学习 网络 命令 15 1 创建网络 1 1 简单创建容器 创建 docker network create net111 查看 docker network inspect net111 1 2 指定参数创建容器 创建
  • rabbitmq基础1——消息中间件概念、Rabbitmq的发展起源和基本组件的作用流程

    文章目录 一 消息中间件 1 1 概念 1 2 作用 1 2 1 消息队列持久化 1 2 2 消息队列分发策略 1 2 3 消息队列的高可用和高可靠 1 2 3 1 一主多从共享集群 1 2 3 2 一主多从同步集群 1 2 3 3 多主多
  • Go语言编程思想4——测试与性能调优

    Go语言编程思想4 测试与性能调优 Debugging Sucks Testing Rocks 多做测试 少做调试 Go语言使用表格驱动测试 一 传统测试 正确结果在前 函数结果在后 判断是否相等 测试逻辑和测试数据混在一起 出错信息不明确
  • .NET开发框架的选择历程

    去年来新公司后第一件事就是应领导要求 选择一款合适的开发框架 之前有熟悉的开发框架 Extjs NET简单三层 对于一般的企业后台管理系统够用了 但是现在Extjs这种前段端架基本被淘汰了 后端简单三层也显得非常落伍 但是对于选框架这个事情
  • zerotier使用教程_ZeroTier 初阶教程

    什么是 ZeroTier ZeroTier delivers the capabilities of VPNs SDN and SD WAN with a single system Manage all your connected re
  • stem函数--Matplotlib

    stem函数 Matplotlib 函数功能 Create a stem plot 创建棉棒图 A stem plot plots vertical lines at each x location from the baseline to
  • mysql常用命令有什么

    MySQL 数据库常用命令 1 MySQL常用命令 create database name 创建数据库 use databasename 选择数据库 drop database name 直接删除数据库 不提醒 show tables 显
  • 神经网络预测彩票数据

    一 人工智能深度学习神经网络在双色球彩票中的应用研究 一 https www cnblogs com zdz8207 p DeepLearning NeuralNetworks html 二 百度AI http ai baidu com p
  • js逆向-某399游戏登陆参数

    声明 本文仅供学习参考 禁止用于其他途径 违者后果自负 前言 目标网站 aHR0cHM6Ly93d3cuNDM5OS5jb20v 登陆接口 aHR0cHM6Ly9wdGxvZ2luLjQzOTkuY29tL3B0bG9naW4vbG9naW
  • 基于树莓派4B设计的智能家居系统(华为云IOT)

    基于树莓派的智能家居控制系统 华为云IOT 一 设计需求 前言 本次设计实现了一个基于树莓派的智能家居系统 可以对家庭环境进行实时监测和控制 提高居家安全性和舒适度 该系统采用了多种传感器和模块 包括温湿度传感器 烟雾传感器 火焰传感器 光
  • virtualenv: error: unrecognized arguments: --no-site-packages

    使用virtualenv version 看到自己的版本大于20 就可以将如下这段删除 export VIRTUALENVWRAPPER VIRTUALENV ARGS no site packages 我碰到的情况下 user makef
  • 机器学习算法之决策树

    原文 http www jianshu com p 6eecdeee5012 决策树是一种简单高效并且具有强解释性的模型 广泛应用于数据分析领域 其本质是一颗由多个判断节点组成的树 如 决策树 在使用模型进行预测时 根据输入参数依次在各个判
  • Go语言网络编程(socket编程)WebSocket编程

    1 WebSocket编程 1 1 1 webSocket是什么 WebSocket是一种在单个TCP连接上进行全双工通信的协议 WebSocket使得客户端和服务器之间的数据交换变得更加简单 允许服务端主动向客户端推送数据 在WebSoc
  • 关于epoll的IO模型是同步异步的一次纠结过程

    这篇文章的结论就是epoll属于同步非阻塞模型 这个东西貌似目前还是有争议 在新的2 6内核之后 epoll应该属于异步io的范围了 golang的高并发特性就是底层封装了epoll模型的函数 但也有文章指出epoll属于 伪AIO 真正的
  • IOS之同步请求、异步请求、GET请求、POST请求

    1 同步请求可以从因特网请求数据 一旦发送同步请求 程序将停止用户交互 直至服务器返回数据完成 才可以进行下一步操作 2 异步请求不会阻塞主线程 而会建立一个新的线程来操作 用户发出异步请求后 依然可以对UI进行操作 程序可以继续运行 3
  • PyQt5 笔记5 -- 消息框(QMessageBox)

    PyQt5 笔记5 消息框 QMessageBox 1 常用函数 函数原型 信息框 QMessageBox information self 框名 内容 按钮s 默认按钮 问答框 QMessageBox question self 框名 内
  • 西门子PLC学习笔记十-(计数器)

    S7 300 400的计数器一般占两个字节 是16位的 CPU最多可以使用64 512个计数器 计数器地址编号为C0 C511 1 S CUD 加减计数器 加减计数器波形图 2 S CU 加计数器 3 S CD 减计数器 4 三种计数器对应
  • Unity制作多屏幕解决方案

    最近制作了一个多屏幕的项目 多屏幕指的是一个电脑主机 连接多个显示器 我这个项目使用了一个显卡连接了三个显示设备 Unity UGUI提供Canvas画布 在画布上有一个TargetDisplay的解决解决方案 Canvas结合Camera
  • 摸不着头脑,flatMap处理后居然无法去重(原来是数据库添加字段的时候多了个空格= =)

    前言 这应该是一个bug 这是一篇毫无营养的博客 当我正在尝试从页面中获取作者时 发现之前应该被Set包装的作者字符串居然发生了重复 于是我赶紧回到源码处 并加了条log日志 开始排查问题 我的代码是这样的 查作者 绝对也会有 Set