Spring Batch：聚合记录和写入计数

2023-12-20

我们有一些数据来自平面文件。例如

EmpCode,Salary,EmpName,...  
100,1000,...,...
200,2000,...,...
200,2000,...,...
100,1000,...,...
300,3000,...,...
400,4000,...,...

我们想根据 EmpCode 聚合工资并写入数据库：

Emp_Code    Emp_Salary   Updated_Time   Updated_User 
100         2000         ...            ...
200         4000         ...            ...
300         3000         ...            ...
400         4000         ...            ...

我按照 Spring Batch 编写了类，如下所示

ItemReader - to read the employee data into a Employee object

示例 Employee ItemProcessor：

public class EmployeeProcessor implements ItemProcessor<Employee, Employee> {

    @Override
    public Employee process(Employee employee) throws Exception {
        employee.setUpdatedTime(new Date());
        employee.setUpdatedUser("someuser");
        return employee;
    }

员工项目作者：

@Repository
public class EmployeeItemWriter implements ItemWriter<Employee> { 
 @Autowired
 private SessionFactory sf;

 @Override  
 public void write(List<? extends Employee> employeeList) throws Exception {  
  List<Employee> aggEmployeeList = aggregateEmpData(employeeList);
  //write to db using session factory
 }  

 private List<Employee> aggregateEmpData(List<? extends Employee> employeeList){
     Map<String, Employee> map = new HashMap<String, Employee>(); 
    for(Employee e: employeeList){
        String empCode =  e.getEmpCode();
        if(map.containsKey(empCode)){
            //get employee salary and add up
         }else{
          map.put(empCode,Employee);
         }
     }    
     return new ArrayList<Employee>(map.values());         
 }
}

XML配置

...
<batch:job id="employeeJob">
    <batch:step id="step1">
    <batch:tasklet>
        <batch:chunk reader="employeeItemReader" 
            writer="employeeItemWriter" processor="employeeItemProcessor"
            commit-interval="100">
        </batch:chunk>
    </batch:tasklet>
    </batch:step>
  </batch:job>
...

它正在发挥作用并服务于我的目的。不过，我有几个问题。

1）当我查看日志时，显示如下（commit-interval=100）：

状态=已完成，exitStatus=已完成，readCount=2652，filterCount=0，写入次数=2652readSkipCount=0、writeSkipCount=0、processSkipCount=0、commitCount=27、rollbackCount=0

但聚合后，只有 2515 条记录写入数据库。写入次数为2652。是否是因为到达ItemWriter的项目数仍然是2652？如何纠正这个问题？

2）我们对列表进行两次迭代。一次在 ItemProcessor 中，然后在 ItemWriter 中进行聚合。如果记录数量较多，则可能会出现性能问题。有没有更好的方法来实现这一目标？

如果输入文件的每一行都是一个员工对象，那么你的读取计数将是输入文件中的行数。写入次数将是传递给项目编写器的所有列表的大小总和。所以，也许你的聚合员工数据函数删除或聚合一些记录到一条记录中，因此，您的数据库计数与写入次数。如果你想确保写入次数正是数据库中的记录数，您应该在处理器中进行聚合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Spring

SpringBatch

Spring Batch：聚合记录和写入计数的相关文章

使用 Spring 的 SimpleNamingContextBuilder 的应用程序如何知道在其目录中搜索资源？

使用 Spring 的应用程序如何SimpleNamingContextBuilder http static springsource org spring docs 3 0 x api org springframework mock
Spring Stomp over Websocket：流式传输大文件

我的SockJs客户端在网页中发送帧大小为16K的消息消息大小限制决定了我可以传输的文件的最大大小以下是我在文档中找到的内容 Configure the maximum size for an incoming sub protoco
如何在 Spring MongoDB 聚合上投影 DBRef？

我在 MongoDB shell 中完成了以下聚合以获取每个用户每种类型的警报数量 db getCollection alerts aggregate unwind son group id son son level level cou
使用 Swagger UI 进行基本身份验证

我正在尝试通过 Swagger UI 开发一个基于 spring boot 的 REST API 服务以及 API 文档我想通过 swagger UI 启用基本身份验证以便用户只有在使用 swagger UI 上的授权按钮进行身份验
如何配置 Spring-WS 以使用 JAXB Marshaller？

感谢您到目前为止对此的帮助我正在更新问题因为我没有显示我需要的所有内容并显示了建议的更改肥皂输出仍然不是我想要的 servlet xml
如何配置Spring boot分页从第1页开始，而不是从0开始

boot 1 4 0 可分页用于分页它工作正常没有任何问题但默认情况下页面值从 0 开始但在前端页面值从 1 开始那么是否有任何标准方法来增加值而不是手动增加代码内的页码 public Page
在spring data jpa中实现动态数据源

我有 N 个服务器 N 个数据库和 N 个配置看下面的场景因此对于每个请求我都需要根据配置访问服务器和数据库 spring data jpa如何实现动态数据源你可以试试抽象路由数据源 https docs spring io sp
在 Freemarker 模板中检查 Spring 安全角色和记录的用户名

有谁知道 freemarker 标签来检查 freemarker 文件中的 spring 安全角色和用户名我从网络上的几个资源中发现以下代码将打印登录的用户名但它没有打印用户名而是打印登录为
如何使用注释处理 Hibernate 和 Spring 中的连接查询？

我正在使用 Spring 和 Hibernate 以及 MySQL 开发应用程序我是 Hibernate 新手完成了基本任务现在我需要在选择查询中应用联接以使用注释从多个表中获取数据我已经搜索过但仍然没有任何想法这是我的数据库表和
如何防止嵌入式netty服务器使用spring-boot-starter-webflux启动？

我想使用 Springs 新的反应式在客户端和服务器应用程序之间建立通信webflux扩大对于依赖管理我使用gradle 我在服务器和客户端上的 build gradle 文件基本上是 buildscript repositories m
Maven：缺少工件 org.springframework:spring:jar:4.2.6

我在 SpringToolSuite 中有一个动态 Web 项目它被转换为 Maven 项目我遇到问题缺少工件 org springframework spring jar 4 2 6 我已经尝试清理重建和运行该项目它给读取文件
如何设置 Hibernate 读取/写入不同的数据源？

使用 Spring 和 Hibernate 我想写入一个 MySQL 主数据库并从基于云的 Java Web 应用程序中的另一个复制从属数据库中读取数据我找不到对应用程序代码透明的解决方案我真的不想更改我的 DAO 来管理不同的 Se
如何在 Spring JMS 监听器中从 JMS 消息获取自定义属性

我知道您可以通过以下方式访问 Spring JMS 侦听器中的标准标头 public void receive String in Header JmsHeaders MESSAGE ID String messageId 是否有类似的注释
创建名称为 bean 时出错：作用域“请求”对于当前线程无效

我集成了SWF 2 2 1 Primefaces 2 2 1 JSF 2 Spring Security 3 Spring 3 1 0M1I和EhCache AspectJ和Castor 我在 app config xml 中为castor
JPA：EntityManager 保存数据花费的时间太长

我有一个 csv 数据文件总共有 100 000 条记录我正在迭代记录并尝试为每条记录更新 5 个表这是示例数据 EAN Code Site Genric Material Material Sap Ean Code Style Co
Spring Boot 3 网关显示 503 service_unavailable

我得到了一个NotFoundException 503 SERVICE UNAVAILABLE网关服务器日志中出现异常我在 Docker 容器中运行微服务我有一个auth service处理身份验证和 Jwt 的微服务我可以使用 Po
HibernateTemplate 可以与 EntityManager 共存吗？

我们有一个 spring 3 应用程序它仍然使用已弃用的HibernateTemplate为了持久性并希望迁移到更现代的 JPAEntityManager 是否可以在迁移过程中并行使用这两个 API 甚至可能在单个事务中同时使用以便我们
异步不适用于控制器的抽象超类方法

我有一个BaseRestControllerRest 控制器扩展的类它有一个我想异步运行的方法 public abstract class BaseRestController Async someThreadPoolTaskExecut
如何从 jQuery 获取 ajax 请求下载 Excel

我有一个 Spring MVC 视图它提供了一个 excel 文件但是我现在修改了该过程以便用户获得一个模式框他们可以在下载 excel 之前在其中选择一些选项这些选定的选项将发送到视图我的请求看起来像这样 get downl
Hibernate 返回 PersistentBag 而不是 List

我在下面给出的两个实体之间有以下关系当我从存储库获取 OutletProductVariety 对象时即使在使用 fetchtype Eager 后价格也会出现在 PersistentBag 中而不是作为列表 Entity publ

随机推荐

为什么我不能在抽象 C# 类上创建抽象构造函数？

我正在创建一个抽象类我希望我的每个派生类都被迫实现构造函数的特定签名因此如果我想强迫他们实现一种方法我做了我会做的事情我做了一个抽象的方法 public abstract class A abstract A int a int
Typescript 中带有 Observable 的 XMLHttpRequest

当我尝试管理上传文件的 XMLHttpRequest 调用的结果时我遇到了 tslint 问题这是我目前在互联网上找到的方法 Files upload request makeFileRequest url string files A
如何使用 CURLOPT_HEADERFUNCTION 读取单个响应标头字段？

我正在实现一个 C 程序它需要从读取远程文件的大小Content Length标题当Content Length在响应标头中发送我查看了 libcurl 的文档到目前为止我能想到的最好的方法是回调函数CURLOPT HEADERFU
在 Access VBA 中实施正则表达式以提高密码复杂性

我目前正在开发一个需要密码验证的项目因为最终用户可以更改其登录密码但没有验证来确保给定的密码符合规定这有点棘手因为我对使用 VBA 和正则表达式相当陌生而且我找不到我正在寻找的答案该项目有一个 Access 2010 前端虽然
如何在 MySQL 中强制复合唯一性？

我遇到了一种情况我想确保表的复合元素是唯一的例如 Table id char 36 primary key fieldA varChar 12 not null fieldB varChar 36 not null 我不希望 field
CentOS安装mod_dav_svn

我正在尝试在 centos 5 VPS 上安装 subversion 我设法安装了 subversion 但是当我尝试这样做时yum install mod dav svn我收到此错误错误缺少依赖项 httpd mmn 包裹需要2005
如何从 zlib 确定 gzip 数据的压缩大小？

我正在使用 zlib 执行 gzip 压缩 zlib 将数据压缩后直接写入打开的 TCP 套接字 socket fd is a file descriptor for an open TCP socket gzFile gzf gzdope
Rust 中精确的内存布局控制？

据我所知 Rust 编译器可以对结构的每个字段进行打包重新排序和添加填充如果需要的话如何指定精确的内存布局在 C 中我有StructLayout属性并且在 C C 中我可以使用各种编译器扩展我可以通过检查预期值位置的字节偏移
Android NDK 包括使用 Gradle 和 CMake 的第 3 方预构建共享库

我正在努力将预构建的共享库包含在我的 android 项目中有问题的库是 libusb 我的 android 项目的 NDK 部分需要它一切都编译和链接正常即项目正在成功构建但是在我的设备上安装 apk 时应用程序崩溃了来自监视
如果端口已使用，spring-boot 自动更改端口

我正在使用 Windows 命令来运行带有 embedded tomcat 的 spring boot 应用程序此外我需要使用 CommandlineRunner 运行许多控制台应用程序我正面临端口使用问题 APPLICATION F
FlowType：类型的继承（类型A是类型B的子集...）

自发布以来流动 42 https github com facebook flow releases tag v0 42 0 你可以使用对象类型传播 type TypeB TypeA 我想这确实是关于 FlowType 的初学者类型的问题
在没有 XML 的情况下配置 JPA/Hibernate/PostgreSQL

我又回到了 Java 世界并尝试使用 JPA Hibernate 和 PostgreSQL 配置一个新的 Spring Web 应用程序我发现了很多带有各种 XML 配置文件的旧示例我想知道是否有一种首选的新方法可以在不依赖 XML
如何使用js自动下载PDF？

我的场景是 PDF 文件自动下载然后用户填写它当单击 PDF 中的提交按钮时它会连接到 java servlet 并将其保存在数据库中用户点击按钮 JavaScript 代码自动运行并下载 PDF 文件自动使用 JavaScrip
覆盖 Swagger 排序

我想按相反的字母顺序组织我的 swagger api 但它默认为按字母顺序有没有一种简单的方法可以做到这一点具体使用 Swashbuckle Core 5 2 1 您可以为这两个操作的 UI 创建一个排序器 operationsSort
ASP.NET Web API 操作方法参数的依赖注入

我正在使用 C 开发一个 ASP NET Web API 项目用于移动应用程序的 JSON 接口我的想法是为所有请求创建接口然后仅在 Web API 代码中使用这些接口我最终得到了这样的结果 public interface IAp
如何允许在 Delphi 中拖动特定控件的文件

我想在有人将文件放到特定控件例如 TMemo 时立即接受文件我从这个例子开始 http delphi about com od windowsshellapi a accept filedrop htm http delphi abou
在C#中添加记录时如何处理数据表中的唯一约束异常

我已经像这样向数据表添加了唯一约束 DataTable dtemp private void TempTable dtemp new DataTable Temp dtemp Columns Add new DataColumn Table
如何在 Python 中验证 RSA SHA1 签名？

我有一个字符串一个签名和一个公钥我想验证字符串上的签名关键看起来像这样 BEGIN PUBLIC KEY MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQDfG4IuFO2h LdDNmonwGNw5srW
为什么要发送没有负载的 UDP 数据包？

看来 UDP 数据包可以在没有负载的情况下发送我能想到的唯一不需要负载的就是 NAT 打洞这还能用来做什么这与我之前的问题有关在 Linux 下 recv 能否在 UDP 上返回 0 https stackoverflow com q
Spring Batch：聚合记录和写入计数

我们有一些数据来自平面文件例如 EmpCode Salary EmpName 100 1000 200 2000 200 2000 100 1000 300 3000 400 4000 我们想根据 EmpCode 聚合工资并写入数据库 E

Spring Batch：聚合记录和写入计数

Spring Batch：聚合记录和写入计数 的相关文章

随机推荐

热门标签

Spring Batch：聚合记录和写入计数的相关文章