由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV）

2024-05-08

我有一个 37 列的 CSV 文件，我正在使用 Apache Commons CSV 1.2 在 Java 中解析该文件。我的设置代码如下：

//initialize FileReader object
FileReader fileReader = new FileReader(file);

//intialize CSVFormat object
CSVFormat csvFileFormat = CSVFormat.DEFAULT.withHeader(FILE_HEADER_MAPPING);

//initialize CSVParser object
CSVParser csvFileParser = new CSVParser(fileReader, csvFileFormat);

//Get a list of CSV file records
List<CSVRecord> csvRecords = csvFileParser.getRecords();

// process accordingly

我的问题是，当我将要处理的 CSV 复制到目标目录并运行解析程序时，出现以下错误：

Exception in thread "main" java.lang.IllegalArgumentException: Index for header 'Title' is 7 but CSVRecord only has 6 values!
        at org.apache.commons.csv.CSVRecord.get(CSVRecord.java:110)
        at launcher.QualysImport.createQualysRecords(Unknown Source)
        at launcher.QualysImport.importQualysRecords(Unknown Source)
        at launcher.Main.main(Unknown Source)

但是，如果我将文件复制到目标目录，打开并保存它，然后再次尝试该程序，它就可以工作。打开并保存 CSV 会在末尾添加所需的逗号，这样我的程序就不会因为没有足够的标头可供读取而抱怨。

对于上下文，这里是保存之前/之后的示例行：

之前（失败）：“数据”，“数据”，“数据”，“数据”

之后（工作）：“数据”，“数据”，，，，“数据”，，，“数据”，，，，，，

所以我的问题是：为什么当我打开并保存 CSV 格式时它会发生变化？我没有更改任何值或编码，保存时的行为与 MS-DOS 或常规 .csv 格式相同。另外，我在测试中使用 Excel 进行复制/打开/保存。

我需要使用一些编码或格式设置吗？我可以通过编程解决这个问题吗？

提前致谢！

EDIT #1:

对于其他上下文，当我第一次查看原始文件中的空行时，它只有新行 ^M 字符，如下所示：

^M

在 Excel 中打开并保存后，它看起来像这样，其中包含所有 37 个空字段：

,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,^M

这是 Windows 编码差异吗？

也许这与最初生成该文件的内容存在兼容性问题。 Excel 似乎接受空行作为有效行，每列中包含空字符串，列数与其他行相匹配。然后它根据 CSV 约定并使用列分隔符保存它。（^M 是回车符；在 Microsoft 系统上，它位于文本文件中行尾的换行符之前）

也许您可以通过创建自己的解决方案来处理它Reader https://docs.oracle.com/javase/8/docs/api/java/io/Reader.html位于 FileReader 和 CSVParser 之间的子类。您的阅读器将读取一行，如果该行为空，则返回包含正确逗号数量的行。否则就按原样返回该行。

例如：

class MyCSVCompatibilityReader extends BufferedReader
    {
    private final BufferedReader delegate;

    public MyCSVCompatibilityReader(final FileReader fileReader)
        {
        this.delegate = new BufferedReader(fileReader);
        }

    @Override
    public String readLine()
        {
        final String line = this.delegate.readLine();
        if ("".equals(line.trim())
            { return ",,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,"; }
        else
            { return line; }
        }
    }

实现接口时还有很多其他细节需要正确实现。您需要传递对所有其他方法（关闭、就绪、重置、跳过等）的调用，并确保每个方法read()方法工作正常。如果文件很容易适合内存，那么只需读取文件并将固定版本写入新文件可能会更容易字符串编写器 https://docs.oracle.com/javase/8/docs/api/java/io/StringWriter.html然后创建一个字符串读取器 https://docs.oracle.com/javase/8/docs/api/java/io/StringReader.html到 CSVParser。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV）的相关文章

热重载在docker中运行的java程序

我开发了一个java程序应该在docker中运行然而我在调试docker中运行的java程序时遇到了很多痛苦我在网上搜索一些教程提出了像 spring dev tools 这样的工具因为我的java程序是基于spring boo
如何在一行中将字符串数组转换为双精度数组

我有一个字符串数组 String guaranteedOutput Arrays copyOf values values length String class 所有字符串值都是数字数据应转换为Double QuestionJava 中
AES 加密 Java/plsql

我需要在Java和plsql DBMS CRYPTO for Oracle 10g 上实现相同的加密解密应用程序两种实现都工作正常但这里的问题是我对相同纯文本的加密得到了不同的输出下面是用于加密解密过程的代码 Java 和 PLS
如何测试 JUnit 测试的 Comparator？

我需要测试 Compare 方法但我对如何测试感到困惑我可以看看该怎么做吗 public class MemberComparator implements Comparator
CXF Swagger2功能添加安全定义

我想使用 org apache cxf jaxrs swagger Swagger2Feature 将安全定义添加到我的其余服务中但是我看不到任何相关方法或任何有关如何执行此操作的资源下面是我想使用 swagger2feature 生成
使用 ANTLR 为 java 源代码生成抽象语法树

如何使用 ANTLR 从 java src 代码生成 AST 有什么帮助吗好的步骤如下前往ANTLR站点 http www antlr org 并下载最新版本下载Java g和JavaTreeParser g文件来自here htt
R在Windows平台Rstudio上打印data.frames中的UTF-8代码

当数据框中存在UTF 8字符时将无法正常显示例如以下内容是正确的 gt U6731 1 朱但是当我将其放入数据框中并打印出来时它是 gt data frame x U6731 x 1
Convert.FromBase64String 方法的 Java 等效项

Java 中是否有相当于Convert FromBase64String http msdn microsoft com en us library system convert frombase64string aspx which 将指
Prim 的迷宫生成算法：获取相邻单元格

我基于 Prim 算法编写了一个迷宫生成器程序该算法是 Prim 算法的随机版本从充满墙壁的网格开始选择一个单元格将其标记为迷宫的一部分将单元格的墙壁添加到墙壁列表中 While there are walls in the li
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
无法理解 Java 地图条目集

我正在看一个 java 刽子手游戏 https github com leleah EvilHangman blob master EvilHangman java https github com leleah EvilHangman b
检查 Android 手机上的方向

如何查看Android手机是横屏还是竖屏当前配置用于确定要检索的资源可从资源中获取Configuration object getResources getConfiguration orientation 您可以通过查看其值来检查方向
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
尝试使用 Ruby Java Bridge (RJB) gem 时出现错误“无法创建 Java VM”

我正在尝试实现 Ruby Java Bridge RJB gem 来与 JVM 通信以便我可以运行 Open NLP gem 我在 Windows 8 上安装并运行了 Java 所有迹象至少我所知道的都表明 Java 已安装并可运行
Keycloak - 自定义 SPI 未出现在列表中

我为我的 keycloak 服务器制作了一个自定义 SPI 现在我必须在管理控制台上配置它我将 SPI 添加为模块并手动安装因此我将其放在 module package name main 中并包含 module xml 我还将其放
Android JNI C 简单追加函数

我想制作一个简单的函数返回两个字符串的值基本上 java public native String getAppendedString String name c jstring Java com example hellojni He
将2-3-4树转换为红黑树

我正在尝试将 2 3 4 树转换为 java 中的红黑树但我无法弄清楚它我将这两个基本类编写如下以使问题简单明了但不知道从这里到哪里去 public class TwoThreeFour
如何修复“sessionFactory”或“hibernateTemplate”是必需的问题

我正在使用 Spring Boot JPA WEB 和 MYSQL 创建我的 Web 应用程序它总是说 sessionFactory or hibernateTemplate是必需的我该如何修复它我已经尝试过的东西删除了本地 Mav
java迭代器内部是如何工作的？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个员工列表 List
Swagger/Openapi-Annotations：如何使用 $ref 生成 allOf？

我正在生成 Rest 端点包括添加OpenAPI Swagger对生成的代码进行注释虽然它对于基本类型运行得很好但我在自定义类方面遇到了一些问题现在我有很多自定义类的重复架构条目使用 Schema 实现 MyClass class

随机推荐

如何在xamarin表单中更改屏幕亮度

我有 xamarin 形式的 qr 页面我想要的是当 qr 显示时屏幕亮度会更亮但我找不到解决方案我在互联网上找到了一些代码但它返回时带有一些错误代码消息编辑我删除了源代码因为它看起来让一些人感到困惑我尝试的代码是针对 xa
Magento 如何通过静态块/页面中的 id 链接到类别

我正在寻找使用以下方法从静态块链接到一个类别category id 有什么想法吗我已经进行了通常的搜索但没有结果目前我可以做类似的事情 a href 但这并不稳健使用类别链接小部件内联链接代码 widget type catalog
如何在 Firefox 和 IE 中获得自定义滚动条？

我正在使用自定义滚动它在 chrome 中工作正常但在 Firefox 或 IE9 中不起作用这是CSS webkit scrollbar width 7px height 1px webkit scrollbar thumb hei
如何在窗体上双缓冲 .NET 控件？

如何设置受保护DoubleBuffered遭受闪烁的窗体上的控件的属性这是一个更通用的版本假人的解决方案 https stackoverflow com questions 76993 how to double buffer net c
在辅助监视器中创建 WPF 窗口时遇到问题

我正在努力在应用程序中实现一些类似 Chrome 的选项卡功能但在正确生成新实例时遇到一些问题我已经对各种解决方案进行了大量搜索和迭代但尚未能够在第二台显示器上生成新窗口这是使用线程打开文件将当前选项卡拖至其他显示器新的应用程
故事板入口点缺失

在 xcode 7 2 中对象列表中没有 Storyboard Entry Point 项我需要使用 Storyboard Entry Point 我通过谷歌搜索找不到任何类似的问题所以任何人都可以在这里帮助我单击要作为情节提要入口
从数据帧字典中获取单独的数据帧 Python

我有一本字典d充满了数据帧的集合 key type size value gm1 dataframe mxn gm2 dataframe mxN gm10 dataframe nxM 我想使用它们来一一输出这些数据帧keys作为新数据框的名
如何在 Bash 中为数组赋值？

我正在尝试从文本文件中读取值列表你好 txt 并将它们存储在一个数组中 counter 0 cat hello txt while read line do Unix Array counter line let counter coun
Kafka 适合运行公共 API 吗？

我有一个想要发布的事件流它被划分为主题不断更新需要水平扩展并且没有 SPOF 很好并且可能需要在某些情况下重播旧事件所有的功能似乎都与 Kafka 的功能相匹配我想通过任何人都可以连接并获取事件的公共 API 将其发布到全世界
如何在 PHPWord 中更改纸张大小

如何更改phpword中的纸张大小我想将纸张尺寸更改为 Legal 纸张 8 5 英寸 x 14 英寸我在文档中找不到该选项我不确定如何应用该规则并且文档中似乎没有与此相关的纸张或大小 https phpword readth
如何将vue文件样式提取到一个单独的style.css文件中

我正在使用 vue loader 默认情况下对于每个 vue 文件您的视图中都有一个样式标签这不是一件好事根据 vue loader 文档我可以做到这一点 https vue loader vuejs org en configur
修改SQL Server中的默认值

我正在尝试使用 SQL Server 2008 中的 SQL 语句更改列的默认值我在很多地方找到了如何在创建表添加列时设置默认值但没有找到如何设置它一旦列已经存在就修改它这就是我可以用来在添加时设置它的内容 ALTER TABLE
R 中第三维的平均值

R中是否有任何快速方法或内置函数来计算基于第三维的平均值例如我的数组是 1 1 2 1 1 3 2 2 4 2 1 2 1 11 13 2 12 14 3 1 2 1 21 23 2 22 24 我的输出是 1 2 1 mean 1 11
我是否需要在我的 Firebase 项目中添加 SHA-1 指纹？

在 Firebase 上有一个弹出窗口显示我的项目可以添加指纹 SHA1 因为我只想使用一些 Firebase 服务例如实时数据库身份验证我需要在我的项目中添加指纹吗该图显示仅在使用某些 Google Play 服务如 OAu
img 标签如何通过 cors 标头获取内容

为什么当我使用 fetch 从禁用响应 CORS 标头的服务器加载数据时我预期会收到错误 Failed to load http www imgworlds com wp content uploads 2015 12 18 CONTAC
在 MVC 中使用 Request.URL 和 Request.URLReferrer 获取当前链接的替代方案？

我希望在我的中编写一个方法属性BaseController允许任何操作获取当前 URL 的类如果我打电话localhost Keyword Edit 1我可以用Request Url获取网址但是如果我的编辑视图中有部分视图我需要使
SQLite3 数学函数 Python

更新 SQLite 版本 3 5 0 后可以使用 SQL 数学函数如果我在 pycharm 查询中使用它它效果很好但我无法在 python 代码中执行查询然后我收到以下错误消息 pandas io sql DatabaseErro
在 LaTeX 中自动将新句子中第一个单词的第一个字母大写

我知道 LaTeX 的吹嘘点之一是它没有这种微软式的行为尽管如此它有时还是有用的 LaTeX 已经在您键入非反斜杠句点后添加了一个额外的空格因此应该可以使其自动将后面的字母大写是否有一个明显的方法来编写一个宏来执行此操作或者是
Python 中的“Zip”列表字典

我有一个列表字典我想将它们合并到一个命名元组列表中我想要第一个元组中所有列表的第一个元素第二个元组中的第二个元素依此类推 Example key1 1 2 3 key2 4 5 6 key3 7 8 9 我希望生成的列表如下所示 k
由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV）

我有一个 37 列的 CSV 文件我正在使用 Apache Commons CSV 1 2 在 Java 中解析该文件我的设置代码如下 initialize FileReader object FileReader fileReader

由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV）

由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV） 的相关文章

随机推荐

热门标签

由于保存之前/之后的 CSV 差异而导致错误解析（Java w/ Apache Commons CSV）的相关文章