从 CSV 文件批量插入 - 跳过重复项

2023-12-23

更新：最终使用了 Johnny Bubriski 创建的这个方法，然后对其进行了一些修改以跳过重复项。效果就像一个魅力，而且速度显然相当快。关联：http://johnnycode.com/2013/08/19/using-c-sharp-sqlbulkcopy-to-import-csv-data-sql-server/ http://johnnycode.com/2013/08/19/using-c-sharp-sqlbulkcopy-to-import-csv-data-sql-server/

我一直在寻找这个问题的答案，但似乎找不到。我正在执行 T-SQL 批量插入，将数据从 csv 文件加载到本地数据库的表中。我的声明如下：

BULK INSERT Orders
FROM 'csvfile.csv'
WITH(FIELDTERMINATOR = ';', ROWTERMINATOR = '0x0a', FORMATFILE = 'formatfile.fmt', ERRORFILE = 'C:\\ProgramData\\Tools_TextileMagazine\\AdditionalFiles\\BulkInsertErrors.txt')
GO

SELECT * 
FROM Orders
GO

当我尝试插入重复行（例如两次获取相同的 csv 文件）时出现异常，这会导致整个插入停止并回滚。很容易理解，因为我违反了主键约束。现在我只是显示一个消息框，让用户知道 csv 文件中存在重复项，但这当然不是一个正确的解决方案，实际上根本不是一个解决方案。我的问题是，有没有办法忽略这些重复的行并跳过它们并仅添加不重复的行？也许以某种方式尝试捕获？

如果不可能，从 csv 文件导入数据的“正确”（由于缺乏更好的词）方法是什么？这个异常给我带来了一些麻烦。我确实在某处读到，您可以设置一个临时表，将数据加载到其中，并在插入之前在两个表之间选择不同的值。但真的没有更简单的方法来实现批量插入吗？

您可以设置MAXERRORS属性设置为相当高，这将允许插入有效记录并忽略重复项。不幸的是，这意味着数据集中的任何其他错误都不会导致加载失败。

或者，您可以设置BATCHSIZE属性将在多个事务中加载数据，因此如果存在重复项，它只会回滚批次。

一种更安全但效率较低的方法是将 CSV 文件加载到一个单独的空表中，然后将它们合并到您提到的订单表中。就我个人而言，这就是我会这样做的方式。

这些解决方案都不是理想的，但我想不出一种忽略批量插入语法中的重复项的方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 CSV 文件批量插入 - 跳过重复项的相关文章

这是过滤数据并防止 SQL 注入和其他攻击的安全方法吗？

我创建了两个简单的函数来在插入数据进入 mysql 查询之前对其进行过滤对于表单字段我还使用正则表达式来单独检查每个字段 Form filter function filter var HTML is not allowed var s
使用 xmlagg 时出现子查询错误和太多值

我在连接许多大型表中的所有数据时遇到问题我昨天对此提出了问题但不幸的是 listagg 似乎不是一个好的选择链接子查询返回多行 https stackoverflow com questions 54651144 subquery r
当我输入 dateadd 或 datediff 代码时，我总是收到此错误“ORA-00904“DATEADD”无效标识符。”

我有一个大学项目并且有一个包含入院和出院日期属性的患者表我需要删除超过 7 年的记录我使用了以下代码 delete from patient where dis date gt datedadd yy 7 getdate 我收到错误
如何将整行（在 SQL 中，而不是 PL/SQL 中）传递给存储函数？

我遇到以下非常简单问题我想编写一个 Oracle SQL 查询大致如下 SELECT count MyFunc MyTable FROM MyTable GROUP BY MyFunc MyTable 在 PL SQL 中可以使用
在 Doctrine DQL 中选择 count() ，并使用左连接多对多单向关系，其中用户没有关系特定组

情况我尝试在 DQL 中为不属于特定组的用户选择 count 标准ManyToMany之间的单向关系User and Group实体来自FOSUserBundle and SonataUserBundle 系统 Symfony 2 5 D
SQLite 条件 ORDER BY 中的 DESC

我需要选择按以下逻辑排序的记录但是当 DESC 处于条件中时 SQLite 会引发错误 ORDER BY CASE WHEN parentGUID IS NULL THEN datePosted DESC ELSE datePosted
最佳实践 - 存储过程日志记录

如果您有一个长时间运行的 SP 您会以某种方式记录其操作还是只是等待此消息命令成功完成我认为关于这个主题可以有很多解决方案但是有没有最佳实践一个经常使用的简单解决方案 EDIT 我发现了一个关于这个主题的有趣链接 http web
将数组值导出到 csv 文件 java

我只需要帮助将数组元素导出到 csv 文件我不知道我的代码有什么问题任何帮助将不胜感激谢谢 for int index 0 index lt cols length index FileWriter fw new FileWriter
如何在测试期间强制锁定升级（以消除死锁问题）？

在此发布问题和一个答案也许有人有更好的答案编写触发死锁的代码是可能的即使对于单个用户如果开发人员不小心打开了与数据库的第二个连接而不是重用现有的连接可能已经有一个打开的事务某些 O RM 和 LINQ 框架很容易犯这个错误以下是
在 SQL Server SELECT 语句中使用 CASE 时消除 NULL

我有一份大而混乱的报告要写它连接了 5 个表一个表中有一列用于多个不同的值本质上是一个标签列其中标签根据用户想要使用的各种元数据的类型以创造性的方式使用因此我对报告的查询返回 3 个几乎相同的行仅标签列有所不同例如
优化 LINQ 查询 - 如何缩短执行时间？

我想知道是否有一个好的方法来优化我的 LINQ 查询我正在使用类似于以下内容的 LINQ 查询从数据库检索数据 PKs is a list of integers var import context table Where x gt P
如何在postgres中获取数组大小大于1的数组

我有一个看起来像这样的表 val fkey num 1 1 1 1 2 1 1 3 1 2 3 1 我想要做的是返回一组行其中值按 val 分组并带有一个 fkey 数组但仅限于 fkey 数组大于 1 的情况因此在上面的示例中
仅基于月份和年份的 SQL Server 日期比较

我无法确定仅根据月份和年份比较 SQL 中的日期的最佳方法我们根据日期进行计算由于计费是按月进行的因此该月的日期会造成更多障碍例如 DECLARE date1 DATETIME CAST 6 15 2014 AS DATETIME
PLSQL 中的时区转换

我需要将系统日期和时间转换为特定时区例如东部时间我无法假设我当前的时区如何在plsql中转换它请帮我假设你有一个TIMESTAMP WITH TIME ZONE 例如systimestamp 您可以使用AT TIME ZONE句法
为什么这个 oracle 批量插入不起作用？

我正在尝试将一些数据批量插入到 oracle 数据库中我按照文档中的示例进行操作 this DataBaseAccess new OracleConnection connString var dataAdapter new Oracle
读取r中不同目录中的多个文件[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想从不同的目录读取多个 csv 文件然后将其放入单个数据框中我有两种目录可供阅读 A LogIIS 文件夹01 文件 csv 在
在 Dockerfile 中切换到 root 用户

我运行了这个命令 docker pull mcr microsoft com mssql server 2019 latest 然后我创建了一个 dockerfile 来使用此容器映像作为另一个容器的基础映像 escape FROM mcr
数据库设计1对1关系

我的数据库设计不正确我应该在开发过程中解决这个问题吗假定 user 表与 userprofile 表具有 1 1 关系然而实际设计中用户表与用户配置文件表具有 1 关系一切正常但无论如何应该修复它吗做一件事 User
PDO 连接字符串：最好的方法是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我想使用 php pdo 制作一个后端应用程序我发现了很多不同的方法来处理 PDO 连接字符串我想知道使用 pdo 执行连接字符串的最佳方法
执行存储过程时 ExecuteNonQuery() 返回 -1

我正在尝试在 Visual Studio 中执行存储过程下面给出 CREATE PROCEDURE dbo addStudent stuName varchar 50 address varchar 100 tel varchar 15

随机推荐

单调的堆栈和队列。定义和例子

到底什么是单调堆栈例如它与单调队列有何不同例如考虑以下整数数组 0 2 1 3 4 如果我从左到右处理这个数组并将其插入到单调递减的堆栈中我应该在堆栈中看到什么为什么 Here http www leetcode solutio
Nginx 具有不同根的多个位置

我的 nginx 配置非常简单里面有 3 个位置他们每个人都有自己的根目录我将来应该能够轻松添加另一个根目录我想要的是 Request admin gt 位置 admin Request admin gt 位置 admin Requ
无法将不可变值作为 inout 参数传递：函数调用返回不可变值

我分叉了这个项目所以我不太熟悉所有细节 https github com nebs hello bluetooth blob master HelloBluetooth NSData 2BInt8 swift https github c
如何使数据类更好地与 __slots__ 配合使用？

It 已决定 https github com ericvsmith dataclasses issues 28删除对的直接支持 slots 来自 Python 3 7 的数据类尽管如此 slots 仍然可以与数据类一起使用 from d
将 TextField 绑定到 ReadOnlyDoubleProperty

我可以绑定一个TextField的文本属性为DoubleProperty 像这样 textField textProperty bindBidirectional someDoubleProperty new NumberStringCon
将数据插入 SQL Server 返回错误代码 00q

首先我的代码的最大部分是在几周前工作的与此同时我们从 MySQL 服务器更换为 SQL 服务器并且对架构设计进行了一些更改我使用 Percobol 据我所知它使用 OpenCobol 编译器 PERFORM 2010 GEBRU
Dynamic_cast<> 是否仅限于沿着继承层次结构进行直接转换？

CODE struct A virtual details there but left out struct B virtual details there but left out struct C A B virtual detail
WaitHandle.WaitAll 64 个句柄限制的解决方法？

我的应用程序通过以下方式生成不同的小工作线程负载ThreadPool QueueUserWorkItem我通过多个跟踪ManualResetEvent实例我用WaitHandle WaitAll方法阻止我的应用程序关闭直到这些线程完成
如何向 RCpp 中的数据框添加新列？

我正在尝试使用 RCpp 向数据框添加新列在下面的代码中我打算向数据框 df 添加一个结果列但运行代码后数据集没有结果列你能告诉我他们出了什么问题吗 R 文件调用 AddNewCol 函数 library Rcpp sour
如何在 Perl 中将数组转换为散列？

我有一个数组并尝试将数组内容转换为带有键和值的哈希值索引 0 是键索引 1 是值索引 2 是键索引 3 是值依此类推但它没有产生预期的结果代码如下 open FILE message xml die Cannot open
初始拒绝后使用 getUserMedia() 重新提示权限

在被拒绝一次后我们如何使用 getUserMedia 请求相机麦克风访问权限我正在使用 getUserMedia 来访问用户的相机并将数据通过管道传输到画布那一点一切都很好在测试中我点击了一次拒绝此时在 Chrome 和 F
如何伪造Time.now？

最好的设置方法是什么Time now为了在单元测试中测试时间敏感的方法我真的很喜欢Timecop https github com travisjeffery timecop图书馆您可以以块形式进行时间扭曲就像时间扭曲一样 Timec
如何从特定模块创建所有装饰函数的向量？

我有一个文件main rs和一个文件rule rs 我想定义函数rule rs将被纳入Rules rule矢量而不必将它们一一推动我更喜欢一个循环来推动它们 main rs struct Rules rule Vec
错误 1054。Insert 子句中的未知列

我有这个问题如果我编写以下查询 INSERT INTO prodotto Barcode InseritoDa DataInserimento UrlImage VALUES vfr ff 12 10 2012 vfr jpg 我收到此错
自定义弹出菜单（布局）

我正在尝试升级我的 PopupMenu 以便它带有图标和自定义样式我为它创建了一个新的布局
位置无关可执行文件的正确 Xcode 设置是什么

最近刚刚开始收到一封应用商店提交后的电子邮件其中包含以下建议请确保您的构建设置已配置为创建 PIE 可执行文件然而 XCode 中的设置看起来是正确的在链接部分我发现不创建位置无关的可执行文件设置为否双重否定YUK 您收到此
Android排序数组

我如何按日期或名称对该数组进行排序 String datetable new String 21 2 datetable 0 0 2011 01 01 datetable 0 1 Name1 datetable 1 0 2011 01 03
为什么宽度/高度不适用于非定位伪元素？

我想设置一个width of before伪元素达到80 如果我使用定位那么一切都会正常但如果我不使用它那么一切都会失败你能解释一下为什么百分比宽度在没有定位的情况下不起作用吗如果可以的话请添加一些对规范的引用 position
jQuery 方法链接是流畅编程的一个例子吗？

我对 JavaScript jQuery 有点陌生但是当我看到方法链接的示例时我立即感到熟悉其他接口如 LINQ 执行类似的操作其中一组方法的返回类型与它们所操作的类型相同 TweetSharp 执行的操作非常类似这是流畅编程的
从 CSV 文件批量插入 - 跳过重复项

更新最终使用了 Johnny Bubriski 创建的这个方法然后对其进行了一些修改以跳过重复项效果就像一个魅力而且速度显然相当快关联 http johnnycode com 2013 08 19 using c sharp sq

从 CSV 文件批量插入 - 跳过重复项

从 CSV 文件批量插入 - 跳过重复项 的相关文章

随机推荐

热门标签

从 CSV 文件批量插入 - 跳过重复项的相关文章