SQLite3中确保唯一行的有效方法

2024-04-26

我在用SQLite3 http://www.sqlite.org/在我的一个项目中，我需要确保插入表中的行相对于某些列的组合而言是唯一的。在大多数情况下，插入的行在这方面会有所不同，但如果匹配，新行必须更新/替换现有行。

显而易见的解决方案是使用复合主键，并使用冲突子句来处理冲突。因此：

CREATE TABLE Event (Id INTEGER, Fld0 TEXT, Fld1 INTEGER, Fld2 TEXT, Fld3 TEXT, Fld4 TEXT, Fld5 TEXT, Fld6 TEXT);

变成这样：

CREATE TABLE Event (Id INTEGER, Fld0 TEXT, Fld1 INTEGER, Fld2 TEXT, Fld3 TEXT, Fld4 TEXT, Fld5 TEXT, Fld6 TEXT, PRIMARY KEY (Fld0, Fld2, Fld3) ON CONFLICT REPLACE);

这确实按照我的需要强制执行唯一性约束。不幸的是，这种变化也带来了性能损失，远远超出了我的预期。我做到了使用一些测试sqlite3命令行实用程序，以确保我的代码的其余部分没有错误。测试涉及输入 100,000 行，或者在单个事务或 100 个事务，每个事务 1,000 行。我得到以下结果：

                                | 1 * 100,000   | 10 * 10,000   | 100 * 1,000   |
                                |---------------|---------------|---------------|
                                | Time  | CPU   | Time  | CPU   | Time  | CPU   |
                                | (sec) | (%)   | (sec) | (%)   | (sec) | (%)   |
--------------------------------|-------|-------|-------|-------|-------|-------|
No primary key                  | 2.33  | 80    | 3.73  | 50    | 15.1  | 15    |
--------------------------------|-------|-------|-------|-------|-------|-------|
Primary key: Fld3               | 5.19  | 84    | 23.6  | 21    | 226.2 | 3     |
--------------------------------|-------|-------|-------|-------|-------|-------|
Primary key: Fld2, Fld3         | 5.11  | 88    | 24.6  | 22    | 258.8 | 3     |
--------------------------------|-------|-------|-------|-------|-------|-------|
Primary key: Fld0, Fld2, Fld3   | 5.38  | 87    | 23.8  | 23    | 232.3 | 3     |

我的应用程序目前最多执行 1,000 行事务，性能下降 15 倍令我感到惊讶。我预计吞吐量最多会下降 3 倍，而 CPU 使用率会上升，如 10 万事务案例中所示。我猜想维护主键约束所涉及的索引需要大量的同步数据库操作，因此在这种情况下我的硬盘成为瓶颈。

Using WAL mode http://www.sqlite.org/draft/wal.html确实有一些效果——性能提升约15%。不幸的是，这本身还不够。PRAGMA synchronous = NORMAL http://www.sqlite.org/pragma.html#pragma_synchronous似乎没有任何效果。

I might能够通过增加事务大小来恢复一些性能，但我宁愿不这样做，因为内存使用量增加以及对响应性和可靠性。

每行中的文本字段的长度可变，平均约为 250 字节。查询性能并不重要，但插入性能非常重要。我的应用程序代码是用 C 编写的，并且（应该）至少可以移植到 Linux 和 Windows。

有没有办法在不增加事务大小的情况下提高插入性能？要么是 SQLite 中的某些设置（即除了永久强制数据库进入异步操作之外的任何设置），还是以编程方式在我的应用程序代码中？例如，有没有一种方法可以在不使用索引的情况下确保行的唯一性？

BOUNTY:

通过使用我自己的答案中描述的散列/索引方法，我设法将性能下降程度控制在我的应用程序可能可以接受的程度。然而，似乎随着表中行数的增加，索引的存在使得插入变得越来越慢。

我对任何能够提高此特定用例中性能的技术或微调设置感兴趣，只要它不涉及破解 SQLite3 代码或以其他方式导致项目变得无法维护。

我使用 sqlite 在运行时插入数百万行，这就是我用来提高性能的方法：

使用尽可能少的交易。
使用参数化命令插入数据（准备命令一次，只需更改循环中的参数值）
Set PRAGMA同步 http://www.sqlite.org/pragma.html#pragma_synchronous关闭（不确定它如何与 WAL 一起工作）
增加数据库的页面大小。
增加缓存大小。这是一个重要的设置，因为它将导致 sqlite 实际将数据写入磁盘的次数更少，并且将在内存中运行更多操作，从而使整个过程更快。
如果您需要索引，请在插入行后通过运行必要的 sqlite 命令添加索引。在这种情况下，您需要自己确保唯一性，就像您现在所做的那样。

如果您尝试这些，请发布您的测试结果。我相信每个人都会感兴趣。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SQLite3中确保唯一行的有效方法的相关文章

Oracle 中的 TO_Char 数字格式模型

我不完全理解如何使用 to char 函数将数字转换为具有适当格式模型的字符串实际数字具有以下格式使用逗号作为小数点分隔符始终为 5 个小数整数最多可达 6 可能是无限的但目前绝不会超过 6 数字可以是正数或负数数字可以以 0
如何将 SQL 参数中的字符串数组传递给 SQL 中的 IN 子句

我正在以复杂的方式做一个逻辑我只需要在存储过程中执行此查询 select Sizes SUM Quantity from tbl SizeBreakup where Brand brand and Combo in 1 2 我必须在 C
从 Hibernate 生成 SQL 脚本

我正在为我的 Java Swing 应用程序使用 Hibernate 4 3 5 Final 并且我做了很多工作UDPATE INSERT and DELETE与它在 HQL 中或与Criteria 现在我想做的是导出对数据库所做的所有
为什么 Dart 中的原生包装函数与非常轻量级的“DEFINE NATIVE ENTRY”函数相比如此重量级？

我不明白为什么要这样保证这是自定义本机函数的包装器dart runtime vm native entry cc 它适用于想要编写的 Dart 程序员native extensions void NativeEntry NativeCa
time() 会返回相同的输出吗？

当用户注册时我正在为 PHP 中的用户生成令牌我想知道两个用户是否可以获得相同的令牌因为这会破坏系统请让我知道这是否足够 token md5 rand time 编辑我现在正在使用我在另一个问题上找到的generate uuid
使用 postgresql DB 存储 NULL 值需要多少磁盘空间？

假设我的表上有一列定义了以下内容 MyColumn smallint NULL 存储 0 1 或其他值等值应该需要 2 个字节 1 但是如果我将 MyColumn 设置为NULL 需要多少空间需要0字节吗出于管理目的或每列行是否有一些
使用 Oracle 中的 Join 查询进行更新

查询有什么问题它无限期地执行 UPDATE table1 t1 SET t1 col t1 Output SELECT t2 col t3 Output t2 col FROM tabl2 t3 LEFT JOIN table1 t2 O
JavaScript：字符串连接性能低下？ Array.join('')?

我读过如果我有一个for循环我不应该使用字符串连接因为它很慢例如 for i 0 i lt 10000000 i str a 相反我应该使用Array join 因为它更快 var tmp for i 0 i lt 10000000
什么是样板代码、热点代码和热点？

我知道这些术语是在性能实现优化的背景下使用的最近一直在研究这个问题并尝试过搜索但没有得到任何例子清楚地阐述描述这些概念以及在现实世界开发场景中实现这些问题概念有人可以彻底解释这些术语示例场景以及可能使用这些概念和术语的地方
如何在MySQL中选择字段具有最小值的数据？

我想从 MySQL 中的表中选择特定字段具有最小值的数据我尝试过 SELECT FROM pieces WHERE MIN price 请问有什么帮助吗这将为您提供所有记录中价格最低的结果 SELECT FROM pieces WHER
mysql中相同字符集和排序规则的varchar和nvarchar有什么区别

谁能告诉我具有相同字符集和整理的 varchar 和 nvarchar 之间有什么区别例子 varchar CHARACTER SET utf8mb4 COLLATE utf8mb4 unicode ci and nvarchar CHA
在 SQL where 子句中使用带有 IsDate 的 case 语句

我正在尝试清理以下代码中的 where 子句语句 SELECT CONVERT datetime UTC Time Stamp 127 AS TimeStamp FROM Table WHERE CASE WHEN ISDATE UTC T
将一行字段设置为其他 2 个字段的乘积

我有一个这样的SQL表结构 Id A B C D 1 1 5 6 25 2 2 10 5 25 3 3 7 4 25 4 1 6 5 26 5 2 10 5 26 6 3 8 3 26 我想写一个脚本它将更新所有B 和 C 列在行中A 3
如何在PostgreSQL事务中使用变量

如何在 Postgresql 事务内部将值获取到变量中如果 SELECT 没有返回任何内容则抛出错误如果 SELECT 返回数据则在事务中使用它们像这样 BEGIN activeRounds SELECT FROM rounds
为什么我的层次结构查询显示重复记录？

我的要求是找到一个月中所有过去的天数以下是我的示例查询 CREATE TABLE custom date full sno NUMBER curr date DATE INSERT INTO custom date full VALUES
当键是复合键时，metaData.getPrimaryKeys() 返回单行

我在使用 SQLite 驱动程序的 JDBC 中遇到复合主键问题 The getPrimaryKeys 方法从DatabaseMetaData当我验证该键实际上是由两列组成的复合键时对象返回单行有人对如何检索主键的真实列表有任何建议替
从大表中检索所有记录时如何避免 OOM（内存不足）错误？

我的任务是将一个巨大的表转换为自定义 XML 文件我将使用 Java 来完成这项工作如果我只是发出 SELECT FROM customer 它可能会返回大量数据最终导致 OOM 我想知道有没有一种方法可以在记录可用后立即处理该记录
SQL 层次结构 - 解析给定节点的所有祖先的完整路径

我有一个由邻接列表描述的层次结构不一定有单个根元素但我确实有数据来识别层次结构中的叶终端项所以一个看起来像这样的层次结构 1 2 4 7 3 5 6 8 9 将通过表格来描述就像这样 NOTE 我没有能力改变这种格式 id p
将数据表传递给存储过程

我有一个用 C 创建的数据表 using DataTable dt new DataTable dt Columns Add MetricId typeof int dt Columns Add Descr typeof string dt
在oracle sql中创建日期差异的自定义函数，排除周末和节假日

我需要计算两个日期之间的天数decimal 不包括周末和节假日 by 使用自定义函数在 Oracle SQL 中网站上也有类似的问题然而正如我所看到的它们都没有要求使用自定义函数将输出作为十进制我需要小数的原因是为了之后能够使用

随机推荐

IDX10603：算法：“HS256”要求 SecurityKey.KeySize 大于“128”位。报告的密钥大小：“32”。参数名称：key.KeySize

我刚刚使用 Asp Net Core Web API 并实现身份验证我从 Angular 应用程序调用这个 API 但我总是收到如下错误 IDX10603 算法 HS256 要求 SecurityKey KeySize 大于 128 位
将基于记录的列表/对象展平为数据帧

编辑这个问题已经过时了这jsonlite https cran r project org web packages jsonlite index html包装自动压平我正在处理具有基于记录的编码通常采用 JSON 的在线数据流对
Android NDK：从 JNI C 类调用 java 方法

我有 JNI 方法我试图在其中调用 Java 方法这是我的 JNI 代码 void DummySink afterGettingFrame unsigned frameSize unsigned numTruncatedBytes st
数据框中数据的遍历和操作

这是对前一个问题的参考是对该问题的扩展我想使用 Pandas 迭代 xlsx 包含时间戳并获取停机时间 https stackoverflow com questions 60808781 i want to iterate throu
重写线程池中线程的中断方法

假设我有这个 class Queue private static ExecutorService executor Executors newFixedThreadPool 1 public void use Runnable r Que
无法连接到 WSL2 内 docker 内的 mongo

我的设置有什么问题吗这是我的docker compose yml我从sudo docker compose up d 最终结果是这样的 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAM
RequireJS 在加载/解析依赖项之前调用回调

我遇到了 RequireJS 问题其中我的 main js 脚本引用了一个依赖项当运行 main js 中请求此依赖项的回调时该依赖项已加载但未解析我的目录结构是 index htm scripts require js main
测试链接服务器的连接并返回连接的链接服务器

我想编写一个脚本来测试所有链接的服务器并返回唯一连接的服务器肯定只有一个这是我当前的脚本但我陷入了困境 DECLARE retval INT DECLARE connected INT DECLARE name NVARCHAR 10
计算复合损失函数各部分的梯度范数

假设我有以下损失函数 loss a tf reduce mean my loss fn model output targets loss b tf reduce mean my other loss fn model output tar
java.lang.NullPointerException：尝试调用虚拟方法android

我是android的初学者我不知道我的代码有什么问题我需要你的帮助这是我的代码我正在尝试做一个计算器并且我删除了 if view pbtn 例如只是为了尝试 onclick 功能我找不到我的问题是什么 package com
如何避免 codeigniter 缓存

我们在 codeigniter 框架中开发了一个网站我们面临 codeigniter 缓存问题问题是这样的当用户登录时我们的标题栏信息应该是Welcome Mr xxxxx 如果用户注销我们的标题信息应该是 Welcome Gue
eGit/ZendStudio 9 生成的 Refspec HEAD:refs/for/refs/heads/master 是什么意思？

在 ZendStudio 9 中从 Git 设置一个项目基于 eclipse 和 eGit 它生成一个安静的正常获取引用规范 Remote Fetch Specification refs heads refs remotes origi
openssl_random_pseudo_bytes() 很慢（PHP）

我在 PHP 中使用 opennssl random pseudo bytes 它的执行速度非常慢我的应用程序经常超时引发执行时间限制错误 OpenSSL random 这么慢有什么特殊原因吗我目前在我的开发机器上使用 Windows
从 Docker 容器获取控制台输出

我构建了一个安装了 Python 的映像以及一个 Python 应用程序我的 Python 应用程序是你好世界应用程序只需打印 Hello World 屏幕上 Dockerfile FROM python 2 onbuild CMD
禁用SpringSecurity的SavedRequest存储逻辑

我们使用 Spring Security 来管理身份验证我们看到的问题是当用户的会话在调出 GET 表单和点击执行 POST 的保存按钮之间超时时它们会被发送到登录页面但 spring 会在会话中保存原始帖子信息我们的应用程序不会
使用PHP搜索MySQL并在同一页面显示结果

这绝对是一个新手问题但如果您能提供任何帮助我将非常感激基本上我正在构建一个数据库管理页面它当然包括搜索功能所以搜索表单看起来像这样
使用 jquery 将事件从一个元素复制到另一个元素

我的 DOM 是这样的 a href Element with events bound initially a a href Element to which events are bound in future a 还有这个 JavaS
如何在 AOSP 中向预构建应用程序（无源代码）添加额外权限

我有一个没有特定 android 权限的应用程序例如android permission CHANGE CONFIGURATION 我没有它的源代码我正在开发 AOSP 我预先构建了这个应用程序如下所示将APK放入 device m
了解 PerfView 中的 BLOCKED_TIME

我们怀疑在运行几个 ASP NET Core API 和几个 NET Core 控制台的服务器上遇到线程池饥饿的情况当我们怀疑线程池匮乏问题时我在我们的一台服务器上运行了 perfview 然而我在分析结果时遇到了一些麻烦 I ran
SQLite3中确保唯一行的有效方法

我在用SQLite3 http www sqlite org 在我的一个项目中我需要确保插入表中的行相对于某些列的组合而言是唯一的在大多数情况下插入的行在这方面会有所不同但如果匹配新行必须更新替换现有行显而易见的解决方案是使用

SQLite3中确保唯一行的有效方法

SQLite3中确保唯一行的有效方法 的相关文章

随机推荐

热门标签

SQLite3中确保唯一行的有效方法的相关文章