Postgres Select ILIKE %text% 在大字符串行上运行缓慢

2024-01-12

我有一个只有 7 列的表，其中一列存储每一行的长文本数据。该文本列数据的平均字符长度约为 1500 个字符。该表有 500.000 行。

当我使用选择查询而不使用该文本列时，没有问题，查询按预期需要 10 秒。

但是如果我将这个长文本列添加到我的查询中，例如Select * from table_1完成此查询并使用 dataadapter 填充数据表需要 3 或 4 分钟。

为什么我需要查找所有长文本列记录？因为我需要对其使用文本过滤器，例如：

SELECT * 
FROM table_1 
WHERE longtextcolumn ILIKE ANY (ARRAY['%texttosearch1%', '%texttosearch2%'])

我应该做什么来加快这一进程？表分区可以解决这个速度问题吗？或者我应该寻找索引？

阅读完这篇文章中的所有答案后，我开始了解索引，尤其是 Postgres 上的 gin 索引。今天我克服了我的问题。在使用 gin 索引方法之前，我的查询需要 8 分钟才能完成。现在相同的查询需要 50 毫秒。这是一个巨大的性能差异，我想解释我一步一步为社区所做的事情。

EXAMPLE

假设我们有一个名为 table_1 的表，并且该表有一个名为 long_text 的列。 long_text 列存储长文本数据，例如长度为 1500 个字符的字符串。这个 table_1 有 800.000 行。

STEP 1

Postgres 有一个名为 ts_vector 的数据类型。此 ts_vector 数据类型采用长文本并计算其中的单个不同单词（基于语言）并为其中的单词建立索引。因此，我们需要在 table_1 上创建一个 ts_vector 列，并转换 long_text 列并从中填充 ts_vector 数据。这将是这样的：

ALTER table table_1 
ADD COLUMN long_text_tsv TS_VECTOR;

STEP 2

从我们的长文本列填充 tsvector 数据：

UPDATE table_1 t1
SET long_text_tsv = to_tsvector('english', t1.long_text)
FROM table_1 t2;

STEP 3

为新填充的 long_text_tsv 列创建 gin 索引

CREATE INDEX tsv_index
ON table_1
USING gin(long_text_tsv);

之后，您就可以使用新创建和索引的 tsv 数据来过滤长文本数据

STEP 4

使用 tsvector 数据，您的搜索查询应如下所示：

SELECT long_text FROM table_1
WHERE long_text_tsv @@ to_tsquery('john<->lennon&music');

ts_vector 数据应按 ts_query 数据类型搜索。在上面的查询中，表示后面跟着，& 表示“AND”运算符。

通过我解释的这种方法，我的搜索查询速度比旧方法快了 100 倍。

我不确定我是否以正确的方式完成了这一切，但我认为我做得很好，因为现在我的程序中一切看起来都很好。如果该答案有问题，请警告我。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Postgres Select ILIKE %text% 在大字符串行上运行缓慢的相关文章

SQL如何显示某个日期之前的数据

我有几张桌子一个是一个工人表显示工人代码名字和姓氏工作日期其中显示工人代码工作开始日期结束日期和工作区域代码导师有工人编号名字姓氏和工作区号 Job area有工作区域代码名称和主管我想要做的是在日期 10 09 10 之
方法“Boolean Contains(System.String)”不支持对 SQL 的转换

方法 Boolean Contains System String 不支持对 SQL 的转换查询是 IsQueryable 但这停止工作 foreach string s in collection1 if s Length gt 0 q
在java代码中创建postgresql表

我有一个与 postgreSQL 数据库连接的 java 代码现在我希望当它连接到数据库时我还将创建数据库表但我的问题是它不会创建数据库我不知道问题是什么这是我的代码 Statement st null ResultSet r
转置和聚合 Oracle 列数据

我有以下数据 Base End RMSA Item 1 RMSA Item 2 RMSA Item 3 RMSB Item 1 RMSB Item 2 RMSC Item 4 我想将其转换为以下格式 Key Products RMSA RM
如何在 SQL 中进行广度优先搜索？

给定一棵存储为关系的树 Parent Child 1 2 1 3 3 4 3 5 2 6 7 8 7 9 如何获取给定节点的所有后代例如对于 1
sql查询中case语句中的布尔值

我在选择查询中使用 case 语句类似这样 Select col1 col2 isActive case when col3 abc then 1 else 0 end col4 from
我想从 Crystal Report .rpt 文件中提取 SQL 查询，有办法做到这一点吗？

我想从 Crystal Report rpt 文件中提取 SQL 查询有办法做到这一点吗我没有任何 Crystal Reports 产品只有 rpt 文件下面是一个 Net 代码示例它从给定目录中的所有 Crystal Repor
max()、分组依据和排序依据

我有以下 SQL 语句 SELECT t client id max t points AS max FROM sessions GROUP BY t client id 它只是列出了客户 ID 以及他们所获得的最大积分现在我想按 max
mysql 中 INSERT 语句的计算列

假设我想要一个表来记录其他表中的日期和列数或者任何类型的数学字符串连接等 CREATE TABLE log id INTEGER NOT NULL AUTO INCREMENT date DATETIME NOT NULL count
JbdcTemplate - 带有动态 SQL 查询的PreparedStatements

I know jdbcTemplate可以用来创建PreparedStatements如果你这样设置 i e private JdbcTemplate jdbcTemplate String sqlQuery Select from tab
日常 MySQL（部分和过滤）复制的最佳实践？

我有一个相当大的数据库有超过 40 个表我只需要复制几个表 5 并且每个表也被过滤我正在寻找一些复制这些数据的最佳实践每天就足够了我可以只选择几个表并为每个表包含一些 WHERE 子句我正在考虑为每个表启动 mysqldump
在从 Postgres 9.4 到 Greenplum 的数据迁移过程中，我应该如何处理我的 UNIQUE 约束

当我执行以下 sql 它包含在由生成的 sql 文件中 pg dumpGreenplum 中的 Postgres9 4 CREATE TABLE public trm concept pid int8 NOT NULL code varc
如何在oracle中获取表作为输出参数

我正在尝试将 Oracle 过程调用的 out 参数强制转换为对象它不起作用因为据我了解我需要定义一个映射它告诉方法如何转换它如果地图为空或未正确填充则它默认为 STRUCT 类型的对象在我的情况下这是错误的我已经构建了一
C# 查询两个数据库的数据

我目前有一个查询我正在从两个不同的数据库获取数据这些数据被附加到一个名为 accountbuys 的列表中我的第一个表有三个数据条目 3个想要购买股票的帐户下一张表有 17 个数据点购买 17 只股票 I am merging t
SQL Like 带有子查询

我怎样才能做到这一点 SELECT FROM item WHERE item name LIKE SELECT equipment type FROM equipment type GROUP BY equipment type 内部子查询
如何显示 RSpec 测试生成的 SQL 查询日志？

我正在为我的 Rails 3 应用程序编写规范我想测试数据库事务是否真的有效如果能够看到我的应用程序在规范驱动下生成的 sql 查询这将非常有帮助有没有办法像在 Rails 控制台中一样查看查询我正在使用 Rails 3 0 9
如何将此本机 SQL 查询转换为 HQL

所以我有这个很长的复杂的 Native SQLQuery string hql SELECT FROM SELECT a rownum r FROM select f2 filmid f2 realisateurid f2 titre f2
选择两列中两个日期之间的记录

如何选择两列中两个日期之间的记录 Select From MyTable Where 2009 09 25 is between ColumnDateFrom to ColumnDateTo 我有一个日期 2009 09 25 我喜欢选择
jDBI中如何进行内查询？

我怎样才能在 jDBI 中执行这样的事情 SqlQuery select id from foo where name in
从 $i 获取值，顺序被打乱

for i 0 i lt count name i some output ommited td td

随机推荐

如何同时执行多个Guzzle请求？

我可以使用 Guzzle 执行单个请求并且到目前为止我对 Guzzle 的性能非常满意但是我在 Guzzle API 中读到了有关 MultiCurl 和批处理的内容有人可以向我解释如何同时发出多个请求吗如果可能的话异步我不知道
基于类属性实现接口，无需反射

这一页 http www postsharp net aspects code introductionPostSharp 网站上有以下预告片您将遇到的常见情况之一是需要在大量类上实现特定接口这可能是INotifyPropertyCha
如何从正则表达式组中排除字符？

我想从字符串 python 中删除除连字符之外的所有非字母数字字符如何更改此正则表达式以匹配除连字符之外的任何非字母数字字符 re compile W Thanks 您可以只使用否定字符类来代替 re compile r a zA Z0
为什么维度顺序会随着布尔索引而改变？

当我们有M形状的 a b c 和一个索引数组v我们用它来索引最后一个数组为什么M i v 结果是一个形状数组 d b with d中真实值的数量v 如下图所示 In 409 M zeros 100 20 40 In 410 val one
C# 中的 Rijndael 密钥大小

我目前正在用 C 开发一个小工具可以让我快速加密我的文件所以我用了这个脚本 http www codeproject com Articles 26085 File Encryption and Decryption in C这看起来对
Doctrine 中的分离实体错误

我正在将一组实体发布到控制器我想删除所有这些实体但是下面的代码会抛出一个A detached entity was found during removed MyProject Bundle MyBundle Entity MyEnt
Gitlab+Jenkins 通过 webhook 显示此错误，我该如何解决此问题？

Hook 执行成功但返回 HTTP 403 h2 HTTP ERROR 403 No valid crumb was included in the request h2 table tr th URI th td job pipeline
创建继承自 IBlahblah 的所有类的集合

使用反射我猜是否可以创建一个方法该方法将返回从名为 IBlahblah 的接口继承的所有对象的集合 public interface IBlahblah 假设您有一个程序集或程序集列表要查看您可以获得以下集合types它实现了一
package.json 中本地主机的代理

我在地址中创建graphql服务器http localhost 4000 graphql我有服务器http localhost 3000 在 package json 输入中 proxy http localhost 4000 但我在这张图
C99 错误中函数“AudioServicesPlaySystemSoundWithVibration”的隐式声明无效

所以我主要用 swift 编写但似乎调用这个 AudioServicesPlaySystemSoundWithVibration 的唯一方法是在 Objective c 中一开始我编写的代码确实有效我不确定发生了什么变化但它给了
更改 Git 远程 URL 会更新提取，但不会更新推送

我正在尝试更改 Git 中原始分支的远程 URL 我只想更改 SSH 端口首先列出我的远程起源给了我这个 git remote v origin email protected cdn cgi l email protection pa
如何一次折叠所有 XAML 代码部分？

经过短暂的接触后我找到了答案CTRL M CTRL L这样做但这仅适用于特定块而不适用于所有代码部分例如Ctrl m O在代码后面 Use CTRL M CTRL A 请参阅此处查看完整列表 http visualstudiosho
Material UI useMediaQuery hooks 渲染两次到 React Component，你有什么解决方案吗？

我在项目中使用MUI 需要检查当前断点来为移动设备渲染div 但每次都是第一次渲染isMobile and 是桌面价值回报false但它在第二次渲染后设置了正确的值它从 UI 方面工作得很好但如果可能的话我想避免第一次不必要的渲染 c
将列中的类别扩展到 pandas 中的列名称

我正在尝试扩展不确定这个词是否正确一些绝对的使用 pandas 将数据放入列中假设我有以下数据框 df pandas DataFrame name john john louis louis day a b a b oranges
有没有列出所有移动设备和规格的信息数据库？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何开源项目或网站提供所有移动设备和规格的列表也许这已经很旧了但可能会对某人有所帮助我正在
如何使用 HTTP 重定向传递信息（在 Django 中）

我有一个接受表单提交并更新模型的视图更新模型后我想重定向到另一个页面并且我希望此页面上出现诸如 Field X successfully Updated 之类的消息如何将此消息传递到其他页面 HttpResponseRedire
Node-sass 和 gulp-sass 的优缺点

我想知道 node sass 和 gulp sass 之间有什么区别每个版本的优点和缺点是什么我在 www npmjs com 上看到 node sass 在下载方面有两倍以上的优势这会让事情变得更好吗编译速度有区别吗他们之间的区
如何使 AddressSanitizer 在出现错误（和其他问题）后不会停止

我运行的是 OS X 10 8 5 我已经通过 homebrew 安装了 llvm 3 4 clang version 3 4 tags RELEASE 34 final 并且我正在使用 fsanitize address 进行构建我可以
选择随机函数

我有一个函数列表 function randomiseiconscycle1 iconTwoContainer img iconFiveContainer img iconSevenContainer img fadeIn 300 setT
Postgres Select ILIKE %text% 在大字符串行上运行缓慢

我有一个只有 7 列的表其中一列存储每一行的长文本数据该文本列数据的平均字符长度约为 1500 个字符该表有 500 000 行当我使用选择查询而不使用该文本列时没有问题查询按预期需要 10 秒但是如果我将这个长文本列添加到

Postgres Select ILIKE %text% 在大字符串行上运行缓慢

Postgres Select ILIKE %text% 在大字符串行上运行缓慢 的相关文章

随机推荐

热门标签

Postgres Select ILIKE %text% 在大字符串行上运行缓慢的相关文章