autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？

2024-03-27

此 sql 查询通常只需要几分钟即可运行：

update import_parts ip
set part_manufacturer_id = pslc.part_manufacturer_id
from parts.part_supplier_line_codes pslc
where trim(lower(ip.line_code)) = trim(lower(pslc.supplier_line_code))
and (ip.status is null or ip.status != '6')
and ip.distributor_id = pslc.distributor_id
and ip.distributor_id = 196;

但我注意到它有时会卡住并被 2 小时的 statements_timeout 自动取消。我注意到有几次，当它卡住时，autovacuum 正在运行，并且 autovacuum 也需要很长时间才能完成运行。下面是一个实例，更新查询和 autovacuum 都在运行，但它们都需要很长时间才能完成运行：

^ 在本例中，autovacuum 在大约一个小时内完成运行，更新查询在近 2 小时内完成运行。在其他情况下，更新查询超过 2 小时的 statements_timeout，因此它会自动取消。

现在我的问题是，自动真空 (VACUUM) 是更新查询卡住或需要几个小时才能完成运行的原因吗？如果是，我该怎么做才能防止更新查询被卡住或变得如此缓慢？如果不是，您认为是什么导致更新查询被卡住或变得如此缓慢？

我们使用的是 PostgreSQL 9.6.15

UPDATE 1

我检查了我们的 RDS 实例是否耗尽了服务器资源。我们的实例大小为 db.t2.medium（2 个 vCPU、4GB RAM、1000 IOPS，存储类型为预配置 iops SSD）。

以下是过去 3 天的 CloudWatch 指标。请注意，在过去 3 天里，上面的更新 sql 查询多次卡住。

UPDATE 2

更新查询和 autovacuum 运行时唯一的活动锁：

^ 以红色突出显示的锁是由 autovacuum 创建的锁。以绿色突出显示的锁是更新查询创建的锁。

以下是更新查询和 autovacuum 运行时所有数据库连接的列表：

用红色突出显示的是 autovacuum。用绿色突出显示的是更新查询。

以下是更新查询的 EXPLAIN 结果：

parts.part_supplier_line_codes表仅包含 2758 行。表中没有 2 行或更多行具有相同的内容supplier_line_code + distributor_id.

import_parts表包含 1260 万行。

UPDATE 3

这是 EXPLAIN (ANALYZE, BUFFERS) 的结果：

EXPLAIN (ANALYZE, BUFFERS)
update import_parts ip
set part_manufacturer_id = pslc.part_manufacturer_id
from parts.part_supplier_line_codes pslc
where trim(lower(ip.line_code)) = trim(lower(pslc.supplier_line_code))
and (ip.status is null or ip.status != '6')
and ip.distributor_id = pslc.distributor_id
and ip.distributor_id = 196;

Update on import_parts ip  (cost=2967312.95..3778109.36 rows=31167172 width=156) (actual time=151475.198..151475.198 rows=0 loops=1)
  Buffers: shared hit=62369982 read=453357 dirtied=375348 written=315748, temp read=154212 written=307558
  ->  Merge Join  (cost=2967312.95..3778109.36 rows=31167172 width=156) (actual time=37567.148..84208.239 rows=10326988 loops=1)
        Merge Cond: ((btrim(lower((pslc.supplier_line_code)::text))) = (btrim(lower((ip.line_code)::text))))
        Buffers: shared hit=94397 read=78007, temp read=154212 written=307558
        ->  Sort  (cost=51.70..52.93 rows=493 width=17) (actual time=9.649..10.039 rows=494 loops=1)
              Sort Key: (btrim(lower((pslc.supplier_line_code)::text)))
              Sort Method: quicksort  Memory: 63kB
              Buffers: shared hit=7 read=11
              ->  Index Scan using index_part_supplier_line_codes_on_distributor_id on part_supplier_line_codes pslc  (cost=0.28..29.65 rows=493 width=17) (actual time=2.926..8.677 rows=494 loops=1)
                    Index Cond: (distributor_id = 196)
                    Buffers: shared hit=2 read=11
        ->  Materialize  (cost=2967261.25..3030480.67 rows=12643883 width=146) (actual time=37557.491..76400.550 rows=12642995 loops=1)
              Buffers: shared hit=94390 read=77996, temp read=154212 written=307558
              ->  Sort  (cost=2967261.25..2998870.96 rows=12643883 width=146) (actual time=37557.486..68337.525 rows=12642995 loops=1)
                    Sort Key: (btrim(lower((ip.line_code)::text)))
                    Sort Method: external merge  Disk: 1233688kB
                    Buffers: shared hit=94390 read=77996, temp read=154212 written=154212
                    ->  Seq Scan on import_parts ip  (cost=0.00..362044.24 rows=12643883 width=146) (actual time=0.027..11903.240 rows=12643918 loops=1)
                          Filter: (((status IS NULL) OR ((status)::text <> '6'::text)) AND (distributor_id = 196))
                          Buffers: shared hit=94390 read=77996
Planning time: 0.169 ms
Execution time: 151561.250 ms

UPDATE 4

鉴于我们的 AWS RDS 实例的容量为 1000 IOPS，看起来下面屏幕截图中的读取 iops 太高了？这是否可能是有时更新查询被卡住并且自动清理花费太长时间才能完成运行的原因？

读取 IOPS：

读取延迟：

写入延迟：

交换用途：

队列深度：

重新启动 AWS RDS 实例后 EXPLAIN (ANALYZE, BUFFERS) 的结果：

EXPLAIN (ANALYZE, BUFFERS)
update import_parts ip
set part_manufacturer_id = pslc.part_manufacturer_id
from parts.part_supplier_line_codes pslc
where trim(lower(ip.line_code)) = trim(lower(pslc.supplier_line_code))
and (ip.status is null or ip.status != '6')
and ip.distributor_id = pslc.distributor_id
and ip.distributor_id = 196;

Update on import_parts ip  (cost=3111484.57..3919788.11 rows=31071345 width=156) (actual time=180680.200..180680.200 rows=0 loops=1)
  Buffers: shared hit=62263174 read=712018 dirtied=386277 written=223564, temp read=237087 written=390433
  ->  Merge Join  (cost=3111484.57..3919788.11 rows=31071345 width=156) (actual time=64687.806..112959.396 rows=10326988 loops=1)
        Merge Cond: ((btrim(lower((pslc.supplier_line_code)::text))) = (btrim(lower((ip.line_code)::text))))
        Buffers: shared hit=5 read=325434, temp read=237087 written=390433
        ->  Sort  (cost=58.61..59.85 rows=493 width=17) (actual time=4.238..5.549 rows=494 loops=1)
              Sort Key: (btrim(lower((pslc.supplier_line_code)::text)))
              Sort Method: quicksort  Memory: 63kB
              Buffers: shared hit=5 read=11
              ->  Bitmap Heap Scan on part_supplier_line_codes pslc  (cost=7.40..36.56 rows=493 width=17) (actual time=2.582..3.242 rows=494 loops=1)
                    Recheck Cond: (distributor_id = 196)
                    Heap Blocks: exact=7
                    Buffers: shared read=11
                    ->  Bitmap Index Scan on index_part_supplier_line_codes_on_distributor_id  (cost=0.00..7.28 rows=493 width=0) (actual time=1.805..1.805 rows=494 loops=1)
                          Index Cond: (distributor_id = 196)
                          Buffers: shared read=4
        ->  Materialize  (cost=3111425.95..3174450.99 rows=12605008 width=146) (actual time=64683.559..105123.024 rows=12642995 loops=1)
              Buffers: shared read=325423, temp read=237087 written=390433
              ->  Sort  (cost=3111425.95..3142938.47 rows=12605008 width=146) (actual time=64683.554..96764.494 rows=12642995 loops=1)
                    Sort Key: (btrim(lower((ip.line_code)::text)))
                    Sort Method: external merge  Disk: 1233528kB
                    Buffers: shared read=325423, temp read=237087 written=237087
                    ->  Seq Scan on import_parts ip  (cost=0.00..514498.12 rows=12605008 width=146) (actual time=0.748..36768.509 rows=12643918 loops=1)
                          Filter: (((status IS NULL) OR ((status)::text <> '6'::text)) AND (distributor_id = 196))
                          Buffers: shared read=325423
Planning time: 23.127 ms
Execution time: 180803.124 ms

我重新启动 RDS 实例以清除 PostgreSQL 的缓存，看看是否存在缓存问题。我在某处读到，重新启动 PostgreSQL 将清除数据库的缓存。

Autovacuum 永远不会阻塞UPDATE反之亦然。这是一个基本的设计原则VACUUM，否则 PostgreSQL 将无法很好地工作。

autovacuum 对进程的唯一影响UPDATE是通过共享资源，最有可能的是 I/O。VACUUM造成 I/O 负载，并且使用内存和 CPU 功率。因此，您可能需要检查 autovacuum 运行时是否有任何资源不足。如果是，答案将是转向更强大的硬件：放慢 autovacuum 速度是一个坏主意，因为机器太蹩脚；从长远来看，这将导致膨胀和其他问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？的相关文章

表名或列名不能以数字开头？

我尝试创建名为15909434 user语法如下 CREATE TABLE 15909434 user 这当然会产生错误然后在我尝试用谷歌进行一些研究后我发现了一篇很好的文章here http www informit com art
在 Postgres 9.0+ 中使用 PL/pgSQL 循环表

我想循环遍历所有表以计算每个表中的行数以下查询给我一个错误 DO DECLARE tables CURSOR FOR SELECT tablename FROM pg tables WHERE tablename NOT LIKE pg
EF6 + Postgres 关系 dbo.AspNetUsers 不存在

我一直在关注这篇关于使用 PostgreSQL 和 EF6 的文章http www jasoncavet com blog postgresql and entity framework 6 code first http www jaso
如何在 Windows 上的 PostgreSQL 中创建具有 UTF-8 排序规则的数据库？

我正在为 Windows 上的 Bitbucket 服务器配置 PostgreSQL 数据库在官方guide https confluence atlassian com bitbucketserver connecting bitbuc
postgresql 中带有分组的嵌套聚合函数

我正在尝试使用嵌套聚合函数和分组来获得总和的平均值我想做的是 SELECT AVG SUM x GROUP BY y WHERE GROUP BY 也就是说对于返回的每一行我希望其中一个字段是总和的平均值其中每个总和都位于 y 相同
当从搜索表单动态构建 WHERE 子句时，如何防止 SQL 注入？

我知道在 Java 中保护 SQL 查询免受 SQL 注入的唯一真正正确的方法是使用准备好的语句然而这样的语句要求基本结构选择的属性连接的表 WHERE条件的结构不会改变我这里有一个 JSP 应用程序其中包含一个带有大约十几个
Postgresql 强制执行唯一的双向列组合

我正在尝试创建一个表该表将在两个方向上强制执行相同类型的两列的唯一组合例如这是非法的 col1 col2 1 2 2 1 我已经想出了这个但它不起作用 database gt d friend Table public friend
是否可以使用纬度和经度的舍入值向 Postgres 表添加约束？

我有一个存储纬度和经度数据的表像下面这样 CREATE TABLE geo sample id uuid DEFAULT uuid generate v4 latitude FLOAT NOT NULL longitude FLOAT N
PostgreSQL 计数查询、物化视图的效率[重复]

这个问题在这里已经有答案了可能的重复 PostgreSQL 计数查询优化 https stackoverflow com questions 13075210 optimization of count query for postgre
在 Postgresql 中使用标识符重新排序列

以下代码可以工作并创建一个带有序列号的临时表该表会为每个新名称重新启动 with results as select row number over partition by name order BY name as mytid nam
Postgres 在并发更新插入时出现死锁

我们有一个从数据流中读取信息并将该信息更新到数据库中的应用程序数据是 Google Drive 上发生的变化这意味着影响相同对象的许多事件可能会非常接近地发生将此信息更新插入数据库时我们遇到了死锁日志中显示的内容如下我已经重建并
使用 Hibernate 映射数组

你能帮我使用 Hibernate 映射这个类吗 public class MyClass private Long id private String name private int values 我使用的是 PostgreSQL 表中的
在 Docker Compose 中更改 postgres 容器服务器端口

我正在尝试使用 Docker compose 在远程服务器上部署第二个数据库容器该 postgresql 服务器在端口 5433 上运行而不是第一个 postgresql 容器使用的端口 5432 当我设置应用程序时我收到以下错误输出
WHERE BETWEEN 子句中的 PostgreSQL jsonb 值

我的数据库表 a table 中有 jsonb 字段其中包含 int 值例如 abc def ghk 500 我将使用 WHERE 子句创建带有此字段 ghk 过滤器的 SELECT SELECT FROM a table WHERE
PostgreSQL - 具有局部变量的函数 - 列引用不明确

我查看了与我的主题相匹配的其他问题但就我而言我认为歧义来自于与列同名的变量这是我尝试创建的函数的简化版本 CREATE OR REPLACE FUNCTION get user id username TEXT RETURNS INT
“psycopg2 的构建轮子失败” - 使用 virtualenv 和 pip 的 MacOSX

我第一次尝试与其他几个人一起制作一个网站在尝试使用 Django Python VirtualEnv 时遇到了一个奇怪的错误我已经找到了针对其他操作系统例如 Ubuntu 的此问题的解决方案但找不到针对 Mac 的任何好的解决方案
如何优化 postgres 查询

我正在运行以下查询 SELECT fat FROM Table1 fat LEFT JOIN modo captura mc ON mc id fat modo captura id INNER JOIN loja lj ON lj id
Azure PostgreSQL 时间点还原不起作用

我们在 Azure 中有一个 Postgre 数据库但遇到了一个问题表中的所有行都被删除我们尝试使用 de azure 门户中的时间点还原选项但创建的数据库与当前运行的数据库具有相同的数据我们还尝试了其他日期和时间数据库问题
Django ConnectionAbortedError：[WinError 10053]已建立的连接被主机中的软件中止

我将 django 与 postgresql 一起使用每当我尝试保存或删除任何内容时都会发生此错误 Traceback most recent call last File c program files x86 python35 32
如果数组重叠，则折叠多行数组

我在 PostgreSQL 9 3 中有一个表其中包含一个列每行包含一个数组我正在努力寻找崩溃的方法共享相同元素的数组行 Examples 简单重叠给定以下两行数组 1 2 3 5 3 6 9 结果将是一行包含 5 1 2 3 6

随机推荐

如何直接从我的 Gitlab 存储库部署到 Heroku

在我的团队中我们使用 Gitlab 作为远程存储库因此我们正在寻找一种解决方案来将应用程序自动部署到 Heroku 我们找到了 Codeship 用于从 Github 自动将应用程序部署到 Heroku 有小费吗技巧如果您不准备使用
波特油炸的去梗

为什么波特词干算法在线 http text processing com demo stem http text processing com demo stem stem fried to fri并不是fry 我不记得任何以以下结尾的单词
Mjpeg 在最近的 Mobile Safari 上损坏了？

我正在处理来自 IP 摄像机的实时 mjpeg 流发现最近发布的 Mobile Safari 似乎对 mjpeg 的支持被破坏了我正在使用一个带有嵌入图像的简单 HTML 测试页面如下所示 img src http ip addres
使用流复制文件

以下示例演示如何使用流复制文件 private void copyWithStreams File aSourceFile File aTargetFile boolean aAppend log Copying files with st
Android底部导航视图项目图标大小[重复]

这个问题在这里已经有答案了 I need to do a bottom navigation view in Android like this I tried and now I have something like this 如何增加
在 Clojure 中实现 cron 类型调度程序

我正在寻找任何可以在给定时间触发事件的 clojure 方法例如我希望一个特定的进程在上午 9 30 启动然后我可以触发另一个进程在半小时后开始运行等等提前致谢更新2 感谢 arthur ulfeoldt 和 unknown p
是否可以将 Camera2 与 Google Vision API 一起使用

是否可以仅使用 Camera2 和 Google Vision API 来检测人脸我找不到整合它的方法是的可以将 Camera2 API 与 Google Vision API 一起使用首先 Google Vision API 人脸
使用 SDK 在 azure 函数中将 Azure blob 存储转换为 JSON

我正在尝试创建一个计时器触发器 azure 函数该函数从 blob 获取数据聚合数据并将聚合结果放入 cosmosDB 中我之前尝试使用 azure 函数中的绑定来使用 blob 作为输入但我被告知这是不正确的请参阅此线程 Az
如何以编程方式读取 EF DbContext 元数据？

我有使用 EF CodeFirst 5 的应用程序 dll 版本 4 4 0 0 在 net 4 0 上我需要能够读取实体元数据以便我可以针对给定的条目类型获取以下信息哪些属性是一对多关系引用实体哪些属性是多对一关系引用当前实体
从 SQL Server 中的日期时间字段中获取“日期”

我有一个日期列其中日期以格式显示2009 11 18 10 55 28 370 我只想从该值中获取日期而不是时间我怎么做如果您使用的是 SQL Server 2008 则现在有 DATE 数据类型让它变得更加自然 SELECT C
PHP Curl 收到 502：错误网关错误

在浏览器中该 url 有效当我尝试使用 PHP curl 时我得到了 502 Bad Gateway error 这是我的代码 ch curl init curl setopt ch CURLOPT URL url query str
popen vs system：popen 和 system 一样邪恶吗？

popen 缓冲输出而系统则不缓冲这是唯一的区别吗据我所知 popen 和 system 都通过 shell 运行命令然而 popen 是evil http www cplusplus com forum articles 1115
使用“using”关键字使继承的构造函数公开[重复]

这个问题在这里已经有答案了我正在尝试测试我的类的受保护方法和构造函数为此我尝试对其进行子类化并使用 C 11 将其成员重新导出为 publicusing关键词 class Foo protected Foo int i void r
添加对 CountVectorizer (sklearn) 的词干支持

我正在尝试使用 sklearn 将词干添加到 NLP 中的管道中 from nltk stem snowball import FrenchStemmer stop stopwords words french stemmer French
Keycloak java.lang.NoClassDefFoundError：使用 Springboot 的 java/security/acl/Group

因此我们正在构建一个带有 Keycloak 集成的 Spring Boot 后端但是在 docker swarm 服务上运行后端时出现以下错误 2020 06 29 21 17 51 694 ERROR 1 nio 3304 exec
MigraDoc C# 在同一行左右对齐

我有一个带有单元格的表格其中我想要两个文本第一个文本左对齐第二个文本右对齐位于同一单元格的同一行上我尝试使用 MigraDoc 重现此单元但没有成功我只能添加左右对齐的两个文本但不能在同一行上这是我的代码 Cell cel
在 Python 中向已运行的 cmd 发送命令

我有一个Python脚本可以绕过Windows中的UAC 绕过用户帐户控制然后我需要能够以某种方式与打开的 CMD 进行通信并向其传递命令例如回声测试我只能找到打开新命令并与其通信的代码然而这并没有帮助因为我需要与我通过 UA
如何在没有 UDID 的情况下跟踪 iOS5 上的下载

谁知道如何在没有 UDID 的情况下跟踪 iOS 应用程序下载通过网络广告我认为这是不可能的特别是如果用户从网站转到 AppStore 但一家名为 WDA 的公司似乎使这成为可能 http www lovefortech com 20
无法序列化会话 Bean - 引发警告

我正在使用 EclipseLink JPA 2 0 在 netbeans 中运行 JSF Primefaces tomcat 6 0 32 的环境我的应用程序工作正常但每次运行它时我都会收到很多警告指出无法序列化我的会话 bean
autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？

此 sql 查询通常只需要几分钟即可运行 update import parts ip set part manufacturer id pslc part manufacturer id from parts part supplier

autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？

autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？ 的相关文章

随机推荐

热门标签

autovacuum (VACUUM) 是这个 PostgreSQL UPDATE 查询偶尔需要几个小时才能完成运行的原因吗？的相关文章