我有两张桌子,“transaksi”和“buku”。 “transaksi”大约有 25 万行,buku 大约有 17 万行。两个表都有名为“k999a”的列,并且两个表均不使用索引。现在我检查这两个陈述。
声明一:
explain select k999a from transaksi where k999a not in (select k999a from buku);
语句 1 输出:
Seq Scan on transaksi (cost=0.00..721109017.46 rows=125426 width=9)
Filter: (NOT (SubPlan 1))
SubPlan 1
-> Materialize (cost=0.00..5321.60 rows=171040 width=8)
-> Seq Scan on buku (cost=0.00..3797.40 rows=171040 width=8)
声明2:
explain select k999a from transaksi where k999a in (select k999a from buku);
语句 2 输出:
Hash Semi Join (cost=6604.40..22664.82 rows=250853 width=9)
Hash Cond: (transaksi.k999a = buku.k999a)
-> Seq Scan on transaksi (cost=0.00..6356.53 rows=250853 width=9)
-> Hash (cost=3797.40..3797.40 rows=171040 width=8)
-> Seq Scan on buku (cost=0.00..3797.40 rows=171040 width=8)
为什么在NOT IN查询中,postgresql会进行循环连接,使得查询需要很长时间?
PS:Windows 10 上的 postgresql 版本 9.6.1
这是可以预料的。您可能会获得更好的性能WHERE NOT EXISTS
反而:
SELECT k999a
FROM transaksi
WHERE NOT EXISTS (
SELECT 1 FROM buku WHERE buku.k999a = transaksi.k999a LIMIT 1
);
以下是对每种方法的原因的很好解释:https://explainextend.com/2009/09/16/not-in-vs-not-exists-vs-left-join-is-null-postgresql/ https://explainextended.com/2009/09/16/not-in-vs-not-exists-vs-left-join-is-null-postgresql/
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)