使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度

2024-03-15

我正在尝试加快一个查询的速度，该查询大约需要 60 秒才能在大约 2000 万行的表上完成。

对于此示例，该表具有三列（id、dateAdded、name）。 id 是主键。我添加到表中的索引是：

(dateAdded)
(name)
(id, name)
(id, name, dateAdded)

我试图运行的查询是：

SELECT MAX(id) as id, name 
FROM exampletable 
WHERE dateAdded <= '2014-01-20 12:00:00' 
GROUP BY name 
ORDER BY NULL;

日期在查询之间是可变的。

这样做的目的是获取每个名称在添加日期或之前的最新条目。

当我在查询上使用解释时，它告诉我它正在使用 (id, name, dateAdded) 索引。

+----+-------------+------------------+-------+------------------+----------------------------------------------+---------+------+----------+-----------------------------------------------------------+
| id | select_type | table            | type  | possible_keys    | key                                          | key_len | ref  | rows     | Extra                                                     |
+----+-------------+------------------+-------+------------------+----------------------------------------------+---------+------+----------+-----------------------------------------------------------+
|  1 | SIMPLE      | exampletable     | index | date_added_index | id_element_name_date_added_index             | 162     | NULL | 22016957 | Using where; Using index; Using temporary; Using filesort |
+----+-------------+------------------+-------+------------------+----------------------------------------------+---------+------+----------+-----------------------------------------------------------+

Edit:从评论中添加了两个新索引：

(dateAdded, name, id)
(name, id)

+----+-------------+------------------+-------+---------------------------------------------------------------+----------------------------------------------+---------+------+----------+-------------------------------------------+
| id | select_type | table            | type  | possible_keys                                                 | key                                          | key_len | ref  | rows     | Extra                                     |
+----+-------------+------------------+-------+---------------------------------------------------------------+----------------------------------------------+---------+------+----------+-------------------------------------------+
|  1 | SIMPLE      | exampletable     | index | date_added_index,date_added_name_id_index                     | id__name_date_added_index                    | 162     | NULL | 22040469 | Using where; Using index; Using temporary |
+----+-------------+------------------+-------+---------------------------------------------------------------+----------------------------------------------+---------+------+----------+-------------------------------------------+

Edit:添加了创建表脚本。

CREATE TABLE `exampletable` (
  `id` int(10) NOT NULL auto_increment,
  `dateAdded` timestamp NULL default CURRENT_TIMESTAMP,
  `name` varchar(50) character set utf8 default '',
  PRIMARY KEY  (`id`),
  KEY `date_added_index` (`dateAdded`),
  KEY `name_index` USING BTREE (`name`),
  KEY `id_name_index` USING BTREE (`id`,`name`),
  KEY `id_name_date_added_index` USING BTREE (`id`,`dateAdded`,`name`),
  KEY `date_added_name_id_index` USING BTREE (`dateAdded`,`name`,`id`),
  KEY `name_id_index` USING BTREE (`name`,`id`)
) ENGINE=MyISAM AUTO_INCREMENT=22046064 DEFAULT CHARSET=latin1

Edit:这是HeavyE提供的答案的解释。

+----+-------------+--------------+-------+------------------------------------------------------------------------------------------+--------------------------+---------+--------------------------------------------------+------+---------------------------------------+
| id | select_type | table        | type  | possible_k                                                                               | key                      | key_len | ref                                              | rows | Extra                                 |
+----+-------------+--------------+-------+------------------------------------------------------------------------------------------+--------------------------+---------+--------------------------------------------------+------+---------------------------------------+
|  1 | PRIMARY     | <derived2>   | ALL   | NULL                                                                                     | NULL                     | NULL    | NULL                                             | 1732 | Using temporary; Using filesort       |
|  1 | PRIMARY     | example1     | ref   | date_added_index,name_index,date_added_name_id_index,name_id_index,name_date_added_index | date_added_name_id_index | 158     | maxDateByElement.dateAdded,maxDateByElement.name |    1 | Using where; Using index              |
|  2 | DERIVED     | exampletable | range | date_added_index,date_added_name_id_index                                                | name_date_added_index    | 158     | NULL                                             | 1743 | Using where; Using index for group-by |
+----+-------------+--------------+-------+------------------------------------------------------------------------------------------+--------------------------+---------+--------------------------------------------------+------+---------------------------------------+

Stack Overflow 上有一篇很棒的文章，介绍了如何优化选择列中具有最大值的行：https://stackoverflow.com/a/7745635/633063 https://stackoverflow.com/a/7745635/633063

这看起来有点乱，但效果很好：

SELECT example1.name, MAX(example1.id)
FROM exampletable example1
INNER JOIN (
select name, max(dateAdded) dateAdded
from exampletable
where dateAdded  <= '2014-01-20 12:00:00' 
group by name
) maxDateByElement on example1.name = maxDateByElement.name AND example1.dateAdded = maxDateByElement.dateAdded
GROUP BY name;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

sql

sqlperformance

使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度的相关文章

如何将“mysql source”命令与 mysql 变量一起使用？

我需要从 mysql shell 执行一个基于如下条件的 SQL 文件 mysql gt 源 var 其中 var 包含文件名这不可能 source是MySQL客户端程序在本地识别并执行的命令变量存在于服务器上因此客户端不知道什么 v
在 where 子句中使用聚合函数和不同的列条件

select PO Order Qty Avg PO Order Qty as totalAverage FROM FirstStrike Retail custom Whse Pricing QR where item code 111
如何在Oracle中从表中选择列，*？

我正在创建很多脚本有时为了检查表是否根据我的需要进行更新我会即时编写几个 SELECT 语句在 SQL SERVER 中你可以这样写 SELECT Column1 FROM MY TABLE 出于可见性原因这很有用但是这似乎在 O
mysql 数据库正在复制，但在主服务器上创建的用户未在从服务器上复制

在主从复制中我们使用 mysql DB 在从服务器上复制少量数据库我在主服务器上创建了一个用户不幸的是它没有在从服务器上复制 Replicate Do DB app1 app2 mysql 用户创建命令 GRANT SELECT on
计算包含字母/数字的行数

我想要实现的目标很简单但是解释起来有点困难我不知道在 postgres 中这是否真的可能我处于相当基础的水平 SELECT FROM WHERE LEFT JOIN ON HAVING 等等基本的东西我正在尝试计算包含特定字母数字
MySQL 最佳实践：SELECT 子递归尽可能提高性能？

我想选择一个根项目及其子项使其性能尽可能高我更喜欢使用嵌套集模型但这次表结构遵循邻接模型有关嵌套集和邻接模型的更多信息 http mikehillyer com articles managing hierarchical data
我应该定义索引（A）和索引（B），还是索引（A，B），或者两者都定义？

在我的表中我有两个密切相关的列 A 和 B 我应该考虑哪些因素来决定是否创建索引 A 和索引 B 索引 A B 以上两者如果我仅使用类似的查询where A 5 and B 10 并且从不喜欢where A 5 也可以使用类似的查询
我的 SQL 表设置为允许该列为 NULL，但是当我运行它时，它说它不能为 NULL。什么/为什么/如何？

所以我在这里遇到了很奇怪的困境我的 SQL 表设置为允许 ZipCode 列为空如下所示 CREATE TABLE dbo Companies CompanyId BIGINT IDENTITY 1 1 NOT NULL PRIMARY
如何根据同一个表中的先前数据更新 SQL 表

我有一张衡量学生表现的表格student在我的数据库中如下 ID TestDate PerformanceStatus PS 1 15 03 2016 0 1 01 04 2016 2 1 05 05 2016 1 1 07 06 2016
在shell命令行中创建mysql触发器

我需要在命令行中创建一个mysql触发器这个sql在mysql控制台中运行良好 sql USE DB1 DROP TRIGGER IF EXISTS my trigger DELIMITER CREATE TRIGGER my trigg
优化 LATERAL join 中的慢速聚合

在我的 PostgreSQL 9 6 2 数据库中我有一个查询该查询根据一些股票数据构建计算字段表它为表中的每一行计算 1 到 10 年的移动平均窗口并将其用于周期性调整具体来说 CAPE CAPB CAPC CAPS 和 CAP
对于返回超过1个值的SQL select，当Id为GUID时它们如何排序？

我想知道 SQL Server 如何对查询返回的数据进行排序并且各个表的 Id 列都是 uniqueidentifier 类型我在创建所有 GUID 时使用 NHibernate GuidComb 并执行以下操作 Sheet sheet
SQL Server 批量插入 - “批量加载数据转换错误”

bulk insert dbo A FROM d AData csv WITH FIELDTERMINATOR ROWTERMINATOR n 将批量数据插入数据库时在检查可疑数据后我遇到了无法解释的错误消息 4867 16 级状态
SQL Server Like 查询不区分大小写

Query SELECT from Table 2 WHERE name like Joe Output 1 100 Joe 2 200 JOE 3 300 jOE 4 400 joe 为什么不区分大小写 Problem 查询不区分大小写
使用 Flot、html、PHP 和 MySql 查询绘制多个图表

我正在尝试使用 Flot html PHP 和 MySql 查询绘制多个图表但我陷入了困境因为我找不到在同一个 html 页面中绘制多个 flot 的方法为简单起见在数据库 test db3 映像中包含以下字段表1 用户名发送邮
如何编写可以补偿拼写错误数据的 MySQL 搜索？

有没有什么方法可以编写一个 MySQL 搜索来弥补用户在拼写等方面的错误作为随机示例有人可能会输入电子邮件受保护 cdn cgi l email protection代替电子邮件受保护 cdn cgi l email protect
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
合并sql中的列

我正在使用 SQL Server 2017 有一个存储过程其中我有一个带有连接的简单选择例如 SELECT p legacyKey AS JobNumber p Name AS JobName G Label AS DesignStat
Oracle 按月滚动或运行总计

目标每个月末所有报表的滚动运行总计 Code select TRUNC ACTHX STMT HX STMT DATE MM AS MNTH COUNT ACTHX INVOICE as STMTS from ACTHX group b
如何在 PostgreSQL 中使用条件和子查询创建唯一索引？

我使用 PGSQL 并尝试添加下面的索引 CREATE UNIQUE INDEX fk client ON user client fk client WHERE fk client NOT IN SELECT fk client FROM

随机推荐

在微调 GPT-2 模型时如何处理堆栈期望每个张量具有相同大小的误差？

我尝试用我的个人信息微调模型所以我可以创建一个聊天框人们可以通过聊天 gpt 了解我但是我得到了错误 RuntimeError 堆栈期望每个张量大小相等但在条目 0 处得到 47 在条目 1 处得到 36 因为我有不同的输入长度
使用bind-mount时主机目录和容器之间的Docker文件权限不匹配

问题我的 docker compose 堆栈由 postgresql redis 和 Python api 服务器以及其他一些组件例如 opentracing 等组成但问题区域仅限于前面提到的区域我的撰写文件中的入口点是一个 s
Spark 结构化流是否可以实现正确的事件时间会话？

一直在玩 Spark Structured Streaming 和mapGroupsWithState 具体如下结构化会话化 https github com apache spark blob v2 3 1 examples src ma
我无法从 mongoDb ObjectId 类构造函数错误中删除数据

我写了一个express index js来在mongodb中进行简单的增删改查操作该项目是我可以 console log 作为 mongodb Id 的参数但是 ObjectId 内置函数给了我一个类构造函数错误如果没有 new 它
在不同的线程/事件循环中启动 websocket 服务器

我正在 python 3 中构建一个 Websocket 服务器应用程序我正在使用这个实现 https websockets readthedocs io https websockets readthedocs io 基本上我想使用不同
sbt Web 插件：不是有效密钥：jetty-run（类似：jetty-port、jetty-context、run）

我正在尝试使用 lift web 框架建立一个 scala sbt 项目我在用着斯卡拉 2 9 0 1 sbt 0 10 1 lift 2 3 xsbt web plugin 0 1 1 仅适用于 scala 2 8 1 请参阅问题结尾
Powershell：在 ConvertTo-HTML 中显示数组成员

我有一个带有 NoteProperties 的对象集合这些属性之一是数组当我使用 ConvertTo HTML 时我希望有一种简单的方法来显示此 noteproperty 的成员而不仅仅是 System Object 例如我有一个
更改超级视图会破坏 UIPanGestureRecognizer

我正在尝试实现一个可以从其超级视图中拖出的 UIView 我尝试添加一个UIPanGestureRecognizer到我希望能够拖动的视图然而从其超级视图中删除 UIView 并将其添加到另一个视图似乎会破坏手势识别器与内的代码UIG
分层 ldd(1)

由于使用 Gentoo 更新程序后经常会链接到旧版本的库通常情况下 revdep rebuild 有助于解决这个问题但这次它是对 python 库的依赖并且python updater不会接它是否有层次结构变体ldd它向我显示哪
在 Grails 中使用多个数据源时使用错误的数据源进行验证？

我们正在使用 Grails 2 2 1 并且当我们尝试对绑定到多个数据源的域类执行 CRUD 操作时遇到问题这是我们的静态映射的样子以及一些操作的结果在这种情况下 CAR 表仅存在于 d2 中 class Car static mapp
从 POJO 到 Avro Record 的通用转换

我正在寻找一种以通用方式将 POJO 转换为 avro 对象的方法该实现对于 POJO 类的任何更改都应该具有鲁棒性我已经实现了它但明确填写了 avro 记录请参见下面的示例有没有办法摆脱硬编码的字段名称只从对象中填充 avro
如何比较两个 HANDLE 类型的变量

我有一个 HANDLE 类型的变量第一个 HANDLE 变量是一个没有 PROCESS QUERY INFORMATION 访问权限的进程 HANDLE 名称为 hProcess 第二个变量也是一个进程句柄名称为 hwndProcess
由于 Internet Explorer 引擎不可用，无法解析响应内容，或者

我需要使用 powershell 下载频道 9 系列但是我尝试过的脚本有错误这个脚本 url https channel9 msdn com blogs OfficeDevPnP feed mp4high rss invoke webr
使用多个输入训练 Keras 模型

我想使用 keras 训练具有 3 个不同输入的模型训练数据 x train 左列车右列车形状为 10000 83 12 这是代码的一部分 from keras layers import Dense Input LSTM x Inpu
VideoJS HTML5 Video JS 如何将音量提高到最大值以上？

可能没有解决方案但我想无论如何我都会询问有时视频真的很安静如果我相应地调高电脑的音量那么其他声音就会变得太大声如果能够将音量提高到最大音量以上那就太好了我在谷歌上进行了搜索实际上什么也没找到甚至根本没有与 videojs 相
Android：更改主屏幕中的应用程序名称

我的应用程序在主屏幕上显示其启动活动的名称我尝试通过设置来更改名称android label清单中的属性在
避免 ASP.Net Core 中的“请求匹配多个操作导致歧义”错误

我正在尝试做某事simple and trivial 或者至少我是这么认为的我正在尝试编写一个可以由我启动的每个微服务项目继承的基类该基类的目的是测试从 HTTP 一直到 SQL 的连接性它在 PROD 中未启用这是更简单的基类
如何将强制和可选命令行参数传递给 perl 脚本？

我正在使用 Getopt Long 将选项传递给我的 Perl 脚本但我想做这样的事情 perl myScript mandatoryArgument1 optionalArgument1 someValue 我希望脚本在缺少 Comma
UINavigatorBar 内的 UIActivityIndicatorView |执行-layoutSubviews后仍然需要自动布局

我想将 UIActivityIndi catorView av 对象对象添加到 UINavigationItem 的左栏按钮项中我的代码如下所示 UIBarButtonItem button UIBarButtonItem alloc
使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度

我正在尝试加快一个查询的速度该查询大约需要 60 秒才能在大约 2000 万行的表上完成对于此示例该表具有三列 id dateAdded name id 是主键我添加到表中的索引是 dateAdded name id name id

使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度

使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度 的相关文章

随机推荐

热门标签

使用 MAX、WHERE 和 GROUP BY 在三个不同列上提高 SQL 查询速度的相关文章