为什么MySQL在这里不总是使用索引合并？

2023-12-12

考虑这个表：

CREATE TABLE `Alarms` (
  `AlarmId` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
  `DeviceId` BINARY(16) NOT NULL,
  `Code` BIGINT(20) UNSIGNED NOT NULL,
  `Ended` TINYINT(1) NOT NULL DEFAULT '0',
  `NaturalEnd` TINYINT(1) NOT NULL DEFAULT '0',
  `Pinned` TINYINT(1) NOT NULL DEFAULT '0',
  `Acknowledged` TINYINT(1) NOT NULL DEFAULT '0',
  `StartedAt` TIMESTAMP NOT NULL DEFAULT '0000-00-00 00:00:00',
  `EndedAt` TIMESTAMP NULL DEFAULT NULL,
  `MarkedForDeletion` TINYINT(1) NOT NULL DEFAULT '0',
  PRIMARY KEY (`AlarmId`),
  KEY `Key1` (`Ended`,`Acknowledged`),
  KEY `Key2` (`Pinned`),
  KEY `Key3` (`DeviceId`,`Pinned`),
  KEY `Key4` (`DeviceId`,`StartedAt`,`EndedAt`),
  KEY `Key5` (`DeviceId`,`Ended`,`EndedAt`),
  KEY `Key6` (`MarkedForDeletion`)
) ENGINE=INNODB;

并且，对于此测试，请像这样填充它：

-- Populate some dummy data; 500 alarms for each
-- of 1000 one-second periods
SET @testDevice = UNHEX('00030000000000000000000000000000');

DROP PROCEDURE IF EXISTS `injectAlarms`;
DELIMITER ;;
CREATE PROCEDURE injectAlarms()
BEGIN
    SET @fromdate  = '2018-02-18 00:00:00';
    SET @numdates  = 1000;
    SET @todate    = DATE_ADD(@fromdate, INTERVAL @numdates SECOND);

    -- Create table of alarm codes to join on
    DROP TABLE IF EXISTS `__codes`;
    CREATE TEMPORARY TABLE `__codes` (
        `Code` BIGINT NOT NULL PRIMARY KEY
    );

    SET @startcode = 0;
    SET @endcode   = 499;

    REPEAT
       INSERT INTO `__codes` VALUES(@startcode);
       SET @startcode = @startcode + 1;
    UNTIL @startcode > @endcode END REPEAT;

    -- Add an alarm for each code, for each second in range
    REPEAT
        INSERT INTO `Alarms`
            (`DeviceId`, `Code`, `Ended`, `NaturalEnd`, `Pinned`, `Acknowledged`, `StartedAt`, `EndedAt`)
            SELECT
                @testDevice,
                `Code`,
                TRUE, FALSE, FALSE, FALSE,
                @fromdate, @fromdate
            FROM `__codes`;

        SET @fromdate = DATE_ADD(@fromdate, INTERVAL 1 SECOND);
    UNTIL @fromdate > @todate END REPEAT;
END;;
DELIMITER ;

CALL injectAlarms();

现在，对于某些数据集，以下查询效果很好：

SELECT * FROM `Alarms`
WHERE
   ((`Alarms`.`Ended` = FALSE AND `Alarms`.`Acknowledged` = FALSE) OR `Alarms`.`Pinned` = TRUE) AND
   `MarkedForDeletion` = FALSE AND
   `DeviceId` = @testDevice
;

这是因为 MariaDB 足够聪明，可以使用索引合并，例如：

id    select_type    table    type         possible_keys                 
1     SIMPLE         Alarms   index_merge  Key1,Key2,Key3,Key4,Key5,Key6 

key             key_len  ref     rows     Extra
Key1,Key2,Key3  2,1,17   (NULL)  2        Using union(Key1,intersect(Key2,Key3)); Using where

但是，如果我使用上述过程填充的数据集，并稍微翻转查询（这是我需要的另一个视图，但在这种情况下将返回更多行）：

SELECT * FROM `Alarms`
WHERE
  ((`Alarms`.`Ended` = TRUE OR `Alarms`.`Acknowledged` = TRUE) AND `Alarms`.`Pinned` = FALSE) AND
   `MarkedForDeletion` = FALSE AND
   `DeviceId` = @testDevice
;

……它没有：

id    select_type    table    type   possible_keys
1     SIMPLE         Alarms   ref    Key1,Key2,Key3,Key4,Key5,Key6

key   key_len  ref     rows     Extra
Key2  1        const  144706    Using where

我宁愿希望索引合并更频繁地发生。事实上，鉴于ref=const，这个查询计划看起来并不太可怕……但是，查询需要几乎一秒钟的时间来运行。这本身并不是世界末日，但在尝试更奇特的查询时，我的设计的可扩展性较差，这需要一个very很久：

-- Create a temporary table that we'll join against in a mo
DROP TABLE IF EXISTS `_ranges`;
CREATE TEMPORARY TABLE `_ranges` (
    `Start` TIMESTAMP NOT NULL DEFAULT 0,
    `End`   TIMESTAMP NOT NULL DEFAULT 0,
    PRIMARY KEY(`Start`, `End`)
);

-- Populate it (in reality this is performed by my application layer)
SET @endtime = 1518992216;
SET @starttime = @endtime - 86400;
SET @inter = 900;
DROP PROCEDURE IF EXISTS `populateRanges`;
DELIMITER ;;
CREATE PROCEDURE populateRanges()
BEGIN
REPEAT
    INSERT IGNORE INTO `_ranges` VALUES(FROM_UNIXTIME(@starttime),FROM_UNIXTIME(@starttime + @inter));
    SET @starttime = @starttime + @inter;
UNTIL @starttime > @endtime END REPEAT;
END;;
DELIMITER ;
CALL populateRanges();

-- Actual query
SELECT UNIX_TIMESTAMP(`_ranges`.`Start`) AS `Start_TS`,
COUNT(`Alarms`.`AlarmId`) AS `n`
FROM `_ranges`
LEFT JOIN `Alarms`
ON `Alarms`.`StartedAt` < `_ranges`.`End`
  AND (`Alarms`.`EndedAt` IS NULL OR `Alarms`.`EndedAt` >= `_ranges`.`Start`)

  AND ((`Alarms`.`EndedAt` IS NULL AND `Alarms`.`Acknowledged` = FALSE) OR `Alarms`.`Pinned` = TRUE)
-- Again, the above condition is sometimes replaced by:
-- AND ((`Alarms`.`EndedAt` IS NOT NULL OR `Alarms`.`Acknowledged` = TRUE) AND `Alarms`.`Pinned` = FALSE)

 AND `DeviceId` = @testDevice
 AND `MarkedForDeletion` = FALSE
 GROUP BY `_ranges`.`Start`

（此查询应该收集每个时间片的计数列表，每个计数指示有多少个警报的 [StartedAt,EndedAt] 范围与该时间片相交。结果填充线图。）

同样，当我设计这些表时，它们中的行并不多，索引合并似乎使一切都顺利进行。但现在不是这样：使用中给出的数据集injectAlarms()，这需要40秒去完成！

添加时我注意到了这一点MarkedForDeletion专栏并执行我的一些第一个大型数据集规模测试。这就是为什么我选择的索引并没有因为存在而产生什么大问题MarkedForDeletion，尽管如果我删除上面描述的结果是相同的AND MarkedForDeletion = FALSE根据我的询问；然而，我保留了这个条件，因为最终我需要它存在。

我尝试过一些USE INDEX/FORCE INDEX组合，但它似乎从未使用索引合并作为结果。

我可以定义哪些索引以使该表在给定情况下快速运行？或者我如何重组我的查询以实现相同的目标？

(上述查询计划在 MariaDB 5.5.56/CentOS 7 上获得，但解决方案也必须适用于 MySQL 5.1.73/CentOS 6。）

哇！这是我见过的最复杂的“索引合并”。

通常（也许always），您可以创建一个“复合”索引来替换索引合并相交，并表现得更好。改变key2从刚刚(pinned) to (pinned, DeviceId). This may摆脱“相交”并加快速度。

一般来说，优化器只有在万不得已的情况下才使用索引合并。（我认为这就是标题问题的答案。）查询或涉及的值的任何细微变化，优化器都会在不进行索引合并的情况下执行查询。

临时表的改进__codes是构建一个具有大范围值的永久表，然后在您的 Proc 中使用该表中的一系列值。如果您使用 MariaDB，则使用动态构建的“序列”表。例如“表”seq_1_to_100 is 有效地一列数字为 1..100 的表格。无需声明或填充它。

你可以摆脱另一个REPEAT循环通过计算时间从Code.

避免LOOPs将是最大的性能收益。

完成所有这些，然后我可能会有其他提示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么MySQL在这里不总是使用索引合并？的相关文章

安装 mariadb 包时找不到 mariadb_config [重复]

这个问题在这里已经有答案了我尝试在 ubuntu 20 04 上安装 mariadb 软件包并收到以下消息 Collecting mariadb Using cached mariadb 1 1 3 tar gz 80 kB Prepa
资源 ID #4 PHP MYSQL

result mysql query SELECT indvsum sum1 indvsum sum2 FROM SELECT SUM Cash AS sum1 SUM Bank AS sum2 FROM players indvsum e
为什么MongoDB不同的查询计划显示不同的nReturned值？

我有一个收藏faults in my MongoDB每个文档都有这些字段的数据库 rack name timestamp 只是为了测试和比较性能我创建了这两个索引 rack gt rack name 1 and time gt times
通过页面打开 mysql 连接是完全鲁莽的吗？

当查询数据库时是否会感到极度偏执每次必须完成新查询时我都会打开和关闭 mysql 连接我担心尤其是启用 ajax 的页面这会导致性能大幅下降我应该继续使用此方法还是至少在每个页面而不是每个查询中打开和关闭连接一次顺便说
用于 MySQL 全文搜索的转义字符串

我正在使用 Laravel 4 并设置了以下查询 if Input get keyword keyword Input get keyword search DB connection gt getPdo gt quote keyword
连接两个表并保存到第三个sql

我想加入两张桌子 TableA wordA primarykey countA abc 25 abcd 29 abcde 45 TableB wordB primarykey countB ab
Laravel 查询生成器 - 高级条件子句（可选参数）

我需要带有接受可选参数的查询生成器的子句例如请考虑以下情况我们有三个搜索字段产品标题公司名称和位置邮政编码城市或州 2 3 8 种可能性该位置与 OR 连接 WHERE location postal code LIKE O
使用java将数据插入mySQL表

I have a predefined table in a mySQL database 我正在努力将从用户输入的数据保存到数据库中但我似乎无法将任何数据保存在数据库中使用以下代码我尝试更新数据库的第一行 ID 1 到 OTHER
在mysql中使用GROUP BY时，如何选择最长的文本字段，如MAX()？

在 MySql 中您可以使用MAX 使用时获得最高值的函数GROUP BY 我怎样才能做同样的事情来获得最长的文本字符串样本表 id post id title body 1 ZXBF1J Favorite Color My favor
将solr 1.4索引升级到solr 3.3？

我有一个使用 apache solr 1 4 构建的现有索引我想在 3 3 版本中使用这个现有索引正如您所知索引格式在 3 x 之后发生了变化那么如何才能做到这一点呢我已经使用 Luke 将现有索引即 1 4 版本导出为 XM
在没有条件的情况下，如何使查询不返回任何内容？

相当简单我有一对多多对一关系我想查询它但是当未提供任何 WHERE 子句信息时我不希望返回任何结果简单来说如何使查询变得非贪婪您可以添加一个始终为 false 的 where 子句并附加您想要用 OR 提供的条件 sel
mysql REGEXP 不匹配

我有一个正则表达式旨在捕获字符串中的电话号码 1 s d 3 s d 3 s d 4 我尝试使用以下查询在 MySql 数据库中查询此正则表达式 SELECT FROM everything instances meta AS m WHE
数据库表可以没有主键吗？

谁能告诉我关系数据库例如MySQL SQL SERVER 中的表是否可以没有主键例如我可以有桌子day temperature 我注册的地方temperature and time 我不明白为什么要为这样的表设置主键从技术上讲您可
如何选择按范围分组的值的计数

斯塔克万岁我需要选择按范围分组的值的计数举例来说假设我在表列中有以下值 1 2 4 5 6 8 9 11 13 16 然后我想检索 5 范围内它们的计数如下所示 From 0 to 4 there is 3 values 1 2
选择给定日期范围内的所有月份，包括值为 0 的月份

我正在尝试编写一个 MySQL 查询来获取给定日期之间所有月份的每月平均值我的想法是这样的查询类似 SELECT AVG value1 as avg value 1 AVG value2 as avg value 2 MONTH sa
将 CSV 文件导入 MySQL 数据库时出现无效的 UTF-8 字符串

我正在尝试使用以下代码将 CSV 导入我的 MySQL 数据库我从帖子中获取了 CSV 文件
PHP md5() 给出与 MySQL md5 不同的输出

我正在尝试设置登录系统但无法解决一个问题 PHP 通过 md5 给了我另一个输出比MySQL 例如在 PHP 中 password md5 brickmasterj return password 返回 3aa7b18f304e2e2
转储中的 MySQL 标志

在查看 mySQL 转储时我发现了一些东西并且想知道它们是什么 I see 50001 DROP TABLE IF EXISTS xxx 标志 50001 是什么有它们含义的列表吗它在 MySQL 的论坛邮件列表上进行了讨论here
NodeJS：MySQL 有时会引发 ETIMEDOUT 错误

我目前正在使用 NodeJS 开发一个应用程序然而经常服务器抛出这个错误我无法与mysql交互 Error read ETIMEDOUT code ETIMEDOUT errno ETIMEDOUT syscall read fata
将文件保存为 MYSQL 数据库中的 blob 或文件路径

我知道这些问题是常见问题之一但我需要您针对具体案例提供帮助我正在开发一个应用程序其中一些用户可以添加订单一些用户可以执行这些订单这些订单非常具体因此只有有限数量的用户可以添加它们然后为每个订单生成三个文档每个文档的大小不超

随机推荐

单个字符的标签样式

我需要更改此标签中一个字符的颜色特别是这需要对几个部分进行更改但对其他许多部分则不需要更改有没有一种内联方式可以让我做到这一点 td td
glassfish 命名中未找到 SerialInitContextFactory

这开始让我彻底发疯我想使用 Maven 创建一个 Glassfish 客户端应用程序为此我添加了所需的 gf client 依赖项
为什么在 BIOS 中禁用超线程的 Broadwell CPU 上，perf stat 不计算周期：u？

鉴于 BIOS 中禁用超线程的 Broadwell CPU root ny4srv03 lscpu Architecture x86 64 CPU op mode s 32 bit 64 bit Address sizes 46 bits
如何将自定义列表视图设置到对话框中

我正在开发一个应用程序它从网络服务中获取一些数据并显示在列表视图中我已经实现了一个由 BaseAdapter 扩展的自定义适配器在里面getView 我也给原料充气的方法这些工作得很好我的问题是我已经实现了代码来在用户单击列表项时
使用变量作为名称向 JavaScript 对象添加属性？

我正在使用 jQuery 从 DOM 中提取项目并希望使用以下方法在对象上设置属性idDOM 元素的 Example const obj jQuery itemsFromDom each function const element jQ
如何使用 d3.js 创建定义列表？

我正在尝试创建一个定义列表如下所示 dl dt term1 dt dd definition1 dd dt term2 dt dd definition2 dd dt term3 dt dd definition3 dd dl 通过使用以
iOS 企业开发 - TestFlight

我今天早上刚收到一封电子邮件称 testflightapp com 从 2015 年 2 月 26 日起将不再活跃我应该改用 iTunes Connect TestFlight 服务对于应用程序商店应用程序来说这很好但我的大多数项
自定义 Windows 文件夹图标

Skype 在 C Program Files 中的 Skype 文件夹中有一个漂亮的自定义文件夹图标如何为特定 Windows XP 及更高版本文件夹注册自定义图标使用 Desktop ini 自定义文件夹
CSS 如何在图像底部添加文本标题？

我对 css 很陌生我试图在图像底部添加文本标题如下所示我在 3 个不同的引导列中有 3 个图像 img preview display block margin 0 auto object fit cover min height
线条颜色取决于趋势

我正在尝试绘制一条线该线应该以代表图表趋势的方式着色例如如果它正在增加它应该是绿色的而如果它正在减少它应该是红色的我可以简单地使用移位的数据框来表示这种趋势绘制点 dates 2018 01 format d for d in
mssql server 2008 的分页查询在“OFFSET”附近抛出错误的语法

我正在 jsp 中进行分页而且我是编写 sql 的新手我做了研究并发现了简单的查询 SQL Server 2008 中的分页 and 如何在SQL Server 2008中进行分页 SELECT FROM document ORDER
如何测试 cron 作业？

我使用的是 Ubuntu Linux 10 0 4 我想每天每 6 小时运行一个脚本当我发出sudo crontab e 我懂了 m h dom mon dow command 00 06 12 18 opt scripts seleni
带有 tkinterdnd2 模块的 *.py 脚本不会编译为可执行文件

我制作了一个使用 tkinter 和 tkinterdnd 模块的应用程序当我将其作为脚本启动时它工作得很好但是当我尝试从中创建可执行文件并启动它时会出现以下错误 Traceback most recent call last Fi
pytest (py.test) 在 cygwin 中启动非常慢

在 cygwin 中 py test 启动非常慢由于两个原因它看起来不像是一个收集问题相同的测试在 Linux 中启动得很快有时如果在 cygwin 中足够快地重新运行相同的测试它会在不到 1 秒的时间内启动运行 time 命
TextBox使用GDI还是GDI+

基本上我想测量 TextBox 中的文本大小我发现 TextRenderer 给出了正确的值而 Graphics 给出了错误的值那么看起来 TextBox 应该使用 GDI 来绘制文本对吧然而无论我读到什么我都看到它应该使用
Firebird BLR 623 无效请求 - LRTRIM 未定义 - 找不到模块名称或入口点

我在 Firebird 2 5 数据库中工作当我运行一些使用 LRTRIM 函数的存储过程或视图数据库对象时偶尔并非总是会出现以下错误令牌无效偏移量 623 处的无效请求 BLR 函数 LRTRIM 未定义找不到模块名称或
使用 python ctypes.CDLL() 从不同目录加载 .dll 时出错

我必须遵循以下目录结构 MainProject project files rtlsdr rtlsdr dll other dll s etc 我正在使用该功能CDLL 在图书馆ctypes加载rtlsdr dll 当我的工作目录是时它工作
使用 DataContractSerializer 进行序列化时如何忽略属性？

我正在使用 NET 3 5SP1 和DataContractSerializer序列化一个类在 SP1 中他们改变了行为这样您就不必包含DataContract DataMember类上的属性它只会序列化整个事物这是我正在使用的行
html agility pack url scraping——获取完整的html链接

您好我正在使用 nuget 包中的 html 敏捷包来抓取网页以获取页面上的所有 url 代码如下所示然而它在输出中返回给我的方式是链接只是实际网站的扩展而不是完整的 url 链接例如http www foo bar fooba
为什么MySQL在这里不总是使用索引合并？

考虑这个表 CREATE TABLE Alarms AlarmId INT 10 UNSIGNED NOT NULL AUTO INCREMENT DeviceId BINARY 16 NOT NULL Code BIGINT 20 UNS

为什么MySQL在这里不总是使用索引合并？

为什么MySQL在这里不总是使用索引合并？ 的相关文章

随机推荐

热门标签

为什么MySQL在这里不总是使用索引合并？的相关文章