原因在于使用OR条件在WHERE clause.
为了说明这一点,请尝试再次运行查询,这次仅使用id = 5
条件,并得到(解释输出):
+----+-------------+------------+--------+--------------------+---------+---------+-------+------+----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+------------+--------+--------------------+---------+---------+-------+------+----------------+
| 1 | PRIMARY | <derived2> | system | NULL | NULL | NULL | NULL | 1 | |
| 1 | PRIMARY | tree | const | PRIMARY,index_both | PRIMARY | 4 | const | 1 | |
| 2 | DERIVED | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used |
+----+-------------+------------+--------+--------------------+---------+---------+-------+------+----------------+
再说一遍,这一次只有parent_id = @last_id OR parent_id = 5
条件,并得到:
+----+-------------+------------+--------+-----------------+------+---------+------+------+----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+------------+--------+-----------------+------+---------+------+------+----------------+
| 1 | PRIMARY | <derived2> | system | NULL | NULL | NULL | NULL | 1 | |
| 1 | PRIMARY | tree | ALL | index_parent_id | NULL | NULL | NULL | 10 | Using where |
| 2 | DERIVED | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used |
+----+-------------+------------+--------+-----------------+------+---------+------+------+----------------+
MySQL 不太擅长处理同一查询中的多个索引。 AND 条件的情况稍微好一些;人们更有可能看到索引合并 http://dev.mysql.com/doc/refman/5.1/en/explain-output.html#jointype_index_merge优化比索引联合 http://dev.mysql.com/doc/refman/5.1/en/index-merge-optimization.html#index-merge-union优化。
随着版本的进步,情况正在改善,但我已经测试过您对版本的查询5.5
,这是当前最新的生产版本,结果如您所描述。
要解释为什么这很困难,请考虑:两个不同的索引将回答查询的两个不同条件。一位将回答id = 5
,另一个为parent_id = @last_id OR parent_id = 5
(顺便说一句,没有问题OR在后者内部,因为这两个术语都是在同一索引内处理的)。
没有一个指数可以同时回答这两个问题,因此FORCE INDEX
指令被忽略。看,FORCE INDEX
说MySQL必须使用an表扫描上的索引。这并不意味着它必须在表扫描中使用多个索引。
所以MySQL遵循这里文档的规则。但为什么这么复杂呢?因为要使用两个索引来回答,MySQL 必须从两个索引收集结果,将其中一个存储在某个临时缓冲区中,同时管理第二个索引。然后必须遍历该缓冲区以过滤掉相同的行(某些行可能适合所有条件)。然后扫描该缓冲区以返回结果。
但是等等,该缓冲区本身没有索引。过滤重复项并不是一项显而易见的任务。因此,MySQL 更喜欢在原始表上工作并进行扫描,从而避免所有混乱。
当然这是可以解决的。 Oracle的工程师可能还会对此进行改进(最近他们一直在努力改进查询执行计划),但我不知道这是否是在TODO任务上,或者是否具有高优先级。