MySQL 查询大数据时速度非常慢

2023-12-24

我不是 MySQL 高手，但我明白了，我刚刚继承了一个相当大的表（600,000 行和大约 90 列（请杀了我...）），并且我创建了一个较小的表来将其链接到类别表。

我正在尝试使用左连接查询所述表，因此我在一个对象中拥有两组数据，但它运行速度非常慢，而且我还不够热，无法对其进行排序；我真的很感激一些关于为什么这么慢的指导和解释。

SELECT 
    `products`.`Product_number`,
    `products`.`Price`,
    `products`.`Previous_Price_1`,
    `products`.`Previous_Price_2`,
    `products`.`Product_number`,
    `products`.`AverageOverallRating`,
    `products`.`Name`,
    `products`.`Brand_description`
FROM `product_categories`
LEFT OUTER JOIN `products`
ON `products`.`product_id`= `product_categories`.`product_id`
WHERE COALESCE(product_categories.cat4, product_categories.cat3,
product_categories.cat2, product_categories.cat1) = '123456'
AND `product_categories`.`product_id` != 0

这两个表是MyISAM，产品表在Product_number和Brand_Description上有索引，而product_categories表在所有组合列上都有唯一索引；如果此信息有任何帮助的话。

继承了这个系统后，我需要在我用核武器攻击它之前尽快让它工作并正确地完成它，所以现在的任何帮助都将赢得你我最大的尊重！

[编辑] 这是解释扩展的输出：

+----+-------------+--------------------+-------+---------------+------+---------+------+---------+----------+--------------------------+
| id | select_type | table              | type  | possible_keys | key  | key_len | ref  | rows    | filtered | Extra                    |
+----+-------------+--------------------+-------+---------------+------+---------+------+---------+----------+--------------------------+
|  1 | SIMPLE      | product_categories | index | NULL          | cat1 | 23      | NULL | 1224419 |   100.00 | Using where; Using index |
|  1 | SIMPLE      | products           | ALL   | Product_id    | NULL | NULL    | NULL |  512376 |   100.00 |                          |
+----+-------------+--------------------+-------+---------------+------+---------+------+---------+----------+--------------------------+

优化表

为了建立基线，我首先建议运行OPTIMIZE TABLE http://dev.mysql.com/doc/refman/5.1/en/optimize-table.html两个表上的命令。请注意，这可能需要一些时间。来自docs http://dev.mysql.com/doc/refman/5.1/en/optimize-table.html:

OPTIMIZE TABLE如果您删除了大部分内容，则应使用表或者如果您对可变长度的表进行了许多更改行（具有VARCHAR, VARBINARY, BLOB, or TEXT列）。删除的行保存在链表中，并保存在后续的行中INSERT操作重用旧的行位置。您可以使用OPTIMIZE TABLE到回收未使用的空间并对数据文件进行碎片整理。后对表进行大量更改，这个说法也可能会改进使用表的语句的性能有时会显着。

[...]

对于 MyISAM 表，OPTIMIZE TABLE工作原理如下：

如果表已删除或拆分行，请修复该表。

如果索引页未排序，请对其进行排序。

如果表的统计信息不是最新的（并且无法通过对索引排序来完成修复），请更新它们。

Indexing

如果空间和索引管理不是问题，您可以尝试添加综合指数 http://dev.mysql.com/doc/refman/5.0/en/multiple-column-indexes.html on

product_categories.cat4, product_categories.cat3, product_categories.cat2, product_categories.cat1

如果您使用这些列的最左边的子集，建议这样做often在您的查询中。查询计划表明它可以使用cat1指数product_categories。这很可能只包括cat1柱子。通过将所有四个类别列添加到索引中，它可以更有效地查找所需的行。来自docs http://dev.mysql.com/doc/refman/5.0/en/multiple-column-indexes.html:

MySQL 可以使用多列索引来进行测试所有列的查询索引中的列，或仅测试第一列的查询前两列、前三列，依此类推。如果您指定索引定义中按正确顺序排列的列，一个单一的复合索引可以加速同一对象上的多种查询桌子。

结构

此外，鉴于您的桌子有90列你还应该知道更宽的表可能会导致查询性能变慢 http://www.mysqlperformanceblog.com/2006/06/09/why-mysql-could-be-slow-with-large-tables/。您可能需要考虑垂直分区 http://apheliondynamics.com/blog/2010/02/11/database-optimization-vertical-partitioning-in-mysql/你的表分成多个表：

列太多会使记录大小膨胀，进而导致记录大小膨胀导致更多的内存块被读入和读出内存，从而导致更高的输入/输出。这可能会损害性能。解决这个问题的一种方法是将您的表拆分为更小、更独立的表，其中包含更小的表基数比原来的多。现在应该可以更好地阻塞因子（如上所述），这意味着更少的 I/O 和更快的速度表现。像这样分解桌子的过程是称为垂直分区.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

pdo

MySQL 查询大数据时速度非常慢的相关文章

如何修复 InterfaceError: 2003: 无法连接到“127.0.0.1:3306:3306”上的 MySQL 服务器（11001 getaddrinfo 失败）

我的MySQL连接成功但是遇到这个界面错误 import mysql connector db mysql connector connect host 127 0 0 1 3306 user root passwd teja databa
从 PDO 准备好的语句中获取原始 SQL 查询字符串

在准备好的语句上调用 PDOStatement execute 时有没有办法让原始 SQL 字符串执行出于调试目的这将非常有用我假设您的意思是您想要最终的 SQL 查询并将参数值插入其中我知道这对于调试很有用但这不是准备好的语
如何在Sequelize中从主模型同一级别的包含模型返回结果？

这是我在项目中完成的代码和结果我想获得包含模型的结果与主模型相同的结果下面的代码是我所做的序列化查询 User findAll include model Position attributes POSITION NAME then
从数据库 MYSQL 和 Codeigniter 获取信息

如果你们需要其他信息上一个问题就在这里从数据库中获取信息 https stackoverflow com questions 13336744 fetching information from the database 另一个更新尽
SQLSTATE[HY000] [2002] 资源暂时不可用 - mysql - innodb 和 pdo

在我的错误日志中得到大量结果如下所列数据库中的所有表都是 innodb 并且就与这些表的任何交互而言一切都是带有准备好的语句的 pdo 正如我所说所有错误几乎与下面列出的错误相同但发生在几个不同的页面上无论页面如何错误行始终指
在 MySQL 数据库上使用版本控制 (Git)

我是一名 WordPress 设计师开发人员越来越多地使用版本控制特别是 Git 尽管我确实在某些项目中使用 SVN 我目前正在使用 Beanstalk 作为我的远程仓库将所有 WordPress 文件添加到我的存储库中是没有问题的
项目链接在 Wamp 服务器上不起作用

我正在另一台计算机上安装 Wamp 服务器来运行中型数据库和 UI 我已成功阻止 IIS 并将服务器路由到 Localhost 8080 但是每当我尝试从 localhost 主页访问我的项目时在 www 文件中我被重定向到页面未找到错
MySql 从另一个表中减去一个表

我有两个表 A 包含所有数据表 B 从 A 中随机选择 25 的数据创建所以 A 和 B 具有完全相同的列也没有独特的列我想做的是从 A 中减去 B 有什么想法吗查看所有行A除了那些在B SELECT FROM A WHERE f
PHP + MySQL 队列

我需要一个充当队列的简单表我的 MySQL 服务器限制是我不能使用 InnoDB 表只能使用 MyISAM 客户工人将同时工作他们每次都需要接受不同的工作我的想法是执行以下操作伪代码 job lt SELECT FROM que
未知的表引擎“InnoDB”

最近我发现如果我有好的硬件我可以最大限度地提高 mysql 的性能由于我一直在使用 InnoDB 所以我在 my ini 中添加了额外的配置以下是新添加的配置 innodb data file path ibdata1 10M au
mysql：返回右侧第一个出现的子字符串？（子字符串？！）

有没有办法返回sql中字符串右侧第一次出现的空格我想你正在寻找类似的东西SUBSTRING INDEX http dev mysql com doc refman 5 0 en string functions html function
MySQL 使用 DATE_ADD 设置 DATE 列的默认值？

我正在尝试使用表达式将 DATE 列添加到具有 DEFAULT DATE 值的表中 ALTER TABLE wp ezts project params ADD est completion DATE NOT NULL DEFAULT DA
更改“Mysql 行大小太大”的限制

我如何更改限制行大小太大 gt 8126 将某些列更改为 TEXT 或 BLOB 或使用ROW FORMAT DYNAMIC or ROW FORMAT COMPRESSED可能有帮助在当前行格式中 BLOB768 字节的前缀内联存储
无法打开 phpmyadmin，require_once(./libraries/common.inc.php)：无法打开流：没有这样的文件或目录

当我做php usr share phpmyadmin index php 我明白了 PHP 警告 require once libraries common inc php 无法打开流第 33 行 usr share phpmyadmi
插入 Mysql 表时防止 Json 排序

在发送 AJAX 请求时 Json Content 的重新排序已经是一个已知问题但我不知道在将 Json content 插入 JSON 类型的 Mysql 表时也会发生同样的情况在这种情况下 mysql 服务器在保存之前也会对其内容进
判断是否存在多对多记录组合

这似乎是一个常见的任务有一个简单的解决方案但我在 StackOverflow 和 Google 上都空手而归场景是这样的我有两个共享多对多关系的表 A 和 B 因此我有一个带有外键的表 A B 它映射 A 到 B 记录关系标准的
搜索多个表 (SQL)

我需要能够有一个 SQL 查询来使用简单的搜索来搜索我的数据库这是我的表格现在的样子 Table artists id name Table albums id artistID name Table songs id albumID n
MySQL 中的类型：BigInt(20) 与 Int(20)

我想知道两者之间有什么区别BigInt MediumInt and Int是很明显它们会允许更大的数量不过我可以做一个Int 20 or a BigInt 20 这会让人觉得这并不一定与尺寸有关一些见解会很棒只是有点好奇我一直
尝试在 Mac OSX 上的 virtualenv 和 MySQL 中安装 Django CMS 时出错

当我尝试使用 virutalenv 安装带有 MySQL 的 django CMS 时出现以下错误 RuntimeError maximum recursion depth exceeded Users ethan Sites env b
在 Java Web 应用程序中获取 DataSource 资源

我的 context xml 文件中有以下资源标记

随机推荐

无法连接到 Elasticsearch：未找到活动连接：没有可用的 Elasticsearch 节点

我只是无法理解发生了什么事我的 go 应用程序无法连接到弹性搜索该节点可用已启动并正在运行我在这里做错了什么 import fmt github com olivere elastic v7 github com sirupsen
黄瓜在 Windows 中不显示彩色输出

这可能是非常愚蠢的事情但我无法解决我将 Cucumber 版本升级到 v 0 10 0 现在测试在 Win 7 上运行未使用漂亮格式化程序显示彩色输出运行测试时会打印此错误 WARNING You must use ANSIC
ConfigurationManager.AppSettings["SettingName"] 与 Properties.Settings.Default.SettingName 我什么时候应该使用它们？

什么时候应该使用configurationManager AppSettings或Visual Studio生成的强类型设置在大多数情况下强类型的设置似乎更合适但我认为可以使用 ConfigurationManager 方法将设置动态
Elisp、alist 和字符串；类型混乱

我正在尝试将组织项目发布为 html 并使用以下组织项目定义自动执行该任务 defconst home file name directory or load file name buffer file name require org p
将 Hashtable 转换为 xml 字符串，然后再转换回 HashTable，无需使用 .NET Serializer

有谁知道如何将 Hashtable 转换为 XML String 然后再转换回 HashTable 而不使用基于 NET 的 XMLSerializer 当代码在 IE 内部运行并且浏览器的保护模式打开时 XMLSerializer 会带来
CSS 自定义字体垂直偏移（bug？）

我通过以下方法在 CSS 中使用自定义字体 font face font family Gabriola src url Gabriola eot src url Gabriola eot iefix format embedded ope
Netlogo：如何使用路由变量实际沿着路径移动

我使用两种类型的乌龟汽车和房屋两者都是随机放置的我的目标是从组合路线向量开始为每辆车获取一条路线并让每辆车移动并访问分配给它的每个家庭首先我根据组合路线向量为每辆车创建一条路线我在下面展示我的代码但现在我试图让汽车遵循各自
LINQ 按月分组问题

我是 LINQ to SQL 的新手我想知道如何在 LINQ 中实现类似的功能 Month Hires Terminations Jan 5 7 Feb 8 8 Marc 8 5 到目前为止我已经得到了这个我认为它有问题但我不确定 f
如何使 jquery.inputmask 与输入类型=数字一起工作？

只要输入类型文本我的代码就可以正常工作但我想使用类型数字以便在移动设备上显示正确的键盘有没有办法做到这一点希望有一些我在文档中遗漏的设置这是我的html
@this到底有什么作用？

据我所知 this表示当前触发事件的组件如
C# Winforms：高效显示许多控件

我正在构建一个包含 15x15 225 个按钮的控件并且需要调整大小因为它是一个网格所以锚定和对接不起作用我尝试过 TableLayoutPanel 以及处理调整大小事件以手动放置控件和调整控件大小在这两种情况下调整大小的速度都
开发 Web 应用程序时，什么时候会使用图形数据库还是文档数据库？

我正在使用 Rails 开发一个基于 Web 的应用程序我正在争论是使用图形数据库例如 InfoGrid 还是文档数据库例如 MongoDB 我的应用程序需要存储小型数据集例如 URL 和非常大的数据集例如虚拟机该数据将与单个用
Rails 3，测试方法太多？

如果您刚刚开始使用 Rails 您会鼓励新用户走哪条路Testing 我读到的有关 Rails 3 的任何内容都告诉我我应该使用Rspec 2 但是 Rspec 附带了我需要学习的其他一些东西比如 gem capybara gem dat
Opencv 如何在视频上叠加文本

我想添加一些文本来显示在我的网络摄像头的视频上但我似乎无法理解我之前已经使用 Opencv 将文本添加到图像中但视频的方法似乎有所不同所以我将如何去做呢这是我的网络摄像头脚本 import cv2 import numpy as
通过Python插入远程Couchbase服务器

我使用此代码将数据插入 Couchbase from couchbase import Couchbase c Couchbase connect host remote server com bucket default c set fi
SQL Server 2005 将变量设置为选择查询的结果

如何在不使用存储过程的情况下将变量设置为选择查询的结果我想做类似的事情 OO日期日期时间 SET OOdate Select OO Date FROM OLAP OutageHours as OO WHERE OO OutageID 1
在二维数组的每行末尾附加一个列表

我想在二维数组 a 的每行末尾附加一个列表一维数组 b input a np array 1 1 2 2 3 3 b np array 4 4 期望输出 array 1 1 4 4 2 2 4 4 3 3 4 4 my code temp
Django：在每次启动时运行代码，但在数据库迁移之后

我认为在最新版本的 Django 中有一个简单的答案但我找不到它我有涉及数据库的代码我希望它在 Django 每次启动时运行我似乎有两个选择选项1 AppConfig ready 这可以工作但也可以在创建数据库表之前运行即在测
承诺开始得太早

我有以下承诺 const promise new Promise resolve reject gt setTimeout gt resolve Hello 4000 后来我这样称呼它 promise then msg gt consol
MySQL 查询大数据时速度非常慢

我不是 MySQL 高手但我明白了我刚刚继承了一个相当大的表 600 000 行和大约 90 列请杀了我并且我创建了一个较小的表来将其链接到类别表我正在尝试使用左连接查询所述表因此我在一个对象中拥有两组数据但它运行速度非常慢

MySQL 查询大数据时速度非常慢

优化表

Indexing

结构

MySQL 查询大数据时速度非常慢 的相关文章

随机推荐

热门标签

MySQL 查询大数据时速度非常慢的相关文章