在不同行上选择满足不同条件的值

2024-03-05

假设我有一个像这样的两列表格：

userid  |  roleid
--------|--------
   1    |    1
   1    |    2
   1    |    3
   2    |    1

我想获得所有不同的用户 IDroleids1、2 AND 3。使用上面的示例，我想要返回的唯一结果是userid1. 我该怎么做？

好吧，我对此投了反对票，所以我决定测试一下：

CREATE TABLE userrole (
  userid INT,
  roleid INT,
  PRIMARY KEY (userid, roleid)
);

CREATE INDEX ON userrole (roleid);

运行这个：

<?php
ini_set('max_execution_time', 120); // takes over a minute to insert 500k+ records

$start = microtime(true);

echo "<pre>\n";
mysql_connect('localhost', 'scratch', 'scratch');
if (mysql_error()) {
    echo "Connect error: " . mysql_error() . "\n";
}
mysql_select_db('scratch');
if (mysql_error()) {
    echo "Selct DB error: " . mysql_error() . "\n";
}

$users = 200000;
$count = 0;
for ($i=1; $i<=$users; $i++) {
    $roles = rand(1, 4);
    $available = range(1, 5);
    for ($j=0; $j<$roles; $j++) {
        $extract = array_splice($available, rand(0, sizeof($available)-1), 1);
        $id = $extract[0];
        query("INSERT INTO userrole (userid, roleid) VALUES ($i, $id)");
        $count++;
    }
}

$stop = microtime(true);
$duration = $stop - $start;
$insert = $duration / $count;

echo "$count users added.\n";
echo "Program ran for $duration seconds.\n";
echo "Insert time $insert seconds.\n";
echo "</pre>\n";

function query($str) {
    mysql_query($str);
    if (mysql_error()) {
        echo "$str: " . mysql_error() . "\n";
    }
}
?>

Output:

499872 users added.
Program ran for 56.5513510704 seconds.
Insert time 0.000113131663847 seconds.

这会增加 500,000 个随机用户角色组合，并且大约有 25,000 个符合所选条件的组合。

第一个查询：

SELECT userid
FROM userrole
WHERE roleid IN (1, 2, 3)
GROUP by userid
HAVING COUNT(1) = 3

查询时间：0.312s

SELECT t1.userid
FROM userrole t1
JOIN userrole t2 ON t1.userid = t2.userid AND t2.roleid = 2
JOIN userrole t3 ON t2.userid = t3.userid AND t3.roleid = 3
AND t1.roleid = 1

查询时间：0.016s

这是正确的。我建议的加入版本是比聚合版本快二十倍。

抱歉，我这样做是为了在现实世界中生活和工作，在现实世界中我们测试 SQL，结果不言而喻。

这其中的原因应该是很清楚的。聚合查询的成本将随着表的大小而变化。每行都经过处理、聚合和过滤（或不通过）HAVING条款。连接版本将（使用索引）根据给定角色选择用户子集，然后对照第二个角色检查该子集，最后对照第三个角色检查该子集。每个选择 http://en.wikipedia.org/wiki/Selection_(relational_algebra) (in 关系代数 http://en.wikipedia.org/wiki/Relational_algebra术语）适用于越来越小的子集。由此你可以得出结论：

连接版本的性能变得更好，匹配发生率更低。

如果只有 500 个用户（在上面的 50 万个示例中）具有三个指定的角色，则加入版本将显着加快。聚合版本不会（并且任何性能改进都是传输 500 个用户而不是 25k 个用户的结果，加入版本显然也得到了 25k）。

我也很好奇真正的数据库（即 Oracle）将如何处理这个问题。因此，我基本上在 Oracle XE 上重复了相同的练习（与上一个示例中的 MySQL 在同一台 Windows XP 桌面计算机上运行），结果几乎相同。

连接似乎不受欢迎，但正如我所演示的，聚合查询可能会慢一个数量级。

Update:经过一些广泛的测试后，情况变得更加复杂，答案将取决于您的数据、数据库和其他因素。这个故事的寓意是测试、测试、测试。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在不同行上选择满足不同条件的值的相关文章

如何更改Mysql的连接排序规则

如何更改 mysql 数据库的连接排序规则我在 ubuntu 14 中使用 Mysql workbench 5 5 和 mysql 5 5 当我执行存储过程时出现错误错误代码 1267 操作的排序规则 utf8 general ci
RedGate ReadyRoll 的替代品了吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一种经济实惠的 RedGate ReadyRoll 替代方案以实现 SQL 的持续部署我
在 SQL 查询中使用 fn_Split

我一直在努力争取fn Split在我的查询中正常工作我到处搜索并在这里找到了似乎接近我需要的答案但我仍然无法使其发挥作用基本上我试图返回与数组中的条目匹配的记录我已经有了一个与我的数据库一起使用的表值函数如下所示 Select
在 EXISTS 查询中使用 LIMIT 有什么意义吗？

添加一个是否有任何性能优势LIMIT to an EXISTS查询或者 MySQL 会自行应用限制吗 Example IF EXISTS SELECT 1 FROM my table LIMIT 1 can this improve pe
MySQL中Join同表临时表

我喜欢在 MySQL 中加入一个失败的临时表这个想法很简单 CREATE TEMPORARY TABLE temp table LIKE any other table srsly it does not matter which tab
在 Ubuntu 上纯粹通过 bash 脚本安装 mysql 5.7

我想要一个无需任何手动输入即可安装 MySQL 5 7 实例的 bash 脚本我正在关注数字海洋教程 https www digitalocean com community tutorials how to install mysql
使用python中的mysql连接器正确从mysql数据库获取blob

当执行以下代码时 import mysql connector connection mysql connector connect connection params here cursor connection cursor curso
如何在 SQL 中的时区中使用“America/New_York”

我有这段代码在 SQL 中运行良好但是我想使用不同的时区格式例如 America New York 代替 US Eastern Standard Time SELECT TODATETIMEOFFSET CAST CURRENT TIM
SQL Server - 在设置 COLLATE Latin1_General_CS_AS 的情况下搜索不区分大小写

家长提问 https stackoverflow com questions 50974562 sql server update to match and replace only exact words感谢 Iamdave 部分问题得到
使用 SQLite 创建列表树

我正在尝试使用 PHP 和 SQLite 表设置创建一个分层列表如下所示 itemid parentid name 1 null Item1 2 null Item2 3 1 Item3 4 1 Item4 5 2 Item5
导出 Azure SQL 数据库时出现错误 SQL71501

导出 Azure SQL 数据库时出现奇怪的错误导出一直工作正常直到最近发生一些架构更改但现在出现错误 SQL71501 该数据库是V12 兼容性级别130 尽管master数据库仍兼容级别 120 该问题似乎是由一个新的表值函数引起
将mysql表限制为一定大小并自动删除最旧的条目[重复]

这个问题在这里已经有答案了可能的重复如何设置MySQL表的最大行数 https stackoverflow com questions 8048001 how can i set a maximum number of rows in
小数除以小数并得到零

为什么当我这样做时 select CAST 1 AS DECIMAL 38 28 CAST 1625625 AS DECIMAL 38 28 我得到 0 吗但是当我得到 0 时 select CAST 1 AS DECIMAL 20 10
不使用窗口函数实现 SQL 查询

我读过可以通过创造性地使用连接等来实现在 SQL 窗口函数中可以执行的任何操作但我不知道如何实现我在这个项目中使用 SQLite 它目前没有窗口函数我有一个有四列的表 CREATE TABLE foo id INTEGER PRIM
如何从 Databricks Delta 表中删除列？

我最近开始发现 Databricks 并遇到了需要删除增量表的特定列的情况当我使用 PostgreSQL 时它就像 ALTER TABLE main metrics table DROP COLUMN metric 1 我正在浏览 Da
django.core.exceptions.ImproperlyConfigured：加载 MySQLdb 模块时出错：没有名为 MySQLdb 的模块

我在尝试连接 mysql 数据库时遇到的问题我还给出了我使用过的数据库设置 Traceback most recent call last File manage py line 10 in
在触发器中记录更新操作

我有一个 UPDATE 触发器它生成 INSERTED 和 DELETED 表如下所示 INSERTED Id Name Surname 1 Stack Overflow 2 Luigi Saggese DELETED Id Name
尝试在本地主机上测试我的 php 文件，但只出现一个空白页面，没有错误消息

我正在运行 Apache 和 mySQL 因为我检查了所有日志似乎没有任何错误我的目标是每当有新的表单条目时就向特定地址发送电子邮件我对后端和 PHP 缺乏经验所以我不太确定哪里出了问题任何帮助将不胜感激
sqlite 插入需要很长时间

我正在将不到 200 000 行插入到 sqlite 数据库表中我只是在终端中通过 sqlite3 使用一个非常简单的 sql 文件我打赌它已经运行了至少 30 分钟这是正常现象还是我应该关闭该过程并尝试不同的方法 sqlite中的插
oracle日期序列？

我有一个 oracle 数据库我需要一个包含 2 年所有日期的表例如来自01 01 2011 to 01 01 2013 首先我想到了一个序列但显然唯一支持的类型是数字所以现在我正在寻找一种有效的方法来做到这一点欢呼骗局如果您想

随机推荐

使用 Powershell 将图像插入到 VARBINARY(MAX) 类型的 SQL Server 列中

我被困住了我正在尝试将图片从硬盘插入到 SQL Server 类型的列中VARBINARY MAX 我把它转换成某种东西但我什至不确定它是什么结果看起来像 81 69 20 0 81 69 20 0 81 69 20 0 81 69
使用 Spark 和 Phoenix 将 CSV 文件保存到 hbase 表

有人可以向我指出使用 Spark 将 csv 文件保存到 Hbase 表的工作示例吗2 2我尝试过但失败的选项注意它们都适用于我的 Spark 1 6 凤凰火花 hbase spark it nerdammer bigdata spar
TinyMCE JQuery 插件并不总是更新文本区域

我们的表单有相当多的文本区域在某些情况下多达 20 个每个文本区域都通过 TinyMCE jquery 插件转换为所见即所得编辑器如下所示 var tinymceoptions script url Scripts tiny mce
如何创建可访问单个数据集的 Google BigQuery 服务帐户？

有没有办法向给定的客户端 ID 授予对特定 BigQuery 数据集的只读访问权限我尝试过使用服务帐户但这提供了对所有数据集的完全访问权限还尝试从其他应用程序创建服务帐户并将生成的电子邮件地址与证书一起添加到 BigQuery gt
容器实例 IAM 角色与任务执行角色

ECS的容器实例IAM角色和任务执行角色有什么区别我知道任务角色概念但对容器实例IAM角色和任务执行之间感到困惑提前致谢容器实例 IAM 角色分配给 ECS 任务将部署到的 EC2 实例的角色如果您要部署到 Fargate 则不
修复了 iframe 中 css 的垂直定位

我试图让我的底部标题粘贴到 iframe 应用程序内屏幕的底部并使其始终出现在用户的视图中即使页面滚动时也是如此我无法控制外部 iframe 因为它位于不同的域中标头本身必须位于 iframe 内部因为我无法控制 iframe 外
在 C 中，为什么 const 变量不能用作数组大小初始值设定项？ [复制]

这个问题在这里已经有答案了在下面的代码中 const int 不能用作数组大小 const int sz 0 typedef struct char s sz st int main st obj strcpy obj s hello w
通过 Ajax 添加详细信息时出错

你好frndz 我需要帮助我正在尝试通过我的表单添加详细信息但没有获得任何价值并且错误反映为添加请求失败任何人都可以解决我的错误我不知道该怎么做这是我的代码webapp js Add company button docume
我正在尝试使用 4 路循环展开来优化此 C 代码

我想做的是获取此 C 代码并使用称为循环展开的技术对其进行优化但在本例中我想使用四路循环展开现在我理解了这项技术也理解了这个概念但我只是不知道如何将其应用到这段代码中我需要添加一些额外的变量吗我是否必须在每个循环之后或所有循环
java.lang.IllegalArgumentException：如果指定的 JWT 是数字签名的，则必须指定签名密钥

我正在寻求实施JWT在我的申请中我正在通过参考以下内容进行一些研发 https stormpath com blog jwt java create verify https stormpath com blog jwt java cre
使用自定义 http.ResponseWriter 根据代理请求的响应写入 cookie？

我原来的问题here https stackoverflow com questions 58776775 how can i set a cookie based on response header with reverse proxy
使用 Java 将十六进制转储的字符串表示形式转换为字节数组？

我正在寻找一种将表示十六进制值的长字符串来自转储转换为字节数组的方法我无法比发帖者更好地表达它同样的问题在这里 http www experts exchange com Programming Programming Languag
使用方法初始化常量变量 (C#)

是否可以使用另一个类的方法初始化常量值 namespace ConsoleApplication1 class Program const int gravit haha habc something like this static vo
弹性盒/网格布局中的最后一个边距/填充折叠

我有一个项目列表我正在尝试使用 Flexbox 将其排列成可滚动的水平布局容器中的每个项目都有左右边距但最后一个项目的右边距正在折叠有没有办法阻止这种情况发生或者有一个好的解决方法 ul list style type none
Laravel 中使用 return 重定向到外部 URL

我正在尝试使用 SMS INDIA HUB API 向用户发送一次性密码为此我需要重定向到 URL 格式如果我们加载这个 URL 它将返回一些消息我需要把这条消息传达给我试过这样 url http cloud smsindiahu
当我在分析模式下运行我的应用程序时，它停止响应

我的 Android 应用程序在长时间运行的会话中遇到一些 OutOfMemory 错误为了找到原因我尝试使用 Android Studio Profiler 但它停止工作并在使用后 10 秒内冻结应用程序这是 Android Stu
如何在 URL 中传递 Javascript 变量？阿贾克斯

我试图在我使用的 url 中传递 accesstoken 和 pageid 的值有什么想法如何正确地做到这一点吗
文档中哪里说 while 测试 readdir 的定义？

也可以看看 readdir 的 0 结果在 while 条件下如何不为 false https stackoverflow com questions 843430 how is 0 result from readdir not fals
VarBinary 到图像 url

我正在将 Base64 图像转换为byte 并将其存储在varbinarySQL Server 中的列我想从数据库获取图像并将其设置为 ASP NET 的图像 urlimage 我怎样才能做到这一点将图像写入数据库的代码 string
在不同行上选择满足不同条件的值

假设我有一个像这样的两列表格 userid roleid 1 1 1 2 1 3 2 1 我想获得所有不同的用户 IDroleids1 2 AND 3 使用上面的示例我想要返回的唯一结果是userid1 我该怎么做好吧我对此投了反对票

在不同行上选择满足不同条件的值

在不同行上选择满足不同条件的值 的相关文章

随机推荐

热门标签

在不同行上选择满足不同条件的值的相关文章