为什么 SQLAlchemy count() 比原始查询慢得多？

2024-01-22

我正在使用 SQLAlchemy 和 MySQL 数据库，我想计算表中的行数（大约 300k）。 SQL炼金术count http://docs.sqlalchemy.org/ru/latest/orm/query.html#sqlalchemy.orm.query.Query.count运行该函数所需的时间大约是直接在 MySQL 中编写相同查询的 50 倍。难道我做错了什么？

# this takes over 3 seconds to return
session.query(Segment).count()

However:

SELECT COUNT(*) FROM segments;
+----------+
| COUNT(*) |
+----------+
|   281992 |
+----------+
1 row in set (0.07 sec)

速度差异随着表的大小而增加（在 100k 行下几乎不明显）。

Update

Using session.query(Segment.id).count()代替session.query(Segment).count()似乎可以解决问题并加快速度。我仍然很困惑为什么初始查询速度较慢。

不幸的是，MySQL 对子查询的支持非常非常糟糕，这对我们产生了非常负面的影响。这SQLAlchemy 文档 http://docs.sqlalchemy.org/en/rel_0_8/orm/query.html?highlight=count#sqlalchemy.orm.query.Query.count指出可以使用以下方式实现“优化”查询query(func.count(Segment.id)):

返回此查询将返回的行数。

这会生成此查询的 SQL，如下所示：
SELECT count(1) AS count_1 FROM (
     SELECT <rest of query follows...> ) AS anon_1
要对要计数的特定列进行细粒度控制，请跳过使用子查询或以其他方式控制 FROM 子句，或者使用其他聚合函数，结合使用 func 表达式查询（），即：
from sqlalchemy import func

# count User records, without
# using a subquery.
session.query(func.count(User.id))

# return count of user "id" grouped
# by "name"
session.query(func.count(User.id)).\
        group_by(User.name)

from sqlalchemy import distinct

# count distinct "name" values
session.query(func.count(distinct(User.name)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

sqlalchemy

为什么 SQLAlchemy count() 比原始查询慢得多？的相关文章

ORDER BY 之后的 GROUP BY

我需要去做GROUP BY after ORDER BY 我不明白为什么 MySQL 不支持这一点这是我的代码 SELECT pages id contents id language ORDER BY FIND IN SET langu
错误代码 13，SELECT INTO OUTFILE 问题

我试图了解使用 INTO OUTFILE 命令时不断遇到问题的原因我总是收到这个错误 ERROR 1 HY000 Can t create write to file var www p1 txt Errcode 13 SELECT pa
消除 JPA 标准中子查询产生的冗余连接

我只需要使用 JPA 标准执行以下 MySQL 查询获取状态列表来自state table 基于给定的国家名称在country SELECT state id state name country id FROM state tabl
MySQL 中的 group_concat 性能问题

我添加了一个group concat到一个查询并杀死了性能添加之前和之后的解释计划是相同的所以我对如何优化它感到困惑这是查询的简化版本 SELECT curRow curRow 1 AS row number docID docTyp
Mysql 在给定日期时间范围内插入随机日期时间

使用 SQL 我可以在给出范围的列中插入随机日期时间值吗例如给定一个范围2010 04 30 14 53 27 to 2012 04 30 14 53 27 我对范围部分感到困惑因为我刚刚做了这个 INSERT INTO someta
将java应用程序与在线托管的mysql数据库连接

我已经用java构建了一个应用程序应用程序是一个将在3个不同的系统上使用因此该应用程序的数据库必须在线以使所有 3 个应用程序都具有最新的数据库 In starting I developed my application bas
搜索多个表 (SQL)

我需要能够有一个 SQL 查询来使用简单的搜索来搜索我的数据库这是我的表格现在的样子 Table artists id name Table albums id artistID name Table songs id albumID n
错误：SQLSTATE[HY000] [2002] 无法建立连接，因为目标计算机主动拒绝连接

当我调试代码时突然发生错误它有一系列关于数据库连接的错误 ERROR SQLSTATE HY000 2002 No connection could be made because the target machine actively
如何使用 SQL - INSERT...ON DUPLICATE KEY UPDATE？

我有一个脚本可以捕获推文并将其放入数据库中我将在 cronjob 上运行脚本然后在我的网站上显示数据库中的推文以防止达到 Twitter API 的限制所以我不想在我的数据库中有重复的推文我知道我可以使用 INSERT ON DU
有什么方法可以在MySQL中的表名位置使用变量吗？

我想在表名称位置使用变量例如 SELECT FROM targetTableName 然而它会出错有什么方法可以在MySQL中的表名位置使用变量吗您显示的查询不起作用有两个原因插入到查询中的用户定义变量将被视为使用字符串文字而不是
我们可以使用 Skip()、Take() 和 OrderBy() 控制 LINQ 表达式顺序吗

我正在使用 LINQ to Entities 来显示分页结果但我在组合方面遇到了问题Skip Take and OrderBy calls 一切正常除了OrderBy 分配得太晚了它在结果集被削减后执行Skip and Take 因此
Yii2 从 MySQL 中的表登录的分步指南

我开始在 Yii2 中迈出第一步到目前为止我已经能够编写一个应用程序并将数据库中的表连接到它就像我在 Yii1 中学到的那样该表是contacts我的创建视图中的表单将数据发送到数据库没有任何问题问题是我只能在 Yii2 内置的
MySQL 错误“连接过多”

我正在将 MySQL 5 0 用于由 GoDaddy linux 托管的网站我正在对我的网络应用程序进行一些测试突然我注意到页面刷新速度非常慢最后经过漫长的等待我到达了一个页面上面写着 MySQL 错误连接太多它指向我连接到
保护存储过程

我想知道是否有一种方法可以对某些用户隐藏存储过程的文本我正在使用 MySQL 5 1 48 和 Net Connector 6 2 3 以及 Visual Studio 2008 SP1 我在 MySQL 中有两个用户一个是 root
导入mysql数据库出错

我导出我的数据库并导出到另一台计算机使用 phpmyadmin 但它错误静态分析分析过程中发现2处错误意想不到的角色靠近位置 53 的无法识别的语句类型位置 1 的 div 附近 SQL查询 div class error h1
表被指定两次作为 INSERT 的目标和单独的数据源

我做了这个查询但它给了我错误就像标题中一样 INSERT INTO data waktu vaksinasi id binatang id vaksin tanggal vaksin status vaksin VALUES 1 1 S
MYSQL 中当前行上日期之前（并包括该日期）的所有行的总和

重要的是要知道在查询期间日期是未知的因此我不能只硬编码 WHERE 子句这是我的桌子 Date ID Customer Order Count 20150101 Jones 6 20150102 Jones 4 20150103 Jon
在评论中查找不同风格的日期

我还有一个问题要问preg match 我有一个表其中评论的日期写在评论本身内手动现在我需要提取该日期并将其放置在不同的列中我发现评论和日期的样式如下 id warning sent warning date 6109 2011 0
MySQL Spatial CONTAINS 显示错误结果

我的 MySQL 空间搜索有一个奇怪的行为我在 GEOM 字段葡萄牙边界中创建了一个多边形然后我尝试在内部找到一个点发现没问题下一次尝试是查找多边形外部的点但查询仍返回 1 个找到的行请帮忙我做错了什么为什么它会找到多边
如何在mysql中设置“performance_schema on”？

我想转performance schemaON 在 mysql 中收集统计信息我怎样才能实现这个目标以下指南是特定于 Linux 的但应该很容易适用于 Windows 您必须检查 mysql 服务器二进制文件是否已编译为支持它 mys

随机推荐

使用 for 循环替换 pandas 列每行中的单元格值

请帮助我理解我的错误我正在尝试更改我的一列 csv文件我有 csv文件如下 sku name code k1 aaa 886 k2 bbb 898 k3 ccc 342 k4 ddd 503 k5 eee 401 我想将 sku 列中的
TFS 无法识别添加的项目 VS2013 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在使用 VS2013 和 TFS Online 当我添加一个新项目时源代码管理不会将其识别为添加的项目但 csproj 会使用新文件
检查定时器是否正在运行

我一直在尝试用计时器重新填充游戏生活但每当我离开视图并返回时计时器就会重复并变得更快我尝试用以下方法解决这个问题Timer isValid函数仅在无效时运行计时器因此它永远不会重复但它似乎无法检查计时器是否在invalid在 if
nginx 响应 404 Not Found（单页应用程序）

我有一个带有常规浏览器路由器没有哈希的单页应用程序每当有人浏览页面并点击刷新按钮时 nginx 都会尝试在此路径上查找文件所以如果有人在mypage com aboutnginx 寻找about文件并以 404 Not Found
R 矩阵到 rownames colnames 值

我有一个矩阵 A 我想将其转换为以下形式的 data frame rownames colnames values Using unlist A 有帮助但没有给我行名感谢您的帮助您可以使用 reshape2 package load
Android - 用 @IntDef 替换参数化枚举

如何避免参数化枚举与 IntDef 我想保留一些与每个枚举类型关联的静态详细信息例如关联的 URl 关联的可绘制对象等 TYPE ONE R string res Urls URL1 TYPE TWO R string res Urls
如何防止Xcode每次都重建项目

我有一个 Mac OS X 应用程序由一个主要目标和一个依赖框架组成自从在我的 Mac OS X 应用程序上启用代码签名后我注意到每次运行 Xcode 时都会重建主要目标即使我没有触及任何代码行这是一个问题因为依赖框架需要知道主
如何更改多处理模块使用的序列化方法？

如何更改Python使用的序列化方法multiprocessing图书馆特别是默认的序列化方法使用pickle具有该版本 Python 的默认 pickle 协议版本的库默认的pickle协议在Python 2 7中是版本2 在Pyt
为什么是24位寄存器？

在我的工作中我处理不同的微控制器微处理器和 DSP 处理器其中许多都有 24 位寄存器和计数器我知道如何使用它们这不是我的问题我的问题是为什么他们有 24 位寄存器为什么不把它做成32位的呢据我所知这不是大小的问题因为寄
根据另一个参考数组从一个数组中选择密切匹配

我有一个数组A和一个参考数组B 尺寸为A至少和B e g A 2 100 300 793 1300 1500 1810 2400 B 4 305 789 1234 1890 B实际上是指定时间信号中峰值的位置并且A包含稍后时间的峰值位置
序列化代码示例中的无限循环

看看下面的代码here https web archive org web 20151025040111 http blogs msdn com 80 b sowmy archive 2006 03 26 561188 aspx 它是关于在
如何使用 Jest 运行单个测试？

我在文件 fix order test js 中有一个适用于嵌套子项的测试运行以下命令会运行文件中的所有测试 jest fix order test 如何只运行一个测试下面的代码不起作用因为它搜索指定的正则表达式的文件 jest
Windows：检测右 alt 是否在当前布局中生成 Ctrl+Alt (AltGr)

Windows 中的某些键盘布局例如 US QWERTY 将右 Alt 视为常规 Alt 键而其他键盘布局例如 US International 将其视为 AltGr 并在按下时同时生成 Ctrl 和 Alt 键 Microsoft
通过身份验证从 https 下载文件

我有一个 Python 2 6 脚本可以从 Web 服务器下载文件我希望这个脚本传递用户名和密码用于在获取文件之前进行身份验证并且我将它们作为 url 的一部分传递如下所示 import urllib2 response urll
android 中如何导航到另一个页面？

我是安卓新手请告诉我如何在 android 中导航到新页面提前致谢编辑如何从现有活动开始新活动在 Android 中导航到另一个页面意味着您必须启动另一个 Activity 要开始新活动请使用此 Intent intent n
使用 postgres 表序列而不是共享 hibernate_sequence

当我对表执行任何操作时它总是显示错误 Hibernate select nextval hibernate sequence 2019 07 20 16 15 44 877 WARN 58376 nio 9000 exec 1 o h e
按修改日期而不是发布日期对 Jekyll 帖子进行排序？

对于经常更新帖子的人来说有必要根据帖子从新到旧进行排序最后修改日期而不是 Jekyll 默认按发布日期排序似乎没有简单的方法可以实现这一点我已经阅读并测试了几乎所有的方法这是有效的部分符合预期用过这个宝石https github
在linux中安装jdk 1.7时出错[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案当我使用以下命令在 Oracle Linux 中安装 jdk 1 7 时 rpm ivh jdk 7u9 linux i586 rpm 但是我收到以下
使用正则表达式捕获两个单词之间的文本

我正在尝试使用 CSharp 中的正则表达式获取两个关键字之间的文本虽然我已经找到了一个具有相同标题的主题但该主题是关于查找方括号之间的文本这相当容易因为您可以使用
为什么 SQLAlchemy count() 比原始查询慢得多？

我正在使用 SQLAlchemy 和 MySQL 数据库我想计算表中的行数大约 300k SQL炼金术count http docs sqlalchemy org ru latest orm query html sqlalchemy

为什么 SQLAlchemy count() 比原始查询慢得多？

为什么 SQLAlchemy count() 比原始查询慢得多？ 的相关文章

随机推荐

热门标签

为什么 SQLAlchemy count() 比原始查询慢得多？的相关文章