SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化

2024-03-30

我已经使用 SQL Alchemy 几个月了，到目前为止，它给我留下了深刻的印象。

我现在遇到了一个问题，这似乎是一个错误，但我不确定我是否在做正确的事情。我们在这里使用 MS SQL，通过表反射来定义表类，但是我可以使用内存 SQLite 数据库（我在此处包含的代码）来复制该问题。

我正在做的是使用两个表之间的链接表来定义两个表之间的多对多关系。链接表包含一条额外的信息，我想用它来过滤链接，需要在关系上使用 Primaryjoin 语句。这非常适合延迟加载，但是出于性能原因，我们需要急切加载，这就是一切失败的地方。

如果我定义与延迟加载的关系：

activefunds = relationship('Fund', secondary='fundbenchmarklink',
                           primaryjoin='and_(FundBenchmarkLink.isactive==True,'
                                       'Benchmark.id==FundBenchmarkLink.benchmarkid,'
                                       'Fund.id==FundBenchmarkLink.fundid)')

并正常查询DB：

query = session.query(Benchmark)

我需要的行为正是我想要的，尽管性能非常糟糕，因为在迭代所有基准测试及其各自的基金时需要额外的 SQL 查询。

如果我定义与预加载的关系：

activefunds = relationship('Fund', secondary='fundbenchmarklink',
                           primaryjoin='and_(FundBenchmarkLink.isactive==True,'
                                       'Benchmark.id==FundBenchmarkLink.benchmarkid,'
                                       'Fund.id==FundBenchmarkLink.fundid)',
                           lazy='joined')

并正常查询DB：

query = session.query(Benchmark)

它在我脸上爆炸：

sqlalchemy.exc.OperationalError: (sqlite3.OperationalError) no such column: fund.id 
    [SQL: 'SELECT benchmark.id AS benchmark_id,
                   benchmark.name AS benchmark_name,
                   fund_1.id AS fund_1_id,
                   fund_1.name AS fund_1_name,
                   fund_2.id AS fund_2_id,
                   fund_2.name AS fund_2_name 
            FROM benchmark
            LEFT OUTER JOIN (fundbenchmarklink AS fundbenchmarklink_1
                             JOIN fund AS fund_1 ON fund_1.id = fundbenchmarklink_1.fundid) ON benchmark.id = fundbenchmarklink_1.benchmarkid
            LEFT OUTER JOIN (fundbenchmarklink AS fundbenchmarklink_2
                             JOIN fund AS fund_2 ON fund_2.id = fundbenchmarklink_2.fundid) ON fundbenchmarklink_2.isactive = 1
            AND benchmark.id = fundbenchmarklink_2.benchmarkid
            AND fund.id = fundbenchmarklink_2.fundid']

上面的 SQL 清楚地表明，在尝试访问链接表中的列之前，链接表并未被连接。

如果我查询数据库，特别是连接链接表：

query = session.query(Benchmark).join(FundBenchmarkLink, Fund, isouter=True)

它有效，但这意味着我现在必须确保每当查询基准表时，我总是必须定义联接以添加两个额外的表。

我是否遗漏了一些东西，这是一个潜在的错误，还是这只是库的工作方式？

用于复制问题的完整工作示例代码：

import logging

logging.basicConfig(level=logging.INFO)
logging.getLogger('sqlalchemy.engine.base').setLevel(logging.INFO)

from sqlalchemy import Column, DateTime, String, Integer, Boolean, ForeignKey, create_engine
from sqlalchemy.orm import relationship, sessionmaker
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()


class FundBenchmarkLink(Base):
    __tablename__ = 'fundbenchmarklink'

    fundid = Column(Integer, ForeignKey('fund.id'), primary_key=True, autoincrement=False)
    benchmarkid = Column(Integer, ForeignKey('benchmark.id'), primary_key=True, autoincrement=False)
    isactive = Column(Boolean, nullable=False, default=True)

    fund = relationship('Fund')
    benchmark = relationship('Benchmark')

    def __repr__(self):
        return "<FundBenchmarkLink(fundid='{}', benchmarkid='{}', isactive='{}')>".format(self.fundid, self.benchmarkid, self.isactive)


class Benchmark(Base):
    __tablename__ = 'benchmark'

    id = Column(Integer, primary_key=True)
    name = Column(String, nullable=False)

    funds = relationship('Fund', secondary='fundbenchmarklink', lazy='joined')

    # activefunds has additional filtering on the secondary table, requiring a primaryjoin statement.
    activefunds = relationship('Fund', secondary='fundbenchmarklink',
                               primaryjoin='and_(FundBenchmarkLink.isactive==True,'
                                           'Benchmark.id==FundBenchmarkLink.benchmarkid,'
                                           'Fund.id==FundBenchmarkLink.fundid)',
                               lazy='joined')

    def __repr__(self):
        return "<Benchmark(id='{}', name='{}')>".format(self.id, self.name)


class Fund(Base):
    __tablename__ = 'fund'

    id = Column(Integer, primary_key=True)
    name = Column(String, nullable=False)

    def __repr__(self):
        return "<Fund(id='{}', name='{}')>".format(self.id, self.name)


if '__main__' == __name__:
    engine = create_engine('sqlite://')
    Base.metadata.create_all(engine)
    maker = sessionmaker(bind=engine)

    session = maker()

    # Create some data
    for bmkname in ['foo', 'bar', 'baz']:
        bmk = Benchmark(name=bmkname)
        session.add(bmk)

    for fname in ['fund1', 'fund2', 'fund3']:
        fnd = Fund(name=fname)
        session.add(fnd)

    session.add(FundBenchmarkLink(fundid=1, benchmarkid=1))
    session.add(FundBenchmarkLink(fundid=2, benchmarkid=1))
    session.add(FundBenchmarkLink(fundid=1, benchmarkid=2))
    session.add(FundBenchmarkLink(fundid=2, benchmarkid=2, isactive=False))

    session.commit()

    # This code snippet works when activefunds doesn't exist, or doesn't use eager loading
    # query = session.query(Benchmark)
    # print(query)

    # for bmk in query:
    #     print(bmk)
    #     for fund in bmk.funds:
    #         print('\t{}'.format(fund))

    # This code snippet works for activefunds with eager loading
    query = session.query(Benchmark).join(FundBenchmarkLink, Fund, isouter=True)
    print(query)

    for bmk in query:
        print(bmk)
        for fund in bmk.activefunds:
            print('\t{}'.format(fund))

我认为你已经混合了主连接 http://docs.sqlalchemy.org/en/latest/orm/relationship_api.html#sqlalchemy.orm.relationship.params.primaryjoin和二次连接 http://docs.sqlalchemy.org/en/latest/orm/relationship_api.html#sqlalchemy.orm.relationship.params.secondaryjoin一点点。您的主要目前似乎包含两者。删除 Fund 谓词，它应该起作用：

activefunds = relationship(
    'Fund',
    secondary='fundbenchmarklink',
    primaryjoin='and_(FundBenchmarkLink.isactive==True,'
                'Benchmark.id==FundBenchmarkLink.benchmarkid)',
    lazy='joined')

您的显式连接似乎修复了查询的原因是它在隐式急切加载连接之前引入了表基金，因此它们可以引用它。这并不是真正的修复，而是隐藏了错误。如果你真的想使用显式Query.join()通过急切加载，通知查询它contains_eager() http://docs.sqlalchemy.org/en/latest/orm/loading_relationships.html#sqlalchemy.orm.contains_eager。请注意您选择包含哪种关系，具体取决于相关查询；无需额外过滤，您可以填写activefunds与不活动也。

最后，考虑使用Query.outerjoin() http://docs.sqlalchemy.org/en/latest/orm/query.html#sqlalchemy.orm.query.Query.outerjoin代替Query.join(..., isouter=True).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化的相关文章

在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 是解释型的还是编译型的，或者两者兼而有之？

据我了解 An 解释的语言是由解释器将高级语言转换为机器代码然后执行的程序实时运行和执行的高级语言它一次处理一点程序 A compiled语言是一种高级语言其代码首先由编译器将高级语言转换为机器代码的程序转换为机器代码然后由执
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
使用 MS Access 链接表连接到 SQL Server 后端时是否可能发生 SQL 注入

我一直在对此进行一些研究但到目前为止还是一片空白情况是这样的我正在开发一个链接到 SQL Server 后端的 MS Access 前端我在某种程度上使用 Access 中的链接表表单访问 SQL DB 这样当用户更新表单中的值
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
在对象数组内的特定 JSON 值上创建索引

假设我的表中有一个 varchar 列其结构如下 Response DataArray Type Address Value 123 Fake St Type Name Value John Doe 我想在 DataArray 数组元素的
SQL Server - 将行连接到逗号分隔的列表中

假设我有一个临时表如下所示 Id Value 1 1 1 2 1 3 2 1 2 2 我希望我的桌子是这样的 Id ValueList 1 1 2 3 2 1 2 所以基本上我需要将我的值分组为逗号分隔的列表我已经尝试过以下操作 SEL
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

让 JSF 从 EL 访问 Map 值而不是 bean 字段？

是否有任何正确的方法来覆盖 JSF 从表达式语言访问 beans 字段的方式这个想法是模仿这种行为以便访问Map
在 Windows 7 中删除超过 10 天的文件夹的批处理文件

我想创建一个批处理文件该文件应使用 Windows 7 删除文件夹中超过 10 天的所有子文件夹任何帮助将不胜感激改编自这是对一个非常相似问题的回答 https stackoverflow com questions 3419091
从整数列表中获取随机数

如果我有一个整数列表 List
计算出的字体大小大于 Asus Nexus 7 上 CSS 中定义的字体大小

我在 Asus Nexus 7 用 jQuery Mobile 编写上运行该网页我在 CSS 中将字体大小设置为 14px 但在调试过程中在 PC 上使用 Chrome 我可以看到它的计算大小是 22px HTML 代码如下所示 di
Kubernetes 和 AWS：设置 LoadBalancer 以使用预定义的安全组

正如标题所示我正在寻找一种方法来强制 LoadBalancer 服务使用 AWS 中预定义的安全组我不想手动编辑 Kubernetes 为 ELB 创建的安全组的入站出站规则我无法在文档中找到任何内容也没有找到任何可以在网上其他地
使用 jinja 的 Ansible set_fact 列表

我正在尝试学习 jinja 和 Ansible 这是在 RHEL 7 9 上 ansible 2 9 27 ansible python module location usr lib python2 7 site packages ans
同步睡眠进入 asyncio 协程

我有一个协程如下 async def download downloader DataManager downloader download DataManager download 方法如下 def download self start
使用 Mojo::IOLoop 将命令输出到套接字而不进行缓冲

如何在Mojo服务器上以实时模式连续输出命令对我来说是长ping 我正在寻找 Mojo IOLoop 的一些示例例如客户端连接到服务器并请求 ping X X X X 服务器返回非缓冲输出而服务器上的 ping 返回每一行输出客户
如何从 TVML 文本字段获取值？

我正在尝试弄清楚如何使用 TVJS 从 TVML 中的文本字段获取值但我还没有找到任何相关文档而且我不想等待文档更新实际上没有任何绑定到输入的模式因为我确信除了登录服务之外这是很少使用的情况我想我可以解析 Xml 但这看起来非常老
警报对话框背景颜色

我正在使用具有自定义布局的 AlertDialog 布局中TextView的颜色为黑色因此在Android 4 0上使用Holo Light打开对话框时文本是可见的但是如果您在 Android 2 2 中打开该对话框由于灰色背景
如何在Unity中正确导入fbx？

我已经建模了一个对象并导出为 fbx 在 Unity 中导入资源后会出现一些伪影这些文物似乎与 Unity 导入有关而不是 fbx 文件因为在 Windo3d 3d viever 中查看的模型似乎没有问题万分感谢 Blender
Spark 中打开的文件太多，中止 Spark 作业

在我的应用程序中我正在读取 40 GB 的文本文件这些文件完全分布在 188 个文件中我拆分此文件并使用 rdd 对在 Spark 中每行创建 xml 文件对于 40 GB 的输入它将创建数百万个小 xml 文件这是我的要求一
IE 9 在悬停时重置背景位置（IE bug？）

我不敢相信我发现了一些在 IE8 和 IE7 中都有效但在 IE9 中失败的东西这是我正在处理的页面网站链接 1 请注意在 IE9 中当悬停链接时浏览器在侧面菜单上如何将背景重置为background position 0 0并且
在 sbt 中添加仅编译时的子项目依赖项

我有一个多项目包含一个私有宏子项目其用途仅限于实现其他子项目的方法体它既不应该出现在其他子项目的运行时类路径上也不应该以任何形式在其他子项目已发布的 POM 中可见这样其他 sbt 项目就可以在不知道宏子项目的情况下使用该项目中的库
Keycloak 缺少表单参数：grant_type

我的本地计算机上有独立运行的 keycloak 我创建了名为 spring test 的新领域然后创建了名为 login app 的新客户端根据其余文档 POST http localhost 8080 auth realms spri
如何对前 5 个有值的单元格求平均值

我有一个类似这样的电子表格我只想对前 5 个包含数据的单元格进行平均我怎样才能做到这一点随着列表获取更多数据如下所示我希望能够定位一个单元格如 A10 并从该单元格返回 5 同样只有当它里面有数据时所以图像的公式应该是这样的
邮政编码 + 国家/地区到地理坐标

获取给定国家地区的给定邮政编码邮政编码的坐标纬度经度的最完整精确和可靠的方法是什么我需要发出大量请求因此高 API 限制率甚至可能不存在会很有用 GeoNames http www geonames org postal
使用 movsd 让编译器复制字符

我想在时间关键的函数中复制相对较短的内存序列小于 1 KB 通常为 2 200 字节 CPU 端的最佳代码似乎是rep movsd 但是我不知何故无法让我的编译器生成此代码我希望我隐约记得看到过使用 memcpy 可以使用编译器内置
使用“严格引用”时不能使用字符串（“1”）作为子例程引用

在对我尝试使用的各种事件做出反应的 Perl 守护进程中空对象模式 http en wikipedia org wiki Null Object pattern在 2 种情况下通过创建匿名子例程它应该只返回值 1 又名 true 请滚动
SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化

我已经使用 SQL Alchemy 几个月了到目前为止它给我留下了深刻的印象我现在遇到了一个问题这似乎是一个错误但我不确定我是否在做正确的事情我们在这里使用 MS SQL 通过表反射来定义表类但是我可以使用内存 SQLite

SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化

SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化 的相关文章

随机推荐

热门标签

SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化的相关文章