使用 SQLAlchemy 批量更新插入 [重复]

2024-04-20

我正在使用 SQLAlchemy 1.1.0b 将大量数据批量插入到 PostgreSQL 中，并且遇到了重复的键错误。

from sqlalchemy import *
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.automap import automap_base

import pg

engine = create_engine("postgresql+pygresql://" + uname + ":" + passw + "@" + url)

# reflectively load the database.
metadata = MetaData()
metadata.reflect(bind=engine)
session = sessionmaker(autocommit=True, autoflush=True)
session.configure(bind=engine)
session = session()
base = automap_base(metadata=metadata)
base.prepare(engine, reflect=True)

table_name = "arbitrary_table_name" # this will always be arbitrary
mapped_table = getattr(base.classses, table_name)
# col and col2 exist in the table.
chunks = [[{"col":"val"},{"col2":"val2"}],[{"col":"val"},{"col2":"val3"}]]

for chunk in chunks:
    session.bulk_insert_mappings(mapped_table, chunk)
    session.commit()

当我运行它时，我得到这个：

sqlalchemy.exc.IntegrityError: (pg.IntegrityError) ERROR:  duplicate key value violates unique constraint <constraint>

我似乎无法正确实例化mapped_table as a Table()对象，要么。

我正在处理时间序列数据，因此我正在批量抓取数据，并且时间范围内有一些重叠。我想做批量更新插入以确保数据一致性。

对大型数据集进行批量更新插入的最佳方法是什么？我知道PostgreSQL 支持更新插入 https://stackoverflow.com/questions/17267417/how-to-upsert-merge-insert-on-duplicate-update-in-postgresql现在，但我不知道如何在 SQLAlchemy 中执行此操作。

from https://stackoverflow.com/a/26018934/465974 https://stackoverflow.com/a/26018934/465974

找到这个命令后，我能够执行 upserts，但它是值得一提的是，对于批量“更新插入”来说，此操作速度很慢。

另一种方法是获取您想要的主键列表 upsert，并在数据库中查询任何匹配的 id：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

postgresql

sqlalchemy

upsert

使用 SQLAlchemy 批量更新插入 [重复] 的相关文章

是否可以将名为“None”的值添加到枚举类型？

我可以将名为 None 的值添加到枚举中吗例如 from enum import Enum class Color Enum None 0 represent no color at all red 1 green 2 blue 3 co
在 django 中构建动态表单

我正在尝试根据存储在数据库中的字段及其定义动态构建一个表单在我的数据库中我定义了 1 个带有一些标签的复选框和 1 个带有一些标签的文本字段如何根据数据库中的数据在我的视图中动态构建表单 Thanks 以下是我在 EuroDjango
如何/在哪里发布 Python 包

如果一个人创建了一个有用的 Python 包那么如何在哪里发布宣传它以供其他人使用我已经把它放到了 github 上但几周后谷歌也没有找到它包装整洁完整我制作它供我个人使用不与其他人分享将是一种耻辱这是 PyPI 指南 h
如何在cvxpy中编写多个约束？

我想在 cvxpy 下的优化问题中添加许多约束在 matlab 中我可以通过添加一行 subject to 然后使用 for 循环来生成约束我怎样才能在 cvxpy 中做同样的工作因为 cvxpy 中没有服从概念有什么建议吗
可视化时间序列时标记特定日期

我有一个包含几年数据的时间序列例如 ts pd Series np random randn 1000 index pd date range 1 1 2000 periods 1000 ts ts cumsum ts plot 我还有两
Flask-httpauth： get_password 装饰器如何为 basic-auth 工作？

我想知道有没有人用过这个烧瓶延伸 https github com miguelgrinberg flask httpauth简化 http basic auth 基本上我不明白这个example https github com migu
从文件中读取单词并放入列表中

本质上我有一个巨大的文件所有文件包含每行多个单词每个单词用空格分隔有点像这样 WORD WORD WORD WORD ANOTHER WORD SCRABBLE BLAH YES NO 我想要做的是将文件中的所有单词放入一个巨大的列
在Python中随机化列表[重复]

这个问题在这里已经有答案了我想知道是否有一个好方法来震动 Python 中的项目列表例如 1 2 3 4 5 可能会被动摇随机化 3 1 4 2 5 任何顺序都同样可能 from random import shuffle list
Python 中 Goto 标签的替代方案？

我知道我不能使用 Goto 我也知道 Goto 不是答案我读过类似的问题但我只是想不出解决我的问题的方法所以我正在编写一个程序你必须在其中猜测一个数字这是我遇到问题的部分的摘录 x random randint 0 100 I
Emacs：调试Python的方法

我把这个贴在程序员 stackexchange com https softwareengineering stackexchange com questions 29844 emacs methods for debugging pyth
在 Python 中将 int 转换为 ASCII 并返回

我正在为我的网站制作一个 URL 缩短器我当前的计划我愿意接受建议是使用节点 ID 来生成缩短的 URL 因此理论上节点 26 可能是short com z 节点 1 可能是short com a 节点 52 可能是short c
captureWarnings 设置为 True 不会捕获警告

我想记录所有警告我以为这样的设定captureWarnings to True应该可以解决问题但事实并非如此代码 import logging import warnings from logging handlers import
如何从 Selenium 获取元素的属性

我正在 Python 中使用 Selenium 我想得到 val of a
如何点击 Google Trends 中的“加载更多”按钮并通过 Selenium 和 Python 打印所有标题

这次我想单击一个按钮来加载更多实时搜索这是网站的链接该按钮位于页面末尾代码如下 div class feed load more button Load more div 由于涉及到一些 AngularJS 我不知道该怎么做有什么提
计算素数并附加到列表

我最近开始尝试使用 python 解决 Euler 项目的问题并且在尝试计算素数并将其附加到列表中时遇到了这个障碍我编写了以下代码但我很困惑为什么它在运行时不输出任何内容 import math primes def isPrime
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
使用 PuLP 进行线性优化，变量附加条件

我必须用 Pull 解决 Python 中的整数线性优化问题我解决了基本问题现在我必须添加额外的约束有人可以帮助我用逻辑指示器添加条件吗逻辑限制是如果 A gt 20 则 B gt 5 这是我的代码 from pulp impor
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
mypy 错误：赋值中的类型不兼容（表达式的类型为“Dict[, ]”，目标的类型为“List[str]”）

我尝试过了实例化一个空字典在现有字典的第二层上然后为其分配一个键值对但 MyPy 会抛出错误这是一个最小的示例当激活 MyPy 检查时它将重现它 result Test something result key result key
应用程序的外观 - Py2exe / wxPython

所以我的问题是我的应用程序的外观和感觉因为它看起来像一个旧的外观应用程序它是一个 wxPython 应用程序在 python 上它运行良好并且看起来不错但是当我使用 py2exe 将其转换为 exe 时外观很糟糕现在我知道如果你

随机推荐

MVC 4如何正确地将数据从控制器传递到视图

我目前有一个带有 LINQ 语句的控制器我将数据从该语句传递到我的视图我正在尝试寻找一种更有效更好的编码方法来做到这一点我的家庭控制器声明如下 Var Melt Furnace1 from item in db tbl dppITH
pandas 中的块总数

在下面的脚本中有没有办法找出总共有多少个块 import pandas as pd import numpy as np data pd read csv data txt delimiter chunksize 50000 for c
使用回归模型（LM、LMER）重复测量方差分析

我想使用回归模型而不是方差分析在 R 中运行重复测量方差分析 AOV 功能以下是我的 3 个受试者内因素的 AOV 代码示例 m aov lt aov measure task region actiontype Error subj
编辑数百条 Git 提交消息的最快方法是什么？

我有一个相当大的 Git 存储库有 1000 次提交最初是从 SVN 导入的在公开我的存储库之前我想清理数百条在我的新存储库中没有意义的提交消息并删除所有添加的 git svn 信息文本我知道我可以使用 git rebase i
正则表达式替换：使用自定义函数转换模式

假设我有一些文本例如 MyAppTerms TermName1 MyAppTerms TermName2 1 MyAppTerms TermNameX 2 我想替换每一个出现的 MyAppTerms Whatever 结果是ReadTer
正则表达式仅匹配货币数字

我正在尝试让 VB 正则表达式仅匹配货币序列中的数字如果可能的话无需额外的替换行它需要查找开头带有结尾的数字并返回中间的内容减去所有逗号因此 10 000 match returns 10000 20 000 match r
使用汇编器 8086 显示表的总和

我正在编写一些代码允许我对表进行求和然后使用汇编语言显示其结果这是我到目前为止所想到的 data segment tab db 9 dup 3 5 8 4 7 1 6 7 0 resultat db data ends code se
警告：跨平台 Xamarin Blank 应用程序（Xamarin.Form 便携式）

Warning IDE0006 Error encountered while loading the project Some project features such as full solution analysis for the
Rcpp：动态更新列表

我正在寻找动态更新列表的解决方案 include
按钮事件在 Firefox 操作系统中不起作用

function listContents storagename alert inside function Clear up the list first results html var files navigator getDevi
仅当 gradle 中另一个任务不是最新时才运行任务

我想在 Gradle 中进行功能测试时自动添加 serverRun 任务因此我添加了一个依赖项 funcTestTask dependsOn serverRun 无论 funcTestTask 是否运行任务都会运行 compile se
如何使用敏感数据运行 cron 作业？

I read 在哪里可以设置 crontab 将使用的环境变量 https stackoverflow com questions 2229825 where can i set environment variables that cro
如何正确使用CGPathApply

我尝试使用 CGPathApply 迭代 CGPathRef 对象中的每个 CGPathElement 主要是编写一种自定义方法来保存 CGPath 数据问题是每次调用 CGPathApply 时我的程序都会崩溃根本没有任何信息我
WebLogic Server 10.3.6 中的 JPA 2.0

我需要使用 JPA 2 0 带有 EclipseLink 实现问题是我还需要在实现 Java EE 5 规范的 WebLogic 10 3 6 服务器中部署此应用程序因此不需要支持 JPA 2 我知道有可用于在此版本中添加对 JPA 2
参数列表中的 void_t 可以工作，但不能作为返回类型

cppreference 上有一个关于使用别名的示例这个例子失败是因为int没有会员foo template
使用 Apache2 的 NodeJS 应用程序有时会返回 503 服务器不可用

风景我有一个乌班图18 04DigitalOcean 中的服务器具有以下规格 1 vCPUs 1GB and 25GB磁盘在这个服务器我们称之为 API SERVER 中我使用 PHP 和 NodeJS 在由 apache 管理的代
何时处置？

我对所有有关 IDispose 和使用语句的讨论感到困惑我想知道是否有人可以告诉我在下面的测试示例中是否需要使用 using 语句或 IDispose 的某种实现 public class Main MyFile myFile new
resharper 单元测试继承

有人有 Resharper 单元测试层次结构的策略吗我通常使用 TestDriven Net 和 Resharper 的测试运行器以及 NUnit 测试 TestDriven 对所有事情都很棒但很快就会从批量运行可能是数千个中找到一
WordPress 博客文章未显示 Facebook 预览图像

我有一篇博客文章here http gingerslist com blog 62 smiles and understanding 2 当我在 Facebook 上分享此内容时预览图像不显示我尝试过重新抓取Facebook 开发者工具
使用 SQLAlchemy 批量更新插入 [重复]

这个问题在这里已经有答案了我正在使用 SQLAlchemy 1 1 0b 将大量数据批量插入到 PostgreSQL 中并且遇到了重复的键错误 from sqlalchemy import from sqlalchemy orm imp

使用 SQLAlchemy 批量更新插入 [重复]

使用 SQLAlchemy 批量更新插入 [重复] 的相关文章

随机推荐

热门标签