重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误

2023-11-21

继从this问题，当我尝试从具有多个分区的 dask.dataframe 创建 postgresql 表时，出现以下错误：

IntegrityError: (psycopg2.IntegrityError) duplicate key value violates unique constraint "pg_type_typname_nsp_index"
DETAIL:  Key (typname, typnamespace)=(test1, 2200) already exists.
 [SQL: '\nCREATE TABLE test1 (\n\t"A" BIGINT, \n\t"B" BIGINT, \n\t"C" BIGINT, \n\t"D" BIGINT, \n\t"E" BIGINT, \n\t"F" BIGINT, \n\t"G" BIGINT, \n\t"H" BIGINT, \n\t"I" BIGINT, \n\t"J" BIGINT, \n\tidx BIGINT\n)\n\n']

您可以使用以下代码重新创建错误：

import numpy as np
import dask.dataframe as dd
import dask
import pandas as pd
import sqlalchemy_utils as sqla_utils
import sqlalchemy as sqla
DATABASE_CONFIG = {
    'driver': '',
    'host': '',
    'user': '',
    'password': '',
    'port': 5432,
}
DBNAME = 'dask'
url = '{driver}://{user}:{password}@{host}:{port}/'.format(
        **DATABASE_CONFIG)
db_url = url.rstrip('/') + '/' + DBNAME
# create db if non-existent
if not sqla_utils.database_exists(db_url):
    print('Creating database \'{}\''.format(DBNAME))
    sqla_utils.create_database(db_url)
conn = sqla.create_engine(db_url)
# create pandas df with random numbers
df = pd.DataFrame(np.random.randint(0,40,size=(100, 10)), columns=list('ABCDEFGHIJ'))
# add index so that it can be used as primary key later on
df['idx'] = df.index
# create dask df
ddf = dd.from_pandas(df, npartitions=4)
# Write to psql
dto_sql = dask.delayed(pd.DataFrame.to_sql)
out = [dto_sql(d, 'test', db_url, if_exists='append', index=False, index_label='idx')
       for d in ddf.to_delayed()]
dask.compute(*out)

如果 npartitions 设置为 1，代码不会产生错误。所以我猜测这与 postgres 无法处理写入同一个 sql 表的并行请求有关...？我怎样才能解决这个问题？

我正在读书this。当您使用并行处理创建/更新同一个表时，似乎会出现此错误。我明白这取决于this（如谷歌小组讨论中所解释的）。

所以我认为这取决于PostgreSQL它本身而不是来自连接驱动程序或用于多处理的模块。

好吧，实际上，我发现解决这个问题的唯一方法是创建足够大的块，以使写入过程比计算本身慢。对于更大的块，这个错误不会增加。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

postgresql

pandas

Dask

pandastosql

重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误的相关文章

如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
如何移动我的图像？ python 3.10.4 pygame

我会移动我的图像图像是matiskinfinal png 我尝试将像素添加到 x 或其他我不知道它是什么的东西因为我真的是 python 的初学者 pygame但是是 x x 变化但图像没有移动 import os import py
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
在 vim 折叠线中语法高亮 Python

我发现代码折叠 http en wikipedia org wiki Code folding帮助我更好地组织我的文件因此在我的底部 vimrc 我启用vim代码折叠 http vimdoc sourceforge net htmldo
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
Postgresql 创建扩展失败

我正在使用扩展到目前为止没有任何问题现在我创建一个新的当我打电话时创建扩展实用程序我进入 PG 9 2 创建扩展实用程序 FEHLER Syntaxfehler bei ZEILE 1 创建扩展实用程序在 PG 9 1 中创建
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

mongodb 中的 SQL 视图

我目前正在评估我已经启动的项目的 mongodb 但我找不到任何关于 mongodb 中 SQL 视图的等效信息我需要的是 SQL 视图提供的功能将来自不同表集合的数据集中到一个集合中我只想将一些文档聚集在一起并将它们标记为单个文
从 Spark 集群上的 S3 读取 Spark 作业会出现 IllegalAccessError: attempts to access method MutableCounterLong [重复]

这个问题在这里已经有答案了我在 DC OS 上有一个 Spark 集群并且正在运行一个从 S3 读取数据的 Spark 作业版本如下火花2 3 1 Hadoop 2 7 AWS 连接的依赖项 org apache hadoop ha
Android 图像未显示在 imageview 中

我的 xml 文件有问题我想显示图片但图片未显示奇怪的是我在应用程序的其他部分使用同一张图片并且一切正常我正在使用的照片也在 android studio 中显示但不在我的手机上你可以在下面找到我的 xml
如何显示 Facebook Comments 社交插件的最新评论？

好吧我只是有一个非常直接的问题如何在我的网站上显示 Facebook 评论社交插件的最新评论我已经在我的 WordPress 博客上集成了 facebook 评论社交插件我只想在侧边栏上放置一个小部件来显示社交插件的最新评论 Tha
Linux 中是否可以从内核空间调用用户空间回调函数（ioctl）？

是否可以扩展Linux中的ioctl接口以便用户空间应用程序可以将指向函数的指针发送到内核空间驱动程序我特别考虑以用户可控的方式处理流但在内核中进行的方法这些操作可以附加到内核模块但这将使开发变得更加容易因为我不需要在开发过程中弄
如何隐藏 HTML 表格中的列？

我已经在 ASPX 中创建了一个表我想根据要求隐藏其中一列但没有像这样的属性visible在 HTML 表格构建中我该如何解决我的问题为此您需要使用样式表 td style display none td
由于 x509 证书依赖于旧版 Common Name 字段，无法使用 Golang 连接到服务器

我正在尝试连接 mongodb 服务器要连接我必须提供 CA 证书文件和 tls 证书文件当我使用以下命令时没有问题 mongo host customhost port DB authenticationDatabase DB u
使用 virtualenv 恢复 `--no-site-packages` 选项

我使用以下命令创建了一个 virtualenv no site packages选项并安装了很多库现在我想恢复 no site packages选项并使用全局包我可以在不重新创建 virtualenv 的情况下做到这一点吗更确切地说
C语言中如何实现函数重载？

C语言中有没有办法实现函数重载我正在寻找要重载的简单函数例如 foo int a foo char b foo float c int d 我认为没有直接的方法我正在寻找解决方法如果存在 Yes 自从提出这个问题以来标准 C 无扩
构建输入文本区域以允许 HTML 但防止安全/脚本攻击

平台 ASP NET 4 0 MVC 4 C jQuery 这就是我想做的我正在为我的产品建立一个简单的论坛我想为用户提供一个文本区域来输入他们的帖子或评论我想允许基本文本格式 HTML 和链接例如 p a b i 不需要任何其他
使用 cvSetCaptureProperty 中的 CV_CAP_PROP_POS_FRAMES 获取单个帧

我试图通过设置跳转到特定的帧CV CAP PROP POS FRAMES属性然后像这样读取框架 cvSetCaptureProperty input video CV CAP PROP POS FRAMES current frame f
我可以删除 gradle 构建中的“jar”任务吗？

当我使用下面的代码时 gradle build后会生成一个jar文件 apply plugin java 是否有什么设置不会生成jar文件我可以编写自定义插件但下面的代码是错误的 dependencies compile project
Maven 无法解析依赖项 - javax.activation

我有一个工作 Maven Web 应用程序它使用许多 jars 尝试添加 javax activation 并执行 mvn clean install 失败我得到无法在项目 xxx 上执行目标无法解析中央项目 javax activ
React Hooks - useReducer：在触发函数之前等待减速器完成

我有使用的组件useReducer Hooks const init statA true statB true const reducer state action gt switch action type case ActionA r
CKError 本地化描述

Aim 我想显示CKError用户在应用程序中遇到的情况作为警报所以我想从错误中提取可以显示给用户的字符串 Note 这个问题与要显示的 UI 代码无关只是想从错误中提取有意义的字符串我尝试使用 localizedDescriptio
计算圆弧和直线之间的交点

我想计算圆弧和直线之间的交点我有直线和弧线的所有数据对于线起点和终点对于圆弧起点终点起点终点角度半径和中心点我在这里附上一张图片在下图中我绘制了一条弧线和与该弧线相交的直线所以现在我想找到交点请给我一些算法或想法
实用程序类..好还是坏？

我一直在读到通过在代码中使用静态类单例来创建依赖项是一种不好的形式并且会产生问题紧密耦合和单元测试我遇到的情况是我有一组没有与之关联的状态的 url 解析方法并且仅使用该方法的输入参数执行操作我相信你对这种方法很熟悉在过去
在 JavaScript 或 TypeScript 中重命名时，阻止 VS Code 在解构赋值中添加“as”或别名

当我在 JavaScript 或 TypeScript 中重命名变量时 VS Code 有时会在解构赋值中添加别名 const renamedProp prop arg After rename 或者它添加了as在进口中 import Fo
Git - 放弃仅大小写更改

因此我将 git 在 Windows 上使用 Git Extensions 2 与大型 VB6 代码库结合使用对于不熟悉 VB6 的人来说它不区分大小写并且每次保存文件时都会更改变量名称的大小写可以采取一些步骤来尽量减少这种行为
重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误

继从this问题当我尝试从具有多个分区的 dask dataframe 创建 postgresql 表时出现以下错误 IntegrityError psycopg2 IntegrityError duplicate key value

重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误

重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误 的相关文章

随机推荐

热门标签

重复的键值违反了唯一约束 - 尝试从 dask 数据帧创建 sql 表时出现 postgres 错误的相关文章