关于pandas中to_sql性能太慢的优化

2023-11-02

pd.to_sql(table_name, db)这种方法虽然很简单，但是性能特别慢；插入6万条数据，需要将近5分钟

engine = sqla.create_engine('postgresql+psycopg2://user:pwd@IPCLOUDMAP')
df = pd.read_excel(filename, skiprows=0)
df.to_sql('yun_ying_jian_ce_2', engine, index=False, if_exists='append')

优化方法,利用StringIO，和copy_from ，此方法可在1.68s内将数据插入表中

from io import StringIO # 此处有的会使用 from cStringIO import StringIO 

engine = sqla.create_engine('postgresql+psycopg2://user:pwd@IPCLOUDMAP')
df = pd.read_excel(filename, skiprows=0)
df.to_sql('yun_ying_jian_ce_2', engine, index=False, if_exists='append')

 output = StringIO()
 df.to_csv(output, sep='\t', index=False, header=False)
 output.getvalue()
 output.seek(0)
 connection = engine.raw_connection()
 cursor = connection.cursor()
 cursor.copy_from(output, 'yun_ying_jian_ce_2', null='')
 connection.commit()
 cursor.close()

注意sqlServer就别想使用这种方法了，因为pyodbc没有copy_from , copy_from是pg的特性，有哪位大佬解决了sqlServer 使用copy_from,恭候留言

engine = sqla.create_engine('mssql+pyodbc://sa:pwd#@IP:1433/CLOUDMAP?driver=SQL+Server')

AttributeError: 'pyodbc.Cursor' object has no attribute 'copy_from'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

postgresql

pandas

sql

sqlserver

python

关于pandas中to_sql性能太慢的优化的相关文章

如何将此本机 SQL 查询转换为 HQL

所以我有这个很长的复杂的 Native SQLQuery string hql SELECT FROM SELECT a rownum r FROM select f2 filmid f2 realisateurid f2 titre f2
使用 Rails 中的 postgres json 字段更新嵌套键

我一直在尝试更新以下内容 boxes book 2 moving 2 goods to boxes book new 2 moving 2 goods 无需使用正则表达式或在 ruby 中执行此操作但似乎有点棘手我想添加新密钥然后删除
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
如何限制两个表之间一对多关系中的多个数量？

我有一个带有两个 MySql 表的 MySQL 数据库第一个是第一个表表 A 有一列具有唯一值从值从 1 到 n 在第二个表 2 表 B 中我有两列在第一个表中我有一个名称在第二个我的值从 1 到 n 如果我在中添加一个值
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
ActiveRecord 查询，按关联排序，最后一个 has_many

我试图列出所有Users by the created at最近创建的关联记录通讯列到目前为止我所拥有的 User includes communications order communications created at IS
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
SQL Server查询麻烦，多对多关系

不知道如何用一行字来表达这个问题对标题表示歉意我的数据库中有3个表例如 Shop Item 商店库存 Shop 和 Item 具有多对多关系因此 ShopStock 表将它们链接起来 ShopStock 中的字段是 ID ShopI
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何在单元测试中使用 JSON 发送请求

我的 Flask 应用程序中有在请求中使用 JSON 的代码我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好但是我正在尝试使用 Python 的 unittest 模块创建单元测试但
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
将 CSV 复制到 Amazon RDS 托管的 Postgresql 数据库

我有一个使用 Amazon 的 RDS 服务托管的数据库我正在尝试编写一个 Web 服务来更新所述数据库我遇到的问题是它不允许我使用 COPY 命令因为我收到此错误错误必须是超级用户才能复制到文件或从文件复制我正在使用我为数据库
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

TypeError: Cannot read properties of undefined (reading ‘licenseNum‘) at Proxy

这是因为在定义的时候我们只定义了一层的结构比如 info 其实后端返回的是 info goods goodsName cheng 此时调用goodsName info goods goodsName 就会报错info goods und
2021-12-24 vue项目兼容IE

Vue 不支持 IE8 及以下版本因为 Vue 使用了 IE8 无法模拟的 ECMAScript 5 特性但对于 IE9 Vue 底层是支持 vue cli4脚手架搭建的前端项目 vue版本2 6 12 browserslist配置指
System.Single

浮点类型别名 float System Single double System Double decimal System Decimal 字符类型别名允许的值 bool System Boolean true flase ch
跟阿铭学Linux第六章答案，Linux磁盘管理

hda一般是指IDE接口的硬盘 hda指第一块硬盘 hdb指第二块硬盘等等 sda一般是指SATA接口的硬盘 sda指第一块硬盘 sdb指第二块硬盘等等 du b显示的是文件的实际大小 du k显示的是文件占用的磁盘块的大小所以磁盘块
性能测试压力测试

性能测试指标并发用户数 TPS Transaction Per Second 每秒事务数系统的性能由TPS决定 mysql 记一次接口压力测试与性能调优 Apache JMeter是Apache组织开发的基于Java的压力测试工具用于
最长公共子序列蓝桥杯 1189

题目描述给定一个长度为n数组A和一个长度为m数组B 请你求出它们的最长公共子序列长度为多少输入描述输入第一行包含两个整数n m 第二行包含n个整数ai 第三行包含m个整数bi 1 lt n m lt 10 3 1 lt ai bi l
BearPi-HM Nano HarmonyOS 环境搭建

BearPi HM Nano HarmonyOS 环境搭建 BearPi HM Nano 介绍 BearPi HM Nano开发板是一块专门为鸿蒙OS设计的鸿蒙OS开发板板载高度集成的2 4GHz WLAN SoC芯片Hi3861 并板载
java mongodb 关闭连接_未释放资源的教训，开发MongoDB连接一定要关闭连接

废不少工夫将数据存储全部迁移至mongodb 未作大量改动则是主因但遇到奇怪的现象程序跑起不久后 mongodb即假死另起客户端想登陆mongodb都不成要重启mongodb服务器才好转分析原因是mongodb的连接池满掉且不释
elasticsearch学习之cross_fields字段使用

cross fields字段在查询阶段解决信号冲突问题问题 The cross fields type is particularly useful with structured documents where multiple fi
Java进阶--Java垃圾回收机制全面解析

本文同步发布在我的个人博客如需转载请注明出处提起Java的垃圾回收机制大家应该都有所了解它不仅是面试的常客也是Java体系中相当重要的一块知识深入理解Java的GC机制不仅有助于我们在开发中提高程序的性能更有了在面试官面前炫
MySQL索引怎么用？究竟能有多快？看完这篇你就懂了！

本文介绍的是MySQL索引的具体使用原理以及本质结构请看我写的上一篇文章 MySQL索引凭什么能让查询效率提高这么多原理是什么目录索引使用的优势索引使用的劣势 1 维护成本高 2 所占空间大索引的分类索引的创建规则索引的CR
约瑟夫环（数组解决）

约瑟夫环问题是一个很经典的问题一个圈共有N个人 N为不确定的数字第一个人的编号为0或者1 两个都可以看你的程序如何编写假设这边我将第一个人的编号设置为1号那么第二个人的编号就为2号第三个人的编号就为3号第N个人的编号就为N号
photoshop不能保存bmp格式

文章目录前言一显示图层无法导出当前的bmp格式图片二图层合并总结前言使用位图进行深度学习的特征点标定时间比正常图片格式的时间要缩短一半所以使用ps新增异常点但是新增图层后无法保存bmp的格式一显示图层无法导出当前的b
详解Spring Ioc（控制反转）

Spring Ioc 控制反转是一个比较抽象的概念可以举例来说明生活中人们要用到一种东西人们的基本想法就是找到东西比如想喝果汁在没有饮品店的日子里最直接的做法就是买果汁机水果准备开水这时我们主动创造的过程也就是一
Python自动化测试——基础理论思维导图

1 自动化测试的定义 2 自动化测试的优势 3 自动化测试和手工测试相比有哪些区别 4 主流的测试用具 5 自动化测试的流程 6 适用于自动化测试的条件 7 选择自动化测试技术时以语言为主的技术线主要用到的自动化测试工具是Seleniu
兔子快跑/rabbit-UI和接口自动化测试平台

Rabbit 是一个开源的自动化测试平台基于经典技术组合 Spring Boot Spring Security MyBatis Jwt Vue 目前版本已支持UI自动化和接口自动化平台采用关键字驱动测试人员无需任何代码基础即可轻松
ubuntu18.04解决因没有集成显卡驱动进不去界面问题

1 问题及设备描述设备工控机 ubuntu18 04 i9cpu 集成显卡问题更化软件源时不小心将微软Microsoft等的源给删除了没有备份查资料发现集显就在主板上与cpu有很大关系于是觉得问题在于将集成显卡驱动软件的源给
【计算机网络】——I/O复用之poll

文章目录 1 poll的概述 2 poll函数的功能和作用 3 poll的特点 4 代码实现I O复用poll 1 poll的概述在上一篇文章中我们详细的介绍了I O复用技术中的select使用这篇文章我们来主要介绍一下poll po
node初识

一什么是node node官网 https nodejs cn Node js是一个开源的跨平台的JavaScript运行环境它基于Chrome V8 JavaScript引擎使得JavaScript可以在服务器端运行 Node j
关于pandas中to_sql性能太慢的优化

pd to sql table name db 这种方法虽然很简单但是性能特别慢插入6万条数据需要将近5分钟 engine sqla create engine postgresql psycopg2 user pwd IPCLOUD

关于pandas中to_sql性能太慢的优化

关于pandas中to_sql性能太慢的优化 的相关文章

随机推荐

热门标签

关于pandas中to_sql性能太慢的优化的相关文章