pandas to_sql详解

2023-11-01

pandas to_sql api的使用文章已经很多了，但是都只是简单介绍了怎么使用，一些细节问题没有介绍到，这里我们增加说明一些细节问题：
1.列的对应
2.多值插入
3.批量插入

api说明

照常，我们对api参数也做一下详细的介绍，也就是翻译文档：

Parameters
----------
name : str
    Name of SQL table.
con : sqlalchemy.engine.(Engine or Connection) or sqlite3.Connection
    Using SQLAlchemy makes it possible to use any DB supported by that
    library. Legacy support is provided for sqlite3.Connection objects. The user
    is responsible for engine disposal and connection closure for the SQLAlchemy
    connectable See `here \
        <https://docs.sqlalchemy.org/en/13/core/connections.html>`_.

schema : str, optional
    Specify the schema (if database flavor supports this). If None, use
    default schema.
if_exists : {'fail', 'replace', 'append'}, default 'fail'
    How to behave if the table already exists.

    * fail: Raise a ValueError.
    * replace: Drop the table before inserting new values.
    * append: Insert new values to the existing table.

index : bool, default True
    Write DataFrame index as a column. Uses `index_label` as the column
    name in the table.
index_label : str or sequence, default None
    Column label for index column(s). If None is given (default) and
    `index` is True, then the index names are used.
    A sequence should be given if the DataFrame uses MultiIndex.
chunksize : int, optional
    Specify the number of rows in each batch to be written at a time.
    By default, all rows will be written at once.
dtype : dict or scalar, optional
    Specifying the datatype for columns. If a dictionary is used, the
    keys should be the column names and the values should be the
    SQLAlchemy types or strings for the sqlite3 legacy mode. If a
    scalar is provided, it will be applied to all columns.
method : {None, 'multi', callable}, optional
    Controls the SQL insertion clause used:

    * None : Uses standard SQL ``INSERT`` clause (one per row).
    * 'multi': Pass multiple values in a single ``INSERT`` clause.
    * callable with signature ``(pd_table, conn, keys, data_iter)``.

    Details and a sample callable implementation can be found in the
    section :ref:`insert method <io.sql.method>`.

Returns
-------
None or int
    Number of rows affected by to_sql. None is returned if the callable
    passed into ``method`` does not return the number of rows.

翻译：
name:表名
con:数据库连接驱动
schema:指定数据库schema，默认即可
if_exists:如果表存在进行的操作（fail:返回失败，append：追加，replace：替换）
		  这里就有一个细节问题：replace替换是删除表再重新建表插入，之前的表结构会被删除，
		  重建的表只保留df里面的列，以默认数据类型建表，建议不使用replace，
		  虽然它可以自动建表，但是类型不可控，建议还是在数据库层面建表，根据数据情况指定合理的数据类型
index:是否插入index列
index_label:index对应的数据库列，如果index为True，需指定
chunksize：批量插入数据大小，数据量很大时需要设置，不然数据库会发生连接超时失败
dtype:指定每列数据类型，建议不使用，在数据库层面设置
method:不设置的话就是一行一行的组装insert语句，
	   'multi'设置批量插入语句insert values

好了，api翻译完了，接下来说一说细节问题：
1.列的对应
看那么多文档最疑惑的就是列的对应：api是按照dataframe的列名和数据库表的字段名一一对应的，如果是append，追加在相应的列下面，其余列为空

2.多值插入
多值插入时建议设置chunksize，不然容易连接超时，这个和数据库缓存大小有关

3.批量插入
批量插入建议设置method：'multi'

over

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

pandas

python

pandas to_sql详解的相关文章

为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
在linux上安装python ssl模块，无需重新编译

是否可以在已经安装了 OpenSSL 的 Linux 机器上安装 python 的 SSL 模块而无需重新编译 python 我希望它就像复制几个文件并将它们包含在库路径中一样简单 Python版本是2 4 3 谢谢是否可以在已经安装了
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
SQL Server 中的 FIFO 查询

我正在构建一个库存管理应用程序c with SQL server 我想做一个FIFO从我的表查询我以可变价格购买了相同的产品之后我卖掉了其中一些我想根据先进先出进行查询BatchDate柱子所以我想通过PurchasePrice
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
SQL Server 中离线索引重建和在线索引重建有什么区别？

重建索引时有一个选项ONLINE OFF and ONLINE ON 我知道当ONLINE模式打开时它会复制索引切换新查询以利用它然后重建原始索引使用版本控制跟踪两者的更改如果我错了请纠正我但是 SQL 在离线模式下会做什么
使用 Python 绘制 USGS 水文数据甘特图？

我编译了一个数据帧其中包含几个不同流计的 USGS 流数据现在我想创建一个类似的甘特图this https stackoverflow com questions 31820578 how to plot stacked event d
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
查看Jasper报告执行的SQL

运行 Jasper 报表其中 SQL 嵌入到报表文件 jrxml 中时是否可以看到执行的 SQL 理想情况下我还想查看替换每个 P 占位符的值 Cheers Don JasperReports 使用 Jakarta Commons
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
多边形内的 SQL 地理点在 STIntersect 上不返回 true（但使用 Geometry 返回 true）

我不想仅仅为了在 STIntersect 中返回 true 而将地理数据转换为几何图形下面是 SQL 中的代码 DECLARE point GEOGRAPHY GEOGRAPHY Point 1 1 4326 DECLARE polygo

随机推荐

计算机辅助绘图考试题,计算机辅助设计绘图考试题（A）(大学期末复习试题）.doc...

教师试做时间出题教师取题时间审核教研室主任出题单位使用班级考试日期院部主任考试成绩期望值印刷份数规定完成时间交教务科印刷日期学号姓名班级密封线专业年级班学年第学期计算机辅助设计绘图 A 课试卷题号一二三四五
Swagger 的简介和使用

文章目录 Swagger 的简介和使用什么是Swagger 简介 Swagger页面 Swagger快速上手 pom xml文件中引入依赖构建Swagger配置类 Swagger使用常用注解说明注解的使用总结 Swagger 的简
Spark jar包加载顺序及冲突解决

一 spark jar包加载顺序 1 SystemClasspath Spark安装时候提供的依赖包通常是spark home目录下的jars文件夹 SystemClassPath 2 Spark submit jars 提交的依赖包 U
Java-Map集合

基本使用 public class Demomap public static void main String args Map
关于VMware workstation Player的虚拟网络编辑器没有的情况

VMware workstation Player 是没有虚拟网络编辑器的如果要按照韦东山老师的方法去配置NAT网络可以再下载VMware workstation pro 尽管不在试用期依然会给你虚拟网络编辑器的应用安装
光照 (5) 光照贴图

物体在不同的部件上都有不同的材质属性 1 1 漫反射允许我们对物体的漫反射分量以及间接地对环境光分量它们几乎总是一样的和镜面光分量有着更精确的控制漫反射贴图 Diffuse Map 使用一张覆盖物体的图像让我们能够逐片段索引其独
十大排序算法：快速排序算法

一快速排序算法思想或步骤分解数组A p r 被划分为两个子数组A p q 1 和A q 1 r 使得A q 为大小居中的数左侧A p q 1 中的每个元素都小于等于它而右边A q 1 r 每个元素都大于等于它解决通过递归调用快
linux shell oracle脚本_分享一个shell脚本--统计Oracle最消耗资源的SQL语句

概述 This project meant to provide useful scripts for DB maintance and management to make work easier and interesting 今天主要
Unity Shader Graphs无法代码动态赋值的问题解决

起因给一个材质球更换图片动态更换了很久换不上去解决 Reference unity给的是随机的名字只需要改成自己的名字就可以了完美解决不需要下划线只是自己定义的名字 box EndTarget image material S
sqli-labs通关攻略教程六（less26~less28a）

文章目录 less 26 方法1 方法2 补充知识 less 26a less 27 less 27a less 28 less 28a less 26 方法1 由题目可知本题绕过了空格和注释注释符用 1 1或者 00绕过空白符绕过
android intent深入解析

一 Intent的显示调用 1 intent setClass this OtherActivity class 2 intent setClassName this com zizhu activitys OtherActivity 3
Linux chown命令

Linux Unix 是多人多工操作系统所有的文件皆有拥有者利用 chown 将指定文件的拥有者改为指定的用户或组用户可以是用户名或者用户ID 组可以是组名或者组ID 文件是以空格分开的要改变权限的文件列表支持通配符一般来说这个
java解决Exception in thread “main“ java.lang.OutOfMemoryError: GC overhead limit exceeded

这个就是内存占用超过了限制解决方案加载文件的容量太大这个只能切分文件使用BufferedInputStream一行行读取 BufferedInputStream bufferedReader new BufferedInputStr
输入三角形的3个边长，a,b,c求出三角形的面积。（C语言）

代码 define CRT SECURE NO WARNINGS 1 include
requestBody注解转化json报错

RequestBody ResponseBody 注解详解转解决方法不要用modelMap 新建一个hashMap类即可进来给app写接口比较多遇到一个bug requestBody会自动往modelMap里加解决办法清空map
用redis实现支持优先级的消息队列

用redis实现支持优先级的消息队列为什么需要消息队列系统中引入消息队列机制是对系统一个非常大的改善例如一个web系统中用户做了某项操作后需要发送邮件通知到用户邮箱中你可以使用同步方式让用户等待邮件发送完成后反馈给用户但是这样可
出现 HTTP 错误 500.19 错误代码 0x800700b7

这个内容出现主要问题是在IIS上我们一般程序开发 iis中默认的路径只是http localhost 相当于环境变量中已定义好了如果自己创建的项目直接将路径定义到这就会替换图二中的路径然后你的程序图一中所指向的路径就会无效图三是我
Java，Enum里定义属性和方法

最近的项目用到了大神写的统一返回码的代码 ErrorCode java 统一6位异常码 author Administrator public enum ErrorCode global OK 000000 操作成功 ERROR 0000
子类化QListWidget实现自定义拖拽功能.

我们经常会碰到这样的一个问题我们想把其他地方选中的文本直接通过拖拽移动到一个控件中从而实现方便添加项的功能这里我们以QListWidget作为例子来实现这么一个功能其他地方的文本可直接拖拽进QListWidget中且QList
pandas to_sql详解

pandas to sql api的使用文章已经很多了但是都只是简单介绍了怎么使用一些细节问题没有介绍到这里我们增加说明一些细节问题 1 列的对应 2 多值插入 3 批量插入 api说明照常我们对api参数也做一下详细的介绍也就

pandas to_sql详解

api说明

pandas to_sql详解 的相关文章

随机推荐

热门标签

pandas to_sql详解的相关文章