如何使用Python向Oracle数据库插入100万行？

2023-12-20

我有大约 100,000 到 1,000,000 行要插入到 Oracle18c 数据库中。我对 Oracle 和这种数量级的数据还很陌生。我认为必须有一些最佳的方法来做到这一点，但现在我只能实现逐行插入：

def insertLines(connection, table_name, column_names, rows):
    cursor = connection.cursor()
    if table_exists(connection, table_name):
        for row in rows:
            sql = 'INSERT INTO {} ({}) VALUES ({})'.format(table_name, column_names, row)
            cursor.execute(sql)
    cursor.close()

Oracle 中是否有一些明确的方法可以使用 cx_Oracle（python Oracle 库）批量处理行以达到更高的效率？

编辑：我从 CSV 文件中读取数据。

如果你的数据已经在Python中，那么使用executemany() http://cx-oracle.readthedocs.io/en/latest/cursor.html#Cursor.executemany。在您有如此多行的情况下，您可能仍然会执行多个调用来插入批量记录。

更新：请参阅 cx_Oracle 文档批量语句执行和批量加载 https://cx-oracle.readthedocs.io/en/latest/user_guide/batch_statement.html.

更新 2：cx_Oracle 的最新版本（已更名为python-oracledb https://cjones-oracle.medium.com/open-source-python-thin-driver-for-oracle-database-e82aac7ecf5a）默认情况下以“精简”模式运行，绕过 Oracle 客户端库。这意味着在许多情况下数据加载速度更快。的用途和功能executemany()新版本中还是一样。安装类似的东西python -m pip install oracledb。这是当前的文档执行批量语句和批量加载 https://python-oracledb.readthedocs.io/en/latest/user_guide/batch_statement.html。另请参阅升级文档 https://python-oracledb.readthedocs.io/en/latest/user_guide/appendix_c.html#upgrading-from-cx-oracle-8-3-to-python-oracledb.

以下是使用 python-oracledb 命名空间的示例。如果您仍然使用 cx_Oracle，则更改import to be import cx_Oracle as oracledb:

import oracledb
import csv

...
Connect and open a cursor here...
...

# Predefine the memory areas to match the table definition.
# This can improve performance by avoiding memory reallocations.
# Here, one parameter is passed for each of the columns.
# "None" is used for the ID column, since the size of NUMBER isn't
# variable.  The "25" matches the maximum expected data size for the
# NAME column
cursor.setinputsizes(None, 25)

# Adjust the number of rows to be inserted in each iteration
# to meet your memory and performance requirements
batch_size = 10000

with open('testsp.csv', 'r') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    sql = "insert into test (id,name) values (:1, :2)"
    data = []
    for line in csv_reader:
        data.append((line[0], line[1]))
        if len(data) % batch_size == 0:
            cursor.executemany(sql, data)
            data = []
    if data:
        cursor.executemany(sql, data)
    con.commit()

正如其他人指出的：

避免在语句中使用字符串插值，因为它存在安全风险。这通常也是一个可扩展性问题。使用绑定变量。当您需要对列名称等内容使用字符串插值时，请确保对所有值进行清理。
如果数据已经在磁盘上，那么使用 SQL*Loader 或 Data Pump 之类的东西会比将其读入 cx_Oracle 然后将其发送到数据库更好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用Python向Oracle数据库插入100万行？的相关文章

使用 scipy.signal.spectrogram 在 pyqtgraph 中绘制 wavfile 的频谱

我有一个用于音乐和语音分析的 PyQt 加 pyqtgraph 程序我想绘制 wav 文件的频谱使用 scipy python 包计算我可以在 matplotlib 中完成但由于 matplotlib 的性能我需要切换到 pyqt
对 numpy 数组的每 n 个元素求平均值

我有一个 numpy 数组我想创建一个新数组它是每个连续三元组元素的平均值因此新数组的大小将是原始数组的三分之一举个例子 np array 1 2 3 1 2 3 1 2 3 应该返回数组 np array 2 2 2 谁能建议一
使用sqlbulkcopy之前如何创建表

我有一个 DBF 文件我正在尝试导入该文件然后将其写入 SQL 表我遇到的问题是如果我使用 SqlBulkCopy 它需要我提前创建表但在我的场景中这是不可能的因为 dbf 文件不断变化到目前为止这是我的代码 public
我应该使用 Pylons 还是 Pyramid？

我本来打算从 Django 迁移到 Pylons 但后来我遇到了 Pyramid 塔架和金字塔有什么区别我读了一些文字塔书 http pylonsbook com 目前涵盖 Pylons 0 9 7 并且想知道它是否是 Pylons 和
如何将魔杖图像对象转换为 numpy 数组（不使用 OpenCV）？

我正在使用将 pdf 文件转换为图像Wand http docs wand py org en 0 4 4 然后我使用 ndimage 进行进一步的图像处理我想直接将 Wand 图像转换为 ndarray 我已经看到答案here htt
将 Python 字典中的键替换为唯一值

a 0 PtpMotion 1 PtpMotion 2 LinMotion 3 LinMotion 4 LinMotion 5 LinMotion 6 LinMotion 7 LinMotion 8 LinMotion 9 PtpMotio
代码终止后保持 matplotlib / pyplot 窗口打开

我希望 python 绘制一个图在不阻塞控制流的情况下显示它并在代码退出后使图保持打开状态这可能吗这个以及相关的主题存在于许多其他线程中见下文但我无法让情节保持开放且非阻塞例如如果我使用pyplot ion before p
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
Python 中 Matlab 'fscanf' 的等价物是什么？

Matlab函数fscanf 似乎很强大 python 或numpy 中是否有相同的等效项具体来说我想从文件中读取矩阵但我不想迭代每一行来读取矩阵类似的东西来自 matlab 用于读取 2D 1000x1000 矩阵 matrix
初始化整数变量以进行比较

我正在学习麻省理工学院的开放课件课程计算机科学和 Python 编程简介 https ocw mit edu courses electrical engineering and computer science 6 0001 introd
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
使用 Django 添加额外 \\ 字符的 JSON 编码

我正在尝试创建一个函数将包含消息和 Django 模型实例的字典转换为 JSON 然后我可以将其传回客户端例如我在 models py 中定义了模型 Test from django db import models class Te
在未运行 python 中的函数的情况下检查了非本地语句[重复]

这个问题在这里已经有答案了以前我认为当我们定义一个函数时该函数可能是错误的但python在执行之前不会检查它 x 100 def f x 1 0 return x print x gt gt gt 100 然而当我学习的时候nonl
Django Rest框架Json解析

我想解析传入的POSTdjangoviews py 文件中的数据发布数据 number 17386372 data banana apple grapes 这是我尝试读取上述传入数据的方法request views py class Fr
如何重写一个列表列表，使值的“孤岛”彼此唯一？

假设我有一个列表列表或更概念上准确的二维数组 list 1 1 0 0 0 1 1 2 0 0 0 2 2 2 0 0 0 0 2 0 0 0 0 1 0 我想识别具有相同值的不同区域并重写列表以便每个区域都有唯一的值如下所示 lis
Django 自定义文件存储系统

我有一个自定义存储 import os from django core files storage import Storage class AlwaysOverwriteFileSystemStorage Storage def get
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
与仅调用依赖函数/类相比，在 FastAPI 中使用 Depends 有哪些优点？

FastAPI 提供了way https fastapi tiangolo com tutorial dependencies 通过其自己的依赖关系解析机制来管理依赖关系例如数据库连接它类似于一个pytest夹具系统简而言之您在函数
XGBoostError：[10：10：03] /workspace/src/tree/updater_gpu_hist.cu：1407：gpu_hist 中的异常：NCCL 失败

PROJECT Nvidia 开发者项目 https developer nvidia com blog gradient boosting decision trees xgboost cuda 在 Google Colab 环境中 MY

随机推荐

将 XML 数组转换为 XML 时出现奇怪的文本

我使用这个问题的答案将 XML 数组转换为单个 XML 输出将 XML 数组输出为纯 XML https stackoverflow com questions 2554671 output array of xml to plain x
为什么这个救援语法有效？

好的我正在使用的应用程序有这种方法并且它可以在生产中使用我的问题为什么这有效这是新的 Ruby 语法吗 def edit load elements current user unless current user role adm
AWS Elastic Beanstalk 中的自定义 URL

AWS Elastic Beanstalk 建议使用以下格式的 URL https appname elasticbeanstalk com 但我需要将其更改为我自己的网址例如https tarta ai 怎么做 Note 我的域使用 A
如何在GDB中像数组一样查看指针？

假设定义 int a 100 Type print a然后 gdb 会自动将其显示为数组 1 2 3 4 然而如果a作为参数传递给函数那么gdb会将其视为普通的int指针类型print a将显示 int 0x7fffffffdaa0
如何在UI底部的固定位置设置一个按钮？

我希望一个按钮始终出现在 UI 页脚的固定位置总是无论它上面是否有组件请在您的主布局下选择一个相对布局将其高度和宽度设置为填充父项并将其重力设置为底部然后将任何文本视图或任何您想要的按钮放入其中
setup.py - 安装后将模块符号链接到 /usr/bin

我几乎完成了 python 包的开发并且还使用 distutils 编写了基本的 setup py usr bin env python author Prahlad Yeri description Small daemon to cr
在外部 JavaScript 文件中使用 KnockoutJS ViewModel

如何在外部 JS 文件中创建 KO JS ViewModel 然后在 html 文件中使用它这看起来是一件很简单的事情但我无法让它工作也找不到任何关于如何做到这一点的明确信息如果我忽略了我会道歉如果有人能指出我的答案我会删除它
使用字段数将文件拆分为更小的文件

我很难将一个大的 50GB csv 文件分解成更小的部分每行有几千个字段一些字段是双引号中的字符串其他字段是整数小数和布尔值我想逐行解析文件并按每行中的字段数进行分割字符串可能包含多个逗号例如以及许多空字段 1 30 50
Delphi 2007 和 Logitech 网络摄像头驱动程序

不久前我遇到了 Delphi 2007 在 Logitech 网络摄像头驱动程序运行时无法运行和调试应用程序的问题显然罗技驱动程序会在每个正在运行的进程中插入一个存根从而弄乱调试器的偏移量已经一年多了这仍然是一个问题吗罗技是否
如何在不调用 java.lang.String 的情况下检查 clojure 中字符串的相等性？

clojure 有没有办法检查字符串的相等性即我需要知道它们的内容是否相等而不是位置 thanks Clojure 中的平等函数总是测试值而不是身份所以两个字符串是如果它们有相同的内容对于大多数 Java 类型包括 Str
使用 MongoDB 代替 MS SQL Server 的优点和缺点 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我是 NoSQL 世界的新手正在考虑将 MS Sql Server 数据库替换为 MongoDB 我
如何在 build.gradle 中检索 ADB 的路径

我尝试通过启动应用程序gradle task task runDebug dependsOn installDebug run task run type Exec commandLine adb shell am start n com
使用附加值扩展枚举

延长期限的常见做法是什么enum在C语言中我有enum来自其他包含的内容并希望用一些值来扩展它们希望以下示例能够为我想要实现的目标提供直观的信息 include
std::thread 不是使用 Eclipse Kepler MinGW 的命名空间 std 的成员

我正在尝试编译一个简单的 C 程序该程序在 eclipse kepler mingw 4 8 1 和 win32 上使用 std thread 我希望在多年的 Windows 开发之后有一天能将开发转移到 Linux include t
如何在c中使用fread()读取结构体的内容

我有以下代码我试图读取文件的内容并显示它并写入另一个文件我的问题是我在屏幕上看到的内容与文件的内容完全不同我已经把文件的部分内容和显示的结果的部分 include
CDN 库在 Chrome 中被屏蔽

我在网站上使用传单 OSM 制作小地图该网站本身可通过 HTTPS 访问而传单库据我所知只能通过 HTTP 连接检索现在 Chrome 不包含该库并在控制台中显示以下消息 blocked The page at https ex
VBA计算数组的非空元素

菜鸟问题我想计算数组的非空元素我的尝试 Dim Arr 1 To 15 As Double populating some of the elements of Arr Dim nonEmptyElements As Integer i
Android 中的 AdMob“AdView 缺少必需的 XML 属性‘adSize’”

我正在尝试在我的应用程序中实施 AdMob 但不知道它以某种方式显示此错误并且我的 R java 文件因此没有生成我已经尝试了所有方法来解决这个问题例如 Clean Build Build All 但非对我有用按照我的代码片段其中
自定义类型作为主键

我目前正在 Visual Studio 2015 上使用 EF6 代码优先我正在开发一个数据库我想使用用户定义的类型作为主键这是我想要的一个简单示例 public class ObjectIdType public string id
如何使用Python向Oracle数据库插入100万行？

我有大约 100 000 到 1 000 000 行要插入到 Oracle18c 数据库中我对 Oracle 和这种数量级的数据还很陌生我认为必须有一些最佳的方法来做到这一点但现在我只能实现逐行插入 def insertLines c

如何使用Python向Oracle数据库插入100万行？

如何使用Python向Oracle数据库插入100万行？ 的相关文章

随机推荐

热门标签

如何使用Python向Oracle数据库插入100万行？的相关文章