在 pandas 中指定 read_sql 的数据类型

2024-03-25

我想指定执行 pandas.read_sql 时返回的数据类型。我特别感兴趣的是节省内存并将浮点值返回为 np.float32 而不是 np.float64。我知道我可以随后使用 astype(np.float32) 进行转换，但这并不能解决初始查询中的大内存需求问题。在我的实际代码中，我将提取 8400 万行，而不是此处显示的 5 行。 pandas.read_csv 允许将 dtypes 指定为字典，但我认为无法使用 read_sql 来做到这一点。

我正在使用 MySQLdb 和 Python 2.7。

顺便说一句，read_sql 在运行时使用的内存似乎比最终 DataFrame 存储所需的内存要多得多（大约是 2 倍）。

In [70]: df=pd.read_sql('select ARP, ACP from train where seq < 5', connection)

In [71]: df
Out[71]: 
   ARP      ACP
0  1.17915  1.42595
1  1.10578  1.21369
2  1.35629  1.12693
3  1.56740  1.61847
4  1.28060  1.05935


In [72]: df.dtypes
Out[72]: 
ARP    float64
ACP    float64
dtype: object

你可以使用熊猫读sql查询 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_sql_query.html它允许您指定返回的数据类型（仅从 pandas 1.3 开始支持）。

pd.read_sql_query('select ARP, ACP from train where seq < 5', connection,
                  dtype={'ARP': np.float32, 'ACP': np.float32})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 pandas 中指定 read_sql 的数据类型的相关文章

为什么即使没有要打印的数据，打印命令也会换行

只是打字print在 python 中只给出换行符打字print3 x 中没有括号也会给出换行符为什么 Because 文档 https docs python org 3 library functions html print sa
如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items
根据Python中两行之间的匹配创建一个带有[0,1]的新列

我正在尝试将多个列表或数据帧与一个大型基础数据帧进行比较然后对于任何匹配我想附加一个存储 1 匹配或 0 不匹配的列 df pd DataFrame Name A B C D ID 5 6 6 7 8 9 7 list1 5 6 8 9
获取 pandas 中最后一次出现特定值之后的所有行

我的数据框看起来像 ID colA 1 B 1 D 2 B 2 D 2 C 我已返回每组中事件 B 最后一次出现后的所有行输出将是 ID colA 1 D 2 D 2 C 我试过 a df colA str contains B grou
将 celery 与 Flask 应用程序上下文一起使用会导致“弹出错误的应用程序上下文”。断言错误

我或多或少使用设置来使用您的 Flask 应用程序上下文来运行 Celery 任务 http flask pocoo org docs 0 10 patterns celery http flask pocoo org docs 0 10
从受密码保护的 Excel 文件到 pandas DataFrame

我可以使用以下命令打开受密码保护的 Excel 文件 import sys import win32com client xlApp win32com client Dispatch Excel Application print Exce
如何从 NodeJs 调用 python 脚本

我需要在 NodeJs 中调用这个 python 脚本 Read py usr bin env python coding utf8 import RPi GPIO as GPIO import MFRC522 import signal
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102
Python sys.modules 包含尚未导入的模块

我试图了解加载的模块与导入的模块之间的区别如果有的话我正在使用 Python 2 7 3 并且只是从命令行运行 Python 如果我执行 import sys sys modules 我得到一个列表其中包括os 例如文档说sys m
如何合并多个Excel文件，每个Excel文件中有多个相同数量的工作表

我目前可以将多个 Excel 文件合并到一张表中我想合并每个 Excel 文件中具有两个不同工作表的多个工作表并为每个工作表指定名称我怎样才能实现这个目标下面是我当前的代码用于将多个 Excel 文件中的单个工作表组合在一起而无需
pip.main 安装失败，“模块”对象没有属性“main”

我正在尝试从 python 脚本中安装一些 python 包并且我正在使用pip main install 为了那个原因下面是代码片段 try import requests except import pip pip main ins
条件移位：在 pandas 中使用多个条件从“当前行值”中减去“前一行值”

我有以下数据框 Disease HeartRate State MonthStart MonthEnd Covid 89 Texas 2020 02 28 2020 03 31 Covid 91 Texas 2020 03 31 2020
使用 matplotlib 散布条件颜色

我有以下 Pandas Dataframe 其中 a 列代表虚拟变量我想做的是给我的标记一个cmap jet 列值后面的颜色b 除非列中的值a等于 1 在本例中我希望它的颜色为灰色知道我该怎么做吗您必须标记等于 1 的值并绘制 imp
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995
OpenCV 错误：connectedComponents_sub1 中断言失败 (L.channels() == 1 && I.channels() == 1) [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 OpenCV python 中遇到以下错误并用 google 搜索了很多但无法解决如果有人能为我提供一些线索
清理 .txt 并计算最常见的单词

我需要 1 从停用词列表中清除 txt 我将其放在单独的 txt中 2 之后我需要统计最常见的 25 个单词这是我为第一部分想到的 usr bin python coding iso 8859 15 import re from coll
使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA

随机推荐

通过 .net 发送短信

全部是否有通过 net 发送短信 SMS 的免费解决方案也许是网络服务之类的 EDIT 我真正想要的是一个有信誉的在线服务的参考我可以用它来发送短信有没有人使用过这样的服务如果是的话你能给我一个建议警告吗 EDIT 首先是免责
使用聚合 OData 版本 4 对 Apply 的结果执行 OrderBy

考虑我有一个像这样的 odata 查询 Sessions apply filter SomeColumn eq 1 groupby Application Name aggregate TotalLaunchesCount with sum
Android 数字键盘上的“下一步”按钮

我想知道如何使用 Jquery 检测 Android 数字键盘上的下一步按钮事件请给我解决方案如何触发该按钮事件您可以检测到next通过在 JQuery 中使用以下绑定来按下键盘 input on keydown function
Node.js POST 导致 [错误：套接字挂起] 代码：'ECONNRESET'

我创建了一个示例来将数据发布到休息服务我发现当我有非 ASCII 或非拉丁字符时请参阅 data firstName 我使用 TEST REST js 的发布请求将抛出错误错误套接字挂起代码 ECONNRESET TEST RE
如何用省略号删除右侧的多余空间

我想用省略号类删除右侧的额外空间 ellipsis white space nowrap overflow hidden text overflow ellipsis max width 90px div float left clear
如何在 Python 中检查空 gzip 文件

我不想使用操作系统命令因为这使得它依赖于操作系统这可以在tarfile tarfile is tarfile filename 检查文件是否为 tar 文件我在中找不到任何相关命令gzip module EDIT 为什么我需要这个我
如何使Spring缓存中的缓存名称可配置？

我们使用 Spring 缓存框架进行缓存并且希望能够支持多个缓存命名空间例如 book 或 isbn 并且缓存命名空间是可配置的而不是硬编码在类中例如具有 Cacheable book isbn public Book findBo
JavaScript：内联函数与预定义函数

任何人都可以向我提出一些关于使用的论据吗内联函数反对通过预定义函数给一些处理程序的名字 IE 哪个更好 function setTimeout function some code here 5 versus function functi
Android 2.2异常处理，catch参数null

我想知道是否有人遇到奇怪的行为我有 try catch 块其中 catch 语句分配一个异常变量以使我能够正确处理异常我得到的是 catch Exception ex 语句中的 ex null 请问我做错了什么 public clas
如何读取用逗号分割的 CSV 文件，除非它是字段的一部分[重复]

这个问题在这里已经有答案了我有以下 C 代码它读取 CSV 文件目标是将其保存到 SQL 表中 StreamReader sr new StreamReader tbCSVFileLocation Text ToString stri
在 google Drive api 的根目录中创建文件夹并将文件上传到该文件夹

我想使用 CURL 在 google 驱动器根目录中创建文件夹文件已上传到驱动器但我需要创建一个文件夹并将文件上传到该文件夹根据 hanshenrik 代码创建文件夹正在工作移动文件不起作用我更新的代码 REDIRECT URI
将列与 t-sql 中的值列表进行比较

我正在页面上显示记录并且我需要一种方法让用户选择要在另一个页面上显示的记录的子集这些记录不存储在任何地方而是动态生成的在 sql 中说明 uniqueid 位于此 id 列表中而不是表等中的位置的最佳方法是什么我知道我可以使用一堆
模板化类专门化，其中模板参数是模板

我想知道类似的事情是否可能基本上我有一个模板类它偶尔会采用模板类的对象我想将它或只是一个成员函数专门用于特定的模板类但该类的通用形式 template
如何在 C# 中关闭*多显示*？

关于如何在c 中关闭显示器的文章有很多但都是关闭所有显示器有没有可能的方法来关闭特定的监视器一些研究引导我来到这里 http www codeguru com forum showthread php p 1011720 post
专有的 Haskell 库

我对 Haskell 有点陌生已经在业余项目中使用它几个月了我想编写一个 C 库的 Haskell 接口所有代码都是专有的而不是开源的所以我的问题是如果我最终将其分发给客户并且不想提供源代码而是提供诸如共享库之类的东西怎么办
如何在未迁移到Androidx的项目中使用Androidx库

我目前的项目还是比较稳定的目前我不想迁移到 Androidx 但我需要用这个com pierfrancescosoffritti androidyoutubeplayer core 10 0 3我的项目中的图书馆已迁移至 Android
使 IE 中的内容不可选择

这是我用 JS 写的图表 http jsfiddle net 49FVb http jsfiddle net 49FVb The css moz user select none khtml user select none 在 Chrom
Cassandra 3.9 和 CQL 规范版本

只是好奇 Cassandra 3 9 支持哪些版本的 cql 我知道Cassandra 3 9支持cql 3 4 2 但是3 4 3是否也支持以及如何升级配置 Cassandra 3 9 以使用 cql 3 4 3 我在网上搜索了一下
使用 C++ 连接到 MySQL 服务器

我正在尝试使用 C 和 Visual C 2008 Express Edition 上的 MySQL ODBC 5 1 驱动程序连接到 MySQL 服务器我按照 MSDN 中的这些说明进行操作 SQL连接 http msdn micros
在 pandas 中指定 read_sql 的数据类型

我想指定执行 pandas read sql 时返回的数据类型我特别感兴趣的是节省内存并将浮点值返回为 np float32 而不是 np float64 我知道我可以随后使用 astype np float32 进行转换但这并不能解决

在 pandas 中指定 read_sql 的数据类型

在 pandas 中指定 read_sql 的数据类型 的相关文章

随机推荐

热门标签

在 pandas 中指定 read_sql 的数据类型的相关文章