使用 Pandas 读取 csv 时如何指定时区信息

2024-02-16

我有一个 csv 文件，其时间戳以 CAT（中非时间）给出。当我使用以下方法将其作为 pandas 数据框读入时：

df = pd.read_csv(path, parse_dates=["timestamp"], dayfirst=True)

我收到错误：

C:\Users..\lib\site-packages\dateutil\parser_parser.py:1218: UnknownTimezoneWarning: tzname CAT 已识别但无法理解。经过tzinfos参数以便正确返回时区感知的日期时间。在未来的版本中，这将引发异常。类别=未知时区警告）

这似乎表明我需要传递一个参数 tzinfos，但据我所知，它没有在 Pandas 文档中列为 read_csv 的选项。我尝试了两者：

df = pd.read_csv(path, parse_dates=["timestamp"], dayfirst=True, tzinfos={"CAT": "Etc/GMT+2"})
df = pd.read_csv(path, parse_dates=["timestamp"], dayfirst=True, tzinfos= "Etc/GMT+2")

但我不断收到错误：

TypeError: read_csv() got an unexpected keyword argument 'tzinfos'

现在它只是一个警告，它仍然将其读取为无时区数据点，我只需添加正确的时区信息即可：df.timestamp.dt.tz_localize("Etc/GMT+2")，然而，警告说“在未来的版本中，这将引发异常”这一事实让我认为我的代码将来会崩溃，所以我更愿意现在修复它。

我尝试用谷歌搜索解决方案，但所有结果似乎都与一般日期时间转换有关，而不是在 csv 中读取（我无法弄清楚结果如何翻译）。

tzinfos是一个论据dateutil 的解析器 https://dateutil.readthedocs.io/en/stable/parser.html。它不能提供给pd.read_csv https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html (or pd.to_datetime https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.to_datetime.html）直接，据我所知。

相反，您可以在不解析日期的情况下读取 csv，导入解析器，然后将其与 kwarg 一起应用，例如：

import pandas as pd
from dateutil import parser, tz

s = pd.Series(["01-Apr-17 12:00:00 AM CAT"])

# use tzfile Africa/Maputo for CAT:
s = s.apply(parser.parse, tzinfos={"CAT": tz.gettz("Africa/Maputo")})

s
0   2017-04-01 00:00:00+02:00
dtype: datetime64[ns, tzfile('/usr/share/zoneinfo/Africa/Maputo')]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Pandas 读取 csv 时如何指定时区信息的相关文章

如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
Python BeautifulSoup XML 解析

我编写了一个简单的脚本来使用 BeautifulSoup 模块解析 XML 聊天日志标准 soup prettify 工作正常只是聊天日志中有很多绒毛您可以在下面看到我正在使用的脚本代码和一些 XML 输入文件 Code import
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
spacy 如何使用词嵌入进行命名实体识别 (NER)？

我正在尝试使用以下方法训练 NER 模型spaCy识别位置人名和组织我试图理解如何spaCy识别文本中的实体但我无法找到答案从这个问题 https github com explosion spaCy issues 491在 Gi
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
将 Pandas 列中的列表拆分为单独的列

这是我在 pandas 数据框中的特征列 Feature Cricket 82379 Kabaddi 255 Reality 4751 Cricket 15640 Wildlife 730 LiveTV 13 Football 4129
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

java中的资源是什么？为什么使用完后要关闭它？

java中资源一词的含义是什么尽管垃圾收集器在jvm中运行为什么我们在使用后必须关闭它为什么我们必须在finally块中编写资源清理代码资源是数量有限的东西例如数据库连接和文件描述符 GC 释放内存但您仍然必须释放资源例如
Nestjs ConfigModule.forRoot() 异步

我想从具有 REST API 的配置服务器加载 Nestjs 中的配置以允许集中式应用程序配置但是 ConfigModule forRoot 函数没有异步版本因此配置返回为undefined 有没有办法解决通过创建返回 Nest C
如何将系统音量与媒体播放器应用程序同步

我刚刚开发了一个简单的媒体播放器可以播放歌曲并且有一个可以调节歌曲音量的搜索栏这是我的代码 public class MainActivity extends AppCompatActivity Button playBtn Seek
在 Windows 中使用两只鼠标执行完全不同的操作

我目前正在尝试开发一个应用程序以使用两只鼠标在 Windows 中执行完全不同的操作然而在花了几天时间之后我开始怀疑使用 Windows API 是否可以实现我想要做的事情由于我远不是 Windows API 方面的专家因此我想
是否可以使用 jQuery.attr() 函数设置多个数据属性？

这有效 myObj attr data test 1 num1 myObj attr data test 2 num2 但这并没有 myObj attr data test 1 num1 data test 2 num2 我在这里错过了一些
当 Firebase 函数发送时，时间戳会在 BigQuery 上返回错误

我正在尝试从 Firebase 函数将时间戳字段发送到 BigQuery 我正在发送 admin firestore FieldValue serverTimestamp BigQuery 上的字段是 TIMESTAMP 类型我收到一个错
以科学记数法打印 cpp_dec_float ，不带尾随零

我在用着cpp dec float http www boost org doc libs 1 55 0 libs multiprecision doc html boost multiprecision tut floats cpp de
dyld：警告，未知环境变量：DYLD_LIBRARY_PATH_64 位

我使用 Mac OS X 开发人员工具捆绑的属性列表编辑器将环境变量 DYLD LIBRARY PATH 64 位设置为文件 MacOSX environment plist 中的值 path to dylib 我保存了该文件并退出重新登
将 PHP for 循环转换为 foreach [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我对算法不太熟悉有人可以帮我把这个 for 循环转换为 foreach 吗 for i 0 i lt count cartBookI
无线 iphone 应用程序分发 - itms 服务协议问题

我已经遵循了所有的指示Apple http developer apple com library ios featuredarticles FA Wireless Enterprise App Distribution Introduct
pyspark sql查询：根据条件计算不同值

我有一个数据框如下 id doctor id patient consumption type drug d1 p1 12 0 bhd d1 p2 10 0 lsd d1 p1 6 0 bhd d1 p1
keras.models.load_model 失败，'tags' = train

我正在探索tensorflow 2 0的c API 问题将模型加载到 python 中时权重不会恢复因此模型似乎未经训练工作流程我正在使用 TF 2 0 C api 来处理模型的训练我遵循的一般设置是 1 使用 TF keras
Jquery Ui拖放问题

我正在开发一个带有 jquery 的工具栏插件以及 jquery ui 的拖放功能这个想法如下我有一个列表 ul 和项目 li 其中每个项目代表一个工具如文本几何图形等当我拖动工具然后将其放在容器上时必须创建一个小部件问题是
将 PNG 图像打印到 Zebra 网络打印机

我正在尝试找到一种将图像打印到斑马的方法但遇到了很多麻烦根据文档第一种编码称为 B64 使用 MIME 对数据进行编码 Base64 方案 Base64 用于对电子邮件附件进行编码 Base64 将 6 位编码为字节比未封装的数据扩
将两种不同的颜色设置为单个容器

I am trying to achieve a custom design dynamically from my button I have designed this button from a Container with InkW
“硬编码”用户代理足以让程序在多台计算机上运行吗？

我在用着idHttp登录到一些网站并下载一些文件我想知道因为我的程序将在具有不同窗口和软件的多台计算机上运行例如当我说 idHttp userAgent Mozilla 5 0 Windows NT 6 1 WOW64 AppleWeb
使用 pandas.to_csv 时如何指定日期格式？

默认输出格式为to csv is 12 14 2012 12 00 00 AM 我不知道如何仅输出特定格式的日期部分 20121214 或 csv 文件中两个单独列中的日期和时间 20121214 084530 该文档太简短无法为我提供有
PostgreSQL 中 json 数组值的交集

在 PostgreSQL 9 4 中我有一个这样的表 id array json 1 type single field id 9 type range field id 2 2 type single field id 10 type
如何保持数据库表中记录的顺序

我正在创建一个数据库表该表将存储最终将显示在网页上的菜单链接我的问题是我想控制菜单项的顺序我可以有一个名为 order 的字段但每次我有一个新的菜单链接时我都必须插入 order 并将所有具有更高 order 的记录更改为 1 例
使用 Pandas 读取 csv 时如何指定时区信息

我有一个 csv 文件其时间戳以 CAT 中非时间给出当我使用以下方法将其作为 pandas 数据框读入时 df pd read csv path parse dates timestamp dayfirst True 我收到错误 C

使用 Pandas 读取 csv 时如何指定时区信息

使用 Pandas 读取 csv 时如何指定时区信息 的相关文章

随机推荐

热门标签

使用 Pandas 读取 csv 时如何指定时区信息的相关文章