当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中

2023-12-19

我看了这个问题的答案：当 YYYYMMDD 和 HH 位于不同的列中时，在 Python 中使用 pandas 解析日期 https://stackoverflow.com/questions/11615504/parse-dates-when-yyyymmdd-and-hh-are-in-separate-columns-using-pandas-in-python，但它似乎对我不起作用，这让我觉得我做了一些微妙的错误。

我有 .csv 文件中的数据，我正在尝试使用 pandas read_csv 函数读取这些数据。日期和时间位于两个单独的列中，但我想将它们合并到一列“Datetime”中，其中包含日期时间对象。 csv 看起来像这样：

    Note about the data
    blank line
    Site Id,Date,Time,WTEQ.I-1...
    2069, 2008-01-19, 06:00, -99.9...
    2069, 2008-01-19, 07:00, -99.9...
    ...

我正在尝试使用这行代码来阅读它：

   read_csv("2069_ALL_YEAR=2008.csv", skiprows=2, parse_dates={"Datetime" : [1,2]}, date_parser=True, na_values=["-99.9"])

但是，当我将其写回 csv 时，它看起来完全相同（除了 -99.9s 更改为 NA，就像我使用 na_values 参数指定的那样）。日期和时间位于两个单独的列中。据我了解，这应该创建一个名为 Datetime 的新列，该列由第 1 列和第 2 列组成，并使用 date_parser 进行解析。我还尝试使用 parse_dates={"Datetime" : ["Date","Time"]}、parse_dates=[[1,2]] 和 parse_dates=[["Date", "Time"]]。我还尝试过使用 date_parser=parse，其中 parse 定义为：

    parse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M')

这些都没有产生丝毫差异，这让我怀疑存在一些更深层次的问题。对它可能是什么有任何见解吗？

你应该更新你的 pandas，我推荐最新稳定版本 http://pandas.pydata.org/getpandas.html了解最新功能和错误修复。

这个具体功能是0.8.0 中引入 http://pandas.pydata.org/pandas-docs/version/0.8.0/whatsnew.html#other-new-features，适用于 pandas 版本 0.11：

In [11]: read_csv("2069_ALL_YEAR=2008.csv", skiprows=2, parse_dates={"Datetime" : [1,2]}, na_values=["-99.9"])
Out[11]:
             Datetime  Site Id  WTEQ.I-1
0 2008-01-19 06:00:00     2069       NaN
1 2008-01-19 07:00:00     2069       NaN

没有date_parser=True（因为这应该是一个解析函数，参见文档字符串 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html).

请注意，在提供的示例中，生成的“Datetime”列是其自己的系列，而不是 DataFrame 的索引值。如果您希望将日期时间值作为索引列而不是整数值，请传递指定所需列的 index_col 参数，在本例中为 0，因为生成的“Datetime”列是第一个列。

In [11]: read_csv("2069_ALL_YEAR=2008.csv", skiprows=2, parse_dates={"Datetime" : [1,2]}, index_col=0, na_values=["-99.9"])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中的相关文章

将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
从服务器获取当前日期时间并将其转换为 C# 中的本地时间

帮助我有一台服务器其运行时间为 GMT 07 00 我的当地时间是 GMT 05 30 小时我需要从服务器获取当前日期和时间并将该日期和时间转换为我的当地时间我已经尝试了很多代码但仍然没有找到连续的方法来做到这一点有人可以帮我
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
使用 matplotlib.animation 从 CSV 文件实时绘图 - 数据绘制到第一个输入错误

我正在尝试绘制来自不断写入 CSV 文件的传感器的数据虽然成功创建实时绘图但每个新数据条目都会创建一条延伸到第一个数据条目的附加线见下文 Python 3 4 脚本 import matplotlib pyplot as plt im
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

Adobe Illustrator 删除 svg 图像上的类名称。我怎样才能防止这种情况发生？

我有这个 svg 图像
线程消息系统数据库架构设计

我试图准确地实现这里解释的内容创建一个线程化的私人消息系统如 facebook 和 gmail https stackoverflow com questions 6420264 creating a threaded private
python http请求和响应是如何工作的

我是 python 新手我有任务所以我需要扫描 wifi 并将数据发送到服务器下面是我必须发送的格式在浏览器 url 文本框中手动输入时可以正常工作 http 223 56 124 58 8080 ppod web ProcessR
Safari html5 视频全屏尺寸

在 OSX Safari 上单击全屏时的 HTML5 视频标记如何强制视频覆盖全屏而不是显示带有黑色背景的小尺寸可能是原始尺寸好的找到了设置最大高度时需要一些 CSS 回答 video webkit full screen w
除非您更新 Google Play 服务，否则应用程序将无法运行

我对开发还很陌生我的 Google Maps API 工作得很好唯一的障碍是在我的 gradle 依赖项中我必须compile com google android gms play services 9 而不是播放服务 10 0 1
从 Spark rdd 收集大型数据集的最佳实践是什么？

我正在使用 pyspark 来处理我的数据最后我需要使用 rdd collect 从 rdd 收集数据然而由于内存问题我的 Spark 崩溃了我尝试了很多方法但没有成功我现在运行以下代码为每个分区处理一小块数据 def ma
vue.js v-for 列表未更新

我有这个清单 ul li list personName li ul 然后我有这个 vue 对象 var vm new Vue el tab data names an object array coming from the server
Tkinter.Text 小部件上的验证？

我有哪些选择来获得验证Tkinter Text小部件我不要求Text的高级功能就在于它的多行属性不幸的是两者都缺乏textvariable and validate命令所以我似乎无法附加某种回调来在每次文本更改时检查内容我想避免
如何从服务向活动发送消息

我构建了一个创建服务的 AsyncTask 现在我想从服务发送到 AsyncTask 消息我在 AsyncTask 上的代码是 class ResponseHandler extends Handler public void handl
如何在 Silverlight 组合框中显示项目的组标题？

我在 Silverlight 中有一个组合框其 itemssource 与CollectionView of CollectionViewSource 我还添加了GroupDescription to the CollectionView
错误：ENOENT：没有这样的文件或目录，取消链接

正如你所看到的路径中有一个文件但 fs 说没有这样的文件或目录我不明白为什么在另一个文件中我可以使用相同的代码删除我的boat js 文件 boat findById req params id function err fou
具有可变数量上下文管理器的 contextlib.nested 的替代方案

我们的代码根据运行时参数调用可变数量的上下文管理器 from contextlib import nested contextmanager contextmanager def my context arg print entering
php 为数组制作 csv 文件

我有一个数组当我使用时print r output 我得到这样的数组 array 0 gt Array listing id gt 14 category id gt Modern Australian listing name gt B
Logback 配置——如何包含 Spring 应用程序版本

出于分析目的我想在所有日志条目中记录应用程序版本理想情况下我希望通过编辑 logback spring xml 文件而不是编写任何 Java 代码来完成此操作我已经成功记录 spring 应用程序名称请注意显示正确应用程序版本的示
将 ssl 与 mysql 集成 - 访问被拒绝

我正在尝试设置ssl for mysql通过提及this http www chriscalender com p 448 我能够完成前 3 个步骤但第四个步骤出现问题如下所示 GRANT ALL PRIVILEGES ON TO ss
在 Rails 应用程序中读取大型 csv 文件会占用大量内存 - 减少内存消耗的策略？

我有一个rails应用程序它允许用户上传csv文件并在delayed job gem的帮助下安排多个csv文件的读取问题是应用程序将每个文件完整地读取到内存中然后写入数据库如果只读取 1 个文件那没问题但是当读取多个文件时服务
我们可以创建自定义 HTTP 状态代码吗？

我有 REST 和 WCF 服务并且想要根据操作发送自定义状态代码例如当某些验证失败时我想发送 HTTP 444 当授权失败时我想发送 HTTP 455 问题是我们如何针对 SOAP 和 REST Web 服务验证它在客户端上
如何让 Slack 机器人离开频道？

机器人无法使用常规channels leaveAPI 调用那么如何让机器人离开频道而不踢掉它呢我需要它来离开一个我无权踢用户的频道 You can remove or kick 机器人类型 kick botname在您希望机器人离开的
在 Azure DevOps 管道中运行 NUnit 测试

是否可以好像不是不支持NUnit吗应该用什么代替这是我的测试项目
当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中

我看了这个问题的答案当 YYYYMMDD 和 HH 位于不同的列中时在 Python 中使用 pandas 解析日期 https stackoverflow com questions 11615504 parse dates when

当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中

当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中 的相关文章

随机推荐

热门标签

当日期和时间位于不同的列中时，将数据从 csv 读取到 pandas 中的相关文章