使用 python 中 pandas 的 read_excel 函数将日期保留为字符串

2024-05-01

Python 2.7.10
尝试过 pandas 0.17.1 -- 函数 read_excel
尝试过 pyexcel 0.1.7 + pyexcel-xlsx 0.0.7 -- 函数 get_records()

在Python中使用pandas时可以读取excel文件（格式：xls xlsx）并留下包含date or 日期+时间值作为strings而不是自动转换 to datetime.datetime or timestamp types?

如果使用 pandas 不可能做到这一点，有人可以建议另一种方法/库来阅读xls xlsx文件并将日期列值保留为字符串？

For the pandas解决方案尝试df.info()生成的日期列类型如下所示：

>>> df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 117 entries, 0 to 116
Columns: 176 entries, Mine to Index
dtypes: datetime64[ns](2), float64(145), int64(26), object(3)
memory usage: 161.8+ KB
>>> type(df['Start Date'][0])
Out[6]: pandas.tslib.Timestamp
>>> type(df['End Date'][0])
Out[7]: pandas.tslib.Timestamp

尝试/方法 1：

def read_as_dataframe(filename, ext):
   import pandas as pd
   if ext in ('xls', 'xlsx'):
      # problem: date columns auto converted to datetime.datetime or timestamp!
      df = pd.read_excel(filename) # unwanted - date columns converted!

   return df, name, ext

尝试/方法 2：

import pandas as pd
# import datetime as datetime
# parse_date = lambda x: datetime.strptime(x, '%Y%m%d %H')
parse_date = lambda x: x
elif ext in ('xls', 'xlsx', ):
    df = pd.read_excel(filename, parse_dates=False)
    date_cols = [df.columns.get_loc(c) for c in df.columns if c in ('Start Date', 'End Date')]
    # problem: date columns auto converted to datetime.datetime or timestamp!
    df = pd.read_excel(filename, parse_dates=date_cols, date_parser=parse_date)

并且还尝试了 pyexcel 库，但它具有相同的自动魔术转换行为：

尝试/方法 3：

import pyexcel as pe
import pyexcel.ext.xls
import pyexcel.ext.xlsx

t0 = time.time()
if ext == 'xlsx':
    records = pe.get_records(file_name=filename)
    for record in records:
        print("start date = %s (type=%s), end date = %s (type=%s)" %
              (record['Start Date'],
               str(type(record['Start Date'])),
               record['End Date'],
               str(type(record['End Date'])))
              )

我遇到了同样的问题，除了 pandas 奇怪地只转换some单元格转换为日期时间。我最终手动将每个单元格转换为字符串，如下所示：

def undate(x):
    if pd.isnull(x):
        return x
    try:
        return x.strftime('%d/%m/%Y')
    except AttributeError:
        return x
    except Exception:
        raise

for i in list_of_possible_date_columns:
    df[i] = df[i].apply(undate)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

datetime

pandas

使用 python 中 pandas 的 read_excel 函数将日期保留为字符串的相关文章

组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
Excel VBA 过滤和复制粘贴数据

给定一个数据集假设有 10 列在 A 列中我有日期在 B 列中我有我想仅过滤 A 列 2014 年的数据 B 列 ActiveSheet Range A 1 AR 1617 AutoFilter Field 5 Operator x
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装
Python 中的字符串slugification

我正在寻找 slugify 字符串的最佳方法蛞蝓是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code

随机推荐

在 WPF 中展开 TreeView 时显示“请稍候...”消息

我的 TreeView 中有很多项目而且项目也非常复杂我不想使用虚拟化展开 TreeView 有时需要花费大量时间因此是否有任何事件例如 IsTreeViewExpanding 或类似的事件我可以在其中显示正在生成 Tree
替换 lambda 表达式中的参数类型

我正在尝试将 lambda 表达式中的参数类型从一种类型替换为另一种类型我在 stackoverflow 上找到了其他答案即this one https stackoverflow com questions 11159697 repl
修改文本文件而不读入内存

我试图找出一种修改文本文件特别是删除特定行的方法而无需将文件的大部分读取到内存中或重写整个文件这里讨论的是大于主内存约 15 50 Gigs 的文件附我正在使用Linux 你不会逃避创建一个新文件所以就硬着头皮去做吧使用gr
在汇编中显示两位数？ [复制]

这个问题在这里已经有答案了我对汇编编程完全陌生在课堂作业的示例中需要将两个数字相加并显示总和我发现神秘的是当其是两位数时显示总和这是我的代码 mov al num1 mov bl num2 add al bl add ax 303
我应该为每个选项卡栏使用单独的 UINavigationController

根据Apple https developer apple com library ios documentation WindowsViews Conceptual ViewControllerCatalog Chapters Combi
Node.js、EventEmitter 为什么使用它

我有一个问题events EventEmitter在 Node js 中为什么使用它示例1和示例2有什么区别我发现它们是相同的是吗什么时候可以实际使用它 let events require events let util req
在 Libgdx 中实现简单运动模糊的意外结果

在所附的两张图片中 libgdx 的桌面屏幕截图按预期运行不幸的是我的 Galaxy Nexus 的屏幕截图与预期不符我正在尝试创建一个简单的运动模糊或轨迹效果 Rendering as I expected on my deskto
C++：输入和输出流运算符：结合性

输入输出流运算符理论上的结合性左到右例如根据这个圣玛丽大学网站 http cs smu ca porter csc ref cpp operators html 输入输出流运算符结合性实践 include
开源html解析类无法正确解析段落之间的空格

我正在使用一种开源方法将 html 文本解析为 NSString 生成的字符串在前几个段落之间有大量空格但后续段落只有一行空格这是输出的示例 Below is the method I m calling I ve only chan
如何在 ASP.NET 中将下拉列表与字符串数组绑定？

我可以通过这样做将下拉列表与字符串数组绑定不确定这是否是正确的实现方法 string items 111 222 333 ddlSearch DataSource items ddlSearch DataBind 然而我真正想要的是当
使用并发.futures.ProcessPoolExecutor 动态创建函数的限制

我正在尝试使用我在其他函数中动态创建的函数进行一些多重处理如果提供给 ProcessPoolExecutor 的函数是模块级的我似乎可以运行这些 def make func a def dynamic func i return i i
仅在一个 JTable 单元格中的复选框

我想创建一个JTable有 2 列看起来像一个调查所以左边是问题右边是用户可以给出他的答案但在一行的右侧应该有一个复选框以便用户只能回答是或否这可以用JTable 我怎样才能做到这一点 regards 您在评论中指出我用一列
如何从 CloudFormation 中的 Elastic Beanstalk 环境中提取负载均衡器名称

我使用以下代码片段在 CloudFormation 中创建了 Elastic Beanstalk 和 CloudWatch 警报 ElasticBeanstalkEnvironment Type AWS ElasticBeanstalk E
使用 Mapstruct 将对象列表转换为长 ID 列表

我在用MapStruct将实体转换为 DTO 我有一个实体 A 和实体 B 的列表 public class A List b bs 我想要 ADto 类中的 B id 列表 public class ADto List b
如何禁用将包上传到 PyPi 除非将 --public 传递给上传命令

我正在开发包并将包的开发测试等版本上传到本地 devpi 服务器为了防止意外上传到PyPi 我采用了以下常见做法 setup classifiers Programming Language Python Programming La
是否可以在选择器中进行修剪？

我想计算表单中所有为空的输入对于空我的意思是它的值在修剪其值后为空如果用户插入空格也为空这个 jquery 对它们进行计数但不包括修剪 text filter value length 有一些 jquery 可以用来在选择器中修剪
如何继续使用适用于 AWS Cognito 的 AD FS SAML？

我正在设置 AD FS 来生成 SAML 元数据以连接到 AWS Cognito 用户池我已经生成了 xml 元数据并将其上传到用户池我应该在 AD FS 站点上创建信任中继吗是否还有其他步骤可以让我的 AD 用户可用于 Web 应用
如何集成Django和Cygwin？

我有一个安装了 cygwin python 和 django 的 Windows 盒子现在我想运行 django admin 但是当我这样做时我收到错误 django admin py c Python26 python exe can
无法获得 S.M.A.R.T.外部驱动器的信息

我正在尝试获取外部 USB 驱动器的 SMART 信息我使用以下查询来获取驱动器的温度但是该查询始终返回集合中的单个对象即我的内部 HDD ManagementObjectSearcher searcher new Managemen
使用 python 中 pandas 的 read_excel 函数将日期保留为字符串

Python 2 7 10 尝试过 pandas 0 17 1 函数 read excel 尝试过 pyexcel 0 1 7 pyexcel xlsx 0 0 7 函数 get records 在Python中使用pandas时可以读取e

使用 python 中 pandas 的 read_excel 函数将日期保留为字符串

使用 python 中 pandas 的 read_excel 函数将日期保留为字符串 的相关文章

随机推荐

热门标签

使用 python 中 pandas 的 read_excel 函数将日期保留为字符串的相关文章