从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列

2023-12-02

当我从 CSV 文件读回数据时，每个单元格都被解释为字符串。

如何自动将读入的数据转换为正确的类型？
或者更好：我如何告诉 csv 阅读器每列的正确数据类型？

（我写了一个二维列表，其中每一列都有不同的类型（bool、str、int、整数列表），输出到 CSV 文件。）

示例数据（CSV 文件中）：

IsActive,Type,Price,States
True,Cellphone,34,"[1, 2]"
,FlatTv,3.5,[2]
False,Screen,100.23,"[5, 1]"
True,Notebook, 50,[1]

As the 文档解释，CSV 阅读器不执行自动数据转换。您有 QUOTE_NONNUMERIC 格式选项，但这只会将所有非引用字段转换为浮点数。这与其他 csv 读取器的行为非常相似。

我不相信 Python 的 csv 模块对这种情况有任何帮助。正如其他人已经指出的那样，literal_eval()是一个更好的选择。

以下内容确实有效并进行转换：

strings
int
floats
lists
字典

您也可以将它用于布尔值和 NoneType，尽管它们必须相应地格式化literal_eval()通过。 LibreOffice Calc 以大写字母显示布尔值，而在 Python 中布尔值是大写的。另外，您必须将空字符串替换为None（不带引号）

我正在为 mongodb 编写一个导入器来完成这一切。以下是我迄今为止编写的代码的一部分。

[注意：我的 csv 使用制表符作为字段分隔符。您可能还想添加一些异常处理]

def getFieldnames(csvFile):
    """
    Read the first row and store values in a tuple
    """
    with open(csvFile) as csvfile:
        firstRow = csvfile.readlines(1)
        fieldnames = tuple(firstRow[0].strip('\n').split("\t"))
    return fieldnames

def writeCursor(csvFile, fieldnames):
    """
    Convert csv rows into an array of dictionaries
    All data types are automatically checked and converted
    """
    cursor = []  # Placeholder for the dictionaries/documents
    with open(csvFile) as csvFile:
        for row in islice(csvFile, 1, None):
            values = list(row.strip('\n').split("\t"))
            for i, value in enumerate(values):
                nValue = ast.literal_eval(value)
                values[i] = nValue
            cursor.append(dict(zip(fieldnames, values)))
    return cursor

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

python25

从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列的相关文章

是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
需要在python中找到print或printf的源代码[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在做一些我不能完全谈论的事情我
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

hyperledger Fabric：找不到 SKI 的匹配私钥

这是我在 stackoverflow 上的第一篇文章通常我每次来 stackoverflow 都会找到解决方案但这次不是我正在尝试为供应链实施超级账本结构解决方案我可以执行通道链码 addpeers 我还可以通过终端实例化和调用链
验证 WinForm 中的数据

我在 WinForms 应用程序中创建了一个对话框它有许多文本框和确定取消按钮当用户单击确定时我只希望在所有条目均有效的情况下关闭对话框我可以看到如何分别使用每个控件的验证事件来执行此操作没事儿但这些似乎只有在控件失去
如何设置网络视图的初始缩放/宽度

我试图让 WebView 具有与 Android 浏览器类似的行为浏览器以尝试使页面宽度适合屏幕的方式打开所有页面但是 WebView 的默认行为是以 100 像素比例开始因此它从左上角开始放大在过去的几个小时里我一直在尝试找到一
T-SQL：UNION ALL 视图不可更新，因为未找到分区列

如何在具有日期约束的视图中插入这是单击脚本作为创建表后生成的表 Table 1 CREATE TABLE dbo tbl zaua 1 17 id int NOT NULL date datetime NULL CONSTRAINT PK
.xm 和 .s3m 文件无法在 Inno Setup 的 BASS 库中播放，仅播放 .mp3

当我选择 mp3 文件时它会在启动 setup exe 时播放但当我将其更改为 xm 或 s3m 时它不会播放 Setup AppName Bass Audio Project AppVersion 1 0 DefaultDirNam
如何在 Hadoop/Hive 中搜索具有给定列名的所有表并返回哪些表具有该列名？

我正在寻找 HDFS Hive 中包含给定列名的所有表截至目前我想没有直接的方法可以找到配置单元中具有特定列的表但我建议使用 hive 元存储来实现此目的如果它能满足您的要求的话如果您的 hive 元存储在 mysql 中配置则
在 QTableView 的未使用区域中捕获双击

我的应用程序从一个空表开始我想实现不同的方法来添加项目一种方法是双击表格中未被任何单元格占用的未使用区域或背景双击单元格时我想要默认行为我找到了通过重新实现来做到这一点的方法QAbstractScrollArea mouseD
R中提取混合数字和字符的字符串的数字部分

我有很多字符串每个字符串往往具有以下格式 Ab Cd 001234 txt我想将其替换为001234 我怎样才能在R中实现它 The stringr软件包有很多适合此类工作的便捷快捷方式 input data following agst
为什么SecurityContext的Authentication对象不能跨线程共享？

我有时会遇到问题AuthenticationCredentialsNotFoundException 目前我认为这是一个线程问题根据另一个问题 link the SecurityContext是通过HttpSession不同线程之间的对象
Java Spring mvc 中的 Angular Js 发布日期错误请求

在 Java Spring MVC 项目中我将一个对象发布到 RestController 并且我发布的对象具有日期属性如果我删除此属性该帖子就会成功但对于 date 属性它会返回 400 bad request 在 dto 中
在运行时更改 ctypes 的 LD_LIBRARY_PATH

如何在运行时更新此环境变量以便 ctypes 可以在任何地方加载库我尝试过以下方法但似乎都不起作用 from ctypes import os environ LD LIBRARY PATH home starlon Projects
如何在实体框架 5 中表达“有多个通过”关系？

我正在尝试使用 Entity Framework 5 查询现有的 MySQL 数据库我使用代码优先创建一个基于代码的模型该模型映射到以下现有数据库MSDN 上的这个教程我有两张桌子 users and buddies A User h
这是使用接口回调的正确方法吗？

I read this and this并发现在课堂上B我需要保存对类的引用A当课堂上发生什么事时B我们执行由该类的接口定义的方法A实施好吧不知何故我明白了我以稍微不同的方式使用接口来调用回调 interface IHelper vo
如何在 SQL Server 中同时将数据插入到两个表中？

假设我的表结构如下所示 CREATE TABLE dbo table1 id int IDENTITY 1 1 NOT NULL data varchar 255 NOT NULL CONSTRAINT PK table1 PRIMARY
有什么方法可以使用 Selenium 启动 POST 请求吗？

我正在尝试向我的应用程序发出 POST 请求来启动 Selenium 测试而不是简单的open startpoint 我想做类似的事情open startpoint stuff foo stuff2 bar 有什么办法可以做到这一点吗我
如何从代码中更改“纯色”？

我有一个Shape定义于xml 现在我需要改变一个solid color从代码中你能建议如何吗
C++从流中提取双精度数

我在学校的体育锻炼上遇到了一个有趣的问题我得到了纬度和经度我必须确保它的格式正确 d d NS d d EW 所以如你所见我必须检查有没有 char lBracket rBracket comma NS EW int nLat nL
.NET 3.5 (C#) 网络上的命名管道

我正在努力获得 NET NOTWCF 命名管道通过网络进行通信这MSDN 文档意味着这是可能的而且是微不足道的但我的代码 using NamedPipeClientStream pipeClient new NamedPipeClie
有没有办法在不使用 FTP 的情况下从 PHP 更改文件夹权限？

有没有办法在不使用 FTP 的情况下从 PHP 更改文件夹权限我正在服务器上自动创建新文件夹但由于文件夹权限的原因我无法在其中移动上传的文件您知道我可以在不使用 FTP 的情况下更改文件夹的权限吗 chmod home path d
从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列

当我从 CSV 文件读回数据时每个单元格都被解释为字符串如何自动将读入的数据转换为正确的类型或者更好我如何告诉 csv 阅读器每列的正确数据类型我写了一个二维列表其中每一列都有不同的类型 bool str int 整数列表输出

从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列

从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列 的相关文章

随机推荐

热门标签

从 CSV 文件读取数据并将其从字符串转换为正确的数据类型，包括整数列表列的相关文章