处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

2024-05-30

我正在尝试加载 CSV 文件（这个文件 https://drive.google.com/file/d/13a_eVeSzy6HkhffQw32S57U-hm5YCj0-/view?usp=sharing）创建一个多索引多级数据帧。它有5（五）指标 and 3（三）级在列中。

我该怎么办？这是代码：

df = pd.read_csv('./teste.csv'
                  ,index_col=[0,1,2,3,4]
                  ,header=[0,1,2,3]
                  ,skipinitialspace=True
                  ,tupleize_cols=True)

df.columns = pd.MultiIndex.from_tuples(df.columns)

预期输出：

variables                                                u                  \
level                                                    1                   
days                                                     1               2   
times                                                  00h 06h 12h 18h 00h   
wsid lat        lon        start               prcp_24                       
329  -43.969397 -19.883945 2007-03-18 10:00:00 72.0      0   0   0   0   0   
                           2007-03-20 10:00:00 104.4     0   0   0   0   0   
                           2007-10-18 23:00:00 92.8      0   0   0   0   0   
                           2007-12-21 00:00:00 60.4      0   0   0   0   0   
                           2008-01-19 18:00:00 53.0      0   0   0   0   0   
                           2008-04-05 01:00:00 80.8      0   0   0   0   0   
                           2008-10-31 17:00:00 101.8     0   0   0   0   0   
                           2008-11-01 04:00:00 82.0      0   0   0   0   0   
                           2008-12-29 00:00:00 57.8      0   0   0   0   0   
                           2009-03-28 10:00:00 72.4      0   0   0   0   0   
                           2009-10-07 02:00:00 57.8      0   0   0   0   0   
                           2009-10-08 00:00:00 83.8      0   0   0   0   0   
                           2009-11-28 16:00:00 84.4      0   0   0   0   0   
                           2009-12-18 04:00:00 51.8      0   0   0   0   0   
                           2009-12-28 00:00:00 96.4      0   0   0   0   0   
                           2010-01-06 05:00:00 74.2      0   0   0   0   0   
                           2011-12-18 00:00:00 113.6     0   0   0   0   0   
                           2011-12-19 00:00:00 90.6      0   0   0   0   0   
                           2012-11-15 07:00:00 85.8      0   0   0   0   0   
                           2013-10-17 00:00:00 52.4      0   0   0   0   0   
                           2014-04-01 22:00:00 72.0      0   0   0   0   0   
                           2014-10-20 06:00:00 56.6      0   0   0   0   0   
                           2014-12-13 09:00:00 104.4     0   0   0   0   0   
                           2015-02-09 00:00:00 62.0      0   0   0   0   0   
                           2015-02-16 19:00:00 56.8      0   0   0   0   0   
                           2015-05-06 17:00:00 50.8      0   0   0   0   0   
                           2016-02-26 00:00:00 52.2      0   0   0   0   0

我需要处理错误“TypeError：预期元组，得到 str”：

TypeError: Expected tuple, got str

您收到错误，因为某些列不是元组，它们是索引中的字符串2368 to 2959 in df.columns.
列是字符串的索引：

df.columns[2368:2959]
Index(['('z', '1', '1', '00h').1', '('z', '1', '1', '06h').1',
       '('z', '1', '1', '12h').1', '('z', '1', '1', '18h').1',
       '('z', '1', '2', '00h').1', '('z', '1', '2', '06h').1',
       '('z', '1', '2', '12h').1', '('z', '1', '2', '18h').1',
       '('z', '1', '3', '00h').1', '('z', '1', '3', '06h').1',
       ...
       '('z', '1000', '2', '06h').1', '('z', '1000', '2', '12h').1',
       '('z', '1000', '2', '18h').1', '('z', '1000', '3', '00h').1',
       '('z', '1000', '3', '06h').1', '('z', '1000', '3', '12h').1',
       '('z', '1000', '3', '18h').1', '('z', '1000', '4', '00h').1',
       '('z', '1000', '4', '06h').1', '('z', '1000', '4', '12h').1'],
      dtype='object', length=591)

由于您想要使用元组的多索引列数据框，因此我们首先通过使用必要的子字符串来清理这些字符串re.findall with regex pattern = '(\(.*?\)).'然后将该值传递给ast.literal_eval用于自动将字符串转换为元组。最后，使用pd.MultiIndex.from_tuples as:

df = pd.read_csv('teste.csv',index_col=[0,1,2,3,4],header=[0,1,2,3],parse_dates=True)

import re
import ast

column_list = []
for column in df.columns:
    if isinstance(column,str):
        column_list.append(ast.literal_eval(re.findall('(\(.*?\)).',column)[0]))
    else:
        column_list.append(column)


df.columns = pd.MultiIndex.from_tuples(column_list,
                                       names=('variables', 'level','days','times'))

print(df.iloc[:,:6].head())
variables                                                u                    
level                                                    1                    
days                                                     1               2    
times                                                  00h 06h 12h 18h 00h 06h
wsid lat        lon        start               prcp_24                        
329  -43.969397 -19.883945 2007-03-18 10:00:00 72.0      0   0   0   0   0   0
                           2007-03-20 10:00:00 104.4     0   0   0   0   0   0
                           2007-10-18 23:00:00 92.8      0   0   0   0   0   0
                           2007-12-21 00:00:00 60.4      0   0   0   0   0   0
                           2008-01-19 18:00:00 53.0      0   0   0   0   0   0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas) 的相关文章

如何融化数据框以获取范围内的所有日期？

我有一个这样的数据集 import pandas as pd pd DataFrame col1 1 2 start date 1 3 2019 1 10 2019 end date 1 5 2019 1 12 2019 我想为开始日期和结
Python setup.py 运行 shell 脚本

我需要在创建 Python 包时在 sdist 阶段运行我自己的脚本我写了以下脚本你知道更好的方法吗您能否推荐更好的一个或链接到 setuptools 的官方文档其中已解释了这一时刻 import subprocess import
十六进制转储文件的Pythonic方式

我的问题很简单有什么方法可以用 bash 命令以 Python 方式进行编码吗 hexdump e 2 1 02x file dat 显然不使用 os popen 或任何快捷方式编辑虽然我没有明确指定但如果代码在 Python3
使用 Flask 在 Python 中进行长轮询

我正在尝试在 Flask 框架下使用 JQuery 和 Python 进行长轮询之前在 PHP 中做过长轮询我尝试过以同样的方式进行具有 while true 循环的脚本函数定期检查数据库中的更改例如每 0 5 秒并在发生更改
将行转换为 pandas 中逗号分隔的字符串

我有一个熊猫数据框 from pandas import DataFrame import pandas as pd df2 DataFrame a one one two two three two one six b x y z y x
如何从sqlalchemy中的select语句创建新表？

我正在使用 sqlalchemy 的核心功能来编写一些抽象层该层本身需要能够从 select 语句创建表示例代码 metadata MetaData bind engine table Table table name metadata
Python Turtle 未按照文档示例填充

我试图向我女儿展示一些代码并认为海龟会很有趣我更喜欢数字但这对孩子们来说并不有趣我在重现文档示例时遇到问题这更让我烦恼因为我无法弄清楚我们还有很多其他事情可以做 The documentation example copied
如何设置appache2的WSGI与python 3.7一起使用？

我使用的是 ubuntu 16 04 并安装了 python 3 7 并使用以下说明将其设置为默认值无法在 ubuntu 中将默认 python 版本设置为 python3 https stackoverflow com question
AttributeError：模块“rest_framework.serializers”没有属性“NullBooleanField”

升级后djangorest框架 https pypi org project djangorestframework from djangorestframework 3 13 1 to djangorestframework 3 14 0
如何在不使用太多内存的情况下打乱大型 csv 文件的行并将结果写入新的 csv 文件？

因此如果我有一个 csv 文件如下所示 User Gender A M B F C F 然后我想编写另一个 csv 文件其中行像这样打乱作为示例 User Gender C F A M B F 我的问题是我不知道如何随机选择行并确保
致命Python错误：init_import_size：无法在Anaconda Prompt中导入站点模块

当我启动 Anaconda Prompt 时收到以下错误消息致命 Python 错误 init import size 无法导入站点模块 Python运行时状态已初始化回溯最近一次调用最后一次文件 C Users blue App
带有 pygame 的 Pyinstaller

我曾多次尝试使用 PyInstaller 来捆绑我的 Python2 程序但它似乎从未与 Pygame 模块一起使用我已经看到了有关此主题的许多其他问题但我找不到任何有用的答案有人知道这个问题的解决方案吗我正在尝试在 Ubuntu
使用 Opencv 屏蔽水平线和垂直线

我正在尝试删除该图像中的水平线和垂直线以便拥有更清晰的文本区域我正在使用下面的代码它遵循这个guide https docs opencv org 3 2 0 d1 dee tutorial moprh lines detection
如何正确转义 CSV 中的双引号？

我的 CSV 中有这样一行 Samsung U600 24 10000003409 1 10000003427 旁边引用24用于表示英寸而该引号旁边的引号则关闭该字段我正在读这行fgetcsv但解析器犯了一个错误并将该值读取为 Sam
如何在不重复代码的情况下定义 randint 元组？

我经常使用 randint 元组来表示颜色值等 a b c randint 0 255 randint 0 255 randint 0 255 当我认为必须有更好的方法时有吗使用numpy 1 import numpy as np tu
django 返回记录的最近日期

我正在尝试从用户的多个记录中返回最近的日期当用户创建文档时创建日期存储在 CreatedDocumentDetails 模型中我无法返回用户最近创建的文档的日期我问这个关于SO的问题 https stackoverflow com
创建将一把小提琴按色调分割的小提琴图的正确方法是什么？

创建将一把小提琴分开的小提琴图的正确方法是什么hue 我尝试了不同的方法似乎唯一的方法是创建一个为数据集中的每个条目共享相同值的功能并将该功能的名称传递为x fig plt figure figsize 20 8 fig add sub
Scipy odeint 非负解

显然从 ODE 求解器获得非负解并非易事 https stackoverflow com questions 6977107 solving a delay differential equation dde system constra
“from-import”是否执行整个模块？

好的所以我知道from import与完全相同import 但这显然不是因为命名空间的填充方式不同我的问题主要是因为我有一个utils我的应用程序中的每个其他模块都使用一个或两个函数的模块我正在努力合并标准库logging模块据
Pandas 如何删除包含所需字符串的行

我想删除包含所需字符串的所有行假设我有以下数据框 A B C 1 a x w g n 3 l p j p v 我想删除包含字符串的所有行p 我已经搜索过它但大多数答案都是基于列名称就我而言我不会知道它可以出现在任何列中输出数据帧应

随机推荐

kubectl：在 WSL 终端中找不到

我按照以下说明在 Windows10 上安装了 WSL2 https learn microsoft com en us windows wsl install win10 https learn microsoft com en us w
使用 Crypto++ 和 .NET 的 CFB 模式下的 TripleDES

我正在尝试使用 TripleDES 使用 C 应用程序获得相同的结果该应用程序具有Crypto https www cryptopp com 和 NET应用程序使用三重DESCryptoServiceProvider https msdn
如何找到在SQL Server中注册的程序集？

我在 SQL Server 中注册了一个程序集 CREATE ASSEMBLY CLRFunctions AUTHORIZATION dbo FROM 0x4D5A90000300000 WITH PERMISSION SET SAFE 我
频繁插入已排序的集合

我已经对集合列表进行了排序并且我需要始终保持其排序我目前在我的集合上使用 List BinarySearch 然后在正确的位置插入元素我也尝试过在每次插入后对列表进行排序但性能不可接受有没有一种解决方案可以提供更好的性能也许
什么是 Android DecorView？

http developer android com reference android view Window html getDecorView http developer android com reference android
如何修复 Mapbox GL 中的画布大小？

我正在使用 Mapbox GL 显示地图并从其中心裁剪固定大小的图像它非常适合我设计的特定分辨率 1920x1080 但是当我开始使页面响应时地图样式width and height变化了画布尺寸也开始变化了因此当我裁剪图像时大
列出 J 中数字的数字

我使用的编程语言 J 我想将一个数字的所有数字放入一个列表中 From 12345 to 1 2 3 4 5 我能做些什么我写这个的方式是 10 1 我们可以看到它与这句话的使用 10 1 123456789 1 2 3 4 5 6 7
亚马逊 CloudFront 延迟

我正在为我正在开发的 Web 应用程序尝试使用 AWS S3 和 CloudFront 在应用程序中我允许用户将文件上传到 S3 存储桶使用 AWS SDK 并通过 CloudFront CDN 提供该文件但问题是即使文件已上传并在
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1
检查 FTP 文件夹是否存在任何与掩码匹配的文件的批处理文件

我需要创建一个批处理文件来访问受保护的 FTP 站点检查文件类型 txt 存在如果存在则进行下一步如果不存在则返回0并结束作业我进行了广泛的搜索但找不到任何解决方案这不是一项简单的任务特别是当您需要检查与掩码匹配的文件而不是
文件和目录条目 API 在 Chrome 中损坏？

我正在尝试使用文件和目录条目 API 创建一个文件上传器工具该工具允许我将文件和目录的任意组合放入浏览器窗口中以供读取和上传我完全意识到可以通过使用文件输入元素来实现类似的功能webkitdirectory已启用但我正在测试一个用
python：日志记录：我们可以向记录器添加多个过滤器吗？考虑哪一个

我试图了解 Python 日志记录中的多个过滤器一个在配置中定义另一个在代码中定义如何工作我正在开发一个 Django 项目下面是我在 settings py 中的记录器配置我的目标是switch on and switch o
尽管 getBoundingClientRect() 是假的，但如何将事件坐标转换为 SVG 坐标？

我正在尝试根据鼠标的位置在 SVG 元素上动态绘制内容不幸的是我很难将 mousemove 事件中的鼠标坐标转换为 SVG 元素的坐标空间这是我一直在测试的一个有缺陷的函数 CylinderDemo prototype handleM
安装 JDK 时出错：keytool 命令需要已安装的 proc fs (/proc)。 Linux 的 Windows 子系统

我尝试在 Linux 的 Windows 子系统 Ubuntu 14 04 上安装 Oracle JDK 1 7 但出现以下错误 the keytool command requires a mounted proc fs proc Jav
如何从 Pandas 数据框函数调用中回顾之前的行？

我正在研究回测交易系统我有一个包含 OHLC 数据的 Pandas 数据框并添加了几个计算列 https stackoverflow com questions 12376863 adding calculated columns t
错误“RESOURCE_EXHAUSTED”的原因是什么？

我有一个 WordPress 博客当我登录到仪表板时顶部突出显示了以下异常 Ga Lib Api Request Exception There was an error while contacting Google API erro
如何在 flutter 中获取应用内购买的唯一标识符，该标识符始终保持不变

我正在使用在应用程序内购买 https pub dev packages in app purchase我的 Flutter 应用程序的包我的应用程序中有一项非消耗性应用内购买每个用户创建一个用户帐户使用 Firebase 身份验证
应用非限定名称查找而不是依赖于参数的名称查找

考虑标准 sec 3 4 1 3 中的一个示例 typedef int f namespace N struct A friend void f A operator int void g A a int i f a f is the ty
用于替换前 5 个数字的正则表达式，无论它们之间有什么？

我正在努力实现以下匹配 Input 123 45 6789 123456789 1234 正则表达式尝试输出 d 5 123 45 6789 123456789 1234 d 2 3 123 45 6789 123456789 1234 d
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指

处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas) 的相关文章

随机推荐

热门标签