错误：pandas 哈希表 keyerror

2024-04-08

我已经使用 pandas 成功读取了 csv 文件。当我尝试从数据框中打印特定列时，我收到关键错误。特此，我分享带有错误的代码。

import pandas as pd
reviews_new = pd.read_csv("D:\\aviva.csv")
reviews_new['review']

reviews_new['review']
Traceback (most recent call last):
  File "<ipython-input-43-ed485b439a1c>", line 1, in <module>
    reviews_new['review']
  File "C:\Users\30216\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\frame.py", line 1997, in __getitem__
    return self._getitem_column(key)
  File "C:\Users\30216\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\frame.py", line 2004, in _getitem_column
    return self._get_item_cache(key)
  File "C:\Users\30216\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\generic.py", line 1350, in _get_item_cache
    values = self._data.get(item)
  File "C:\Users\30216\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\internals.py", line 3290, in get
    loc = self.items.get_loc(item)
  File "C:\Users\30216\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\indexes\base.py", line 1947, in get_loc
    return self._engine.get_loc(self._maybe_cast_indexer(key))
  File "pandas\index.pyx", line 137, in pandas.index.IndexEngine.get_loc (pandas\index.c:4154)
  File "pandas\index.pyx", line 159, in pandas.index.IndexEngine.get_loc (pandas\index.c:4018)
  File "pandas\hashtable.pyx", line 675, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12368)
  File "pandas\hashtable.pyx", line 683, in pandas.hashtable.PyObjectHashTable.get_item (pandas\hashtable.c:12322)
KeyError: 'review'

有人可以帮我吗？

我认为首先最好调查一下，什么是真正的列名，如果转换为列表更好，会看到一些空格或类似的：

print (reviews_new.columns.tolist())

我认为可能有两个问题（显然）：

1.列名中的空格（也可能在数据中）

解决方案是strip http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.strip.html列名中的空格：

reviews_new.columns = reviews_new.columns.str.strip()

或者添加参数skipinitialspace to read_csv http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html:

reviews_new = pd.read_csv("D:\\aviva.csv", skipinitialspace=True)

2.默认分隔符不同,

解决办法是添加参数sep:

#sep is ;
reviews_new = pd.read_csv("D:\\aviva.csv", sep=';')
#sep is whitespace
reviews_new = pd.read_csv("D:\\aviva.csv", sep='\s+')
reviews_new = pd.read_csv("D:\\aviva.csv", delim_whitespace=True)

EDIT:

您在列名称中出现空格，因此需要1.solutions:

print (reviews_new.columns.tolist())
['Name', ' Date', ' review'] 
          ^        ^

EDIT1:

如果没有列名 if 测试print (df.columns.tolist())并且无法选择 DataFrame 解决方案的第一个“列”df.index:

df = pd.DataFrame({'col':list('abc'),
                   'col1':list('efg'),
                   'col2':range(3)}).set_index('col1')

print (df)
     col  col2
col1          
e      a     0
f      b     1
g      c     2


print (df.columns.tolist())
['col', 'col2']

print (df.index)
Index(['e', 'f', 'g'], dtype='object', name='col1')

print (df.index.get_level_values('col1'))
Index(['e', 'f', 'g'], dtype='object', name='col1')

如果存在多重索引：

df = pd.DataFrame({'col':list('abc'),
                   'col1':list('efg'),
                   'col2':range(3)}).set_index(['col1', 'col'])

print (df)
          col2
col1 col      
e    a       0
f    b       1
g    c       2

print (df.index)
MultiIndex([('e', 'a'),
            ('f', 'b'),
            ('g', 'c')],
           names=['col1', 'col'])

print (df.index.get_level_values('col1'))
Index(['e', 'f', 'g'], dtype='object', name='col1')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

错误：pandas 哈希表 keyerror 的相关文章

NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

iOS 14 上的 Arkit/SceneKit 抛出新警告（金属）

自从升级到 iOS14 以来每当我向场景添加基本节点时我都会收到金属警告我不使用任何阴影只使用标准材质 2020 09 24 18 51 04 548764 0100 Arvie AR 383 7987 Metal Compiler
C++：在 switch 语句内构造数组

我正在尝试构建一个具有几种不同配置的数组其中将随机选择一个配置我首先尝试的代码是 void createArray int tileVals int randInt rand 3 switch randInt case 0 int ti
从列表中删除重复值的最佳算法

从列表中删除重复值的最佳算法是什么我试过这个 for int i 0 i lt AuthorCounter 1 i for int j 0 j lt AuthorCounter 1 j if i j if AuthorGroupNode
Dapper AddDynamicParams 用于 Postgres 中带有 IEnumerable 参数的 IN 查询

首先我遇到了与两年前讨论过的相同问题据称该问题已得到解决有关该问题请参阅以下问题 Dapper AddDynamicParams for IN 语句具有动态参数名称 https stackoverflow com questi
!!~ （不是波浪线/bang bang 波浪线）如何改变“包含/包含”数组方法调用的结果？

如果您阅读 jQuery 上的评论inArray page here http api jquery com jQuery inArray 有一个有趣的声明 jQuery inArray elm arr 现在我相信双感叹号会将结果转换为类
为什么关系数据库存在可扩展性问题？

最近我在网上看到一些文章指出关系数据库存在扩展问题在大数据方面不太好用特别是在数据量很大的云计算中但通过谷歌搜索我找不到充分的理由来解释为什么它的可扩展性不高您能解释一下关系数据库在可扩展性方面的局限性吗 Thanks 想象一下
如何确定单词的概率？

我有两份文件 Doc1 的格式如下 TOPIC 0 5892 0 site 0 0371690427699 Internet 0 0261371350984 online 0 0229124236253 web 0 021894093686
存储过程超时 - 但从 SSMS 运行时正常

我有一个存储过程错误提示超时已过期涉及的代码是ADO VB6 存储过程本身没有问题您可以在查询窗口中运行它并且需要不到一秒钟的时间用于获取连接等的代码也是模块化的并在大型应用程序中使用在一个特定数据库上仅在这一位置发生超时
命名空间“Microsoft.AspNetCore.Razor”中不存在类型或命名空间名称“Hosting”

我使用 Visual Studio 创建了一个项目 NET Core 2 1 SDK React 模板我在运行项目时遇到以下错误缺少一个或多个编译参考确保您的项目引用 Microsoft NET Sdk Web 并且 Preserve
模拟器中的 UIView 边界/绘图不正确

我创建了一个单视图测试应用程序并添加了UIButton and UIView to the UIViewController在主故事板中我已将按钮和视图的大小调整为相同的大小在我的 VC 的 viewDidAppear animated
通过下拉菜单链接到 HTML 中的其他页面

我正在尝试通过下拉菜单链接到其他 html 页面并且我尝试了各种代码但似乎无法使其工作我正在使用这段代码
Python：确定数字是否为平方、立方等的函数[重复]

这个问题在这里已经有答案了我的简单问题是创建一个函数来确定数字 N 是否可以写成a n对于某些给定的 n 即我需要检查是否N 1 n 是一个整数不知何故这个函数会产生错误的结果 def is power N n r float N 1
如何将 Address 对象数组传递给另一个 Activity

我正在尝试传递一系列Address http developer android com reference android location Address html通过 Intent 对象传递给另一个 Activity 的对象由于 A
值注释在 Junit 测试中不起作用

SpringBootTest public class RuleControllerTest Value myUrl private String myUrl private HttpClient httpClient HttpClient
在 C# 中处理非验证 SSL 证书的最佳方法是什么

我使用以下代码来确保所有证书都通过甚至是无效的证书但我想知道是否有更好的方法因为此事件被全局调用而我只希望证书通过某个 HTTP 调用而不是对于任何其他异步发生的事情 This delegate makes sure that no
保存 Excel 文档 Apache POI

我需要从 Excel 文档创建信息我使用 Java 和 Apache POI 这是我的代码 Get path with JFileChooser public static String LeeRuta JFileChooser choo
CATransform3D 旋转导致一半图像消失

我使用以下代码来旋转图像但已旋转到页面之外的图像的一半沿 y 轴向下消失了怎么修 heading以弧度为单位 CALayer layer myUIImageView layer CATransform3D rotationAnd
禁用“使用 use strict 的函数形式”，但保留“缺少 'use strict' 语句”警告

我正在使用 jslint 来验证我的代码我的所有页面上都有 use strict 如何禁用消息使用 use strict 的函数形式但保留缺少 use strict 语句警告这样我就不会忘记将其放在新文件中 Thanks 根据克
free 不会删除分配给指针（int 数组）的内存，使用 free 两次可以工作，为什么？

这是出于好奇我试图找到我对之前问题的疑问的答案但他们似乎没有答案所以在这里询问我刚刚编写了一段代码试图将内存分配给 int 指针以填充数组并扫描 int 值一旦我完成了数组我想删除分配给指针的数据内存尽管我的代码工作正
错误：pandas 哈希表 keyerror

我已经使用 pandas 成功读取了 csv 文件当我尝试从数据框中打印特定列时我收到关键错误特此我分享带有错误的代码 import pandas as pd reviews new pd read csv D aviva csv

错误：pandas 哈希表 keyerror

错误：pandas 哈希表 keyerror 的相关文章

随机推荐

热门标签