pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表

2024-04-27

来自 R 背景，我发现（非常高）使用Indexpandas 中的对象有点令人不安。例如，如果train是一个pandas DataFrame，有什么特殊原因吗train.columns应该返回一个Index而不是一个列表？如果它是一个Index目的？根据定义pandas.Index，它是所有 pandas 对象存储轴标签的基本对象。尽管train.index.values确实返回行标签（轴=0），我如何从中获取列标签或列名称pandas.index？与之前的问题不同，在这个问题中，我想到了一个具体的例子。

A pd.Index是列名的类似数组的容器，因此从某种意义上说，询问如何从索引中获取标签是没有意义的，因为索引is标签。

也就是说，您始终可以使用以下命令获取底层 numpy 数组df.columns.values，或者转换为 python 列表tolist()正如@Mitch 所示。

就为什么在裸数组上使用索引而言 -Index提供整个 pandas 中使用的额外功能/性能 - 其核心是基于哈希表的索引。

例如，考虑以下框架/列。

df = pd.DataFrame(np.random.randn(10, 10),
                  columns=list('abcdefghkm'))

cols = df.columns

cols
Out[16]: Index(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'k', 'm'], dtype='object')

现在假设您要选择列'h'脱离框架。对于列的列表或数组版本，您可以循环遍历列以查找'h'，即O(n)在列数中 - 像这样：

for i, col in enumerate(cols):
    if col == 'h':   
        found_loc = i
        break

found_loc
Out[18]: 7

df.values[:, found_loc]
Out[19]: 
array([-0.62916208,  2.04403495,  0.29498066,  1.07939374, -1.49619915,
       -0.54592646, -1.04382192, -0.45934113, -1.02935858,  1.62439231])

df['h']
Out[20]: 
0   -0.629162
1    2.044035
2    0.294981
3    1.079394
4   -1.496199
5   -0.545926
6   -1.043822
7   -0.459341
8   -1.029359
9    1.624392
Name: h, dtype: float64

随着Index，pandas 构造了一个列值的哈希表，因此找到 'h' 的位置是一个摊销O(1)操作，通常要快得多，特别是当列数很大时。

df.columns.get_loc('h')
Out[21]: 7

此示例仅选择单个列，但正如 @ayhan 在评论中指出的那样，相同的哈希表结构还加速了许多其他操作，如合并、对齐、过滤和分组。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表的相关文章

如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
如何在算术表达式的结果上添加 SQLAlchemy 标签？

我如何将这样的东西翻译成 SQLAlchemy select x y as difference 我知道该怎么做 x label foo 但我不确定在哪里放置下面的 label 方法调用 select table c x table c y
返回不包括指定键的字典副本

我想创建一个函数返回字典的副本不包括列表中指定的键考虑这本词典 my dict keyA 1 keyB 2 keyC 3 致电without keys my dict keyB keyC 应该返回 keyA 1 我想用一行简洁的字典理
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
如何使用注释和聚合在 Django 的 ORM 中执行此 GROUP BY 查询

我真的不知道如何翻译GROUP BY and HAVING到姜戈的QuerySet annotate and QuerySet aggregate 我正在尝试将这个 SQL 查询转换为 ORM 语言 SELECT EXTRACT year
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
如何使用to_sql将pandas数据帧写入oracle数据库？

我是一个新的oracle学习者我正在尝试将 pandas 数据帧写入 oracle 表中经过网上研究我发现代码本身很简单但我不知道为什么我的代码不起作用我已经从本地文件中读取了 pandas 数据框 import cx Oracl
如何表示类的实例与将其作为输入的类之间的关系？

我有一堂课叫House 这个类的实例是house class House def init self height length self height height self length length def housePlan hou
本地设置的 Cython 编译器指令是否影响一个或所有函数？

我正在努力使用 Cython 加速一些 Python Numpy 代码并且对本地设置如定义的here http docs cython org en latest src reference compilation html在文档中
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
Python“self”关键字[重复]

这个问题在这里已经有答案了我是 Python 新手通常使用 C 最近几天开始使用它在类中是否需要在对该类的数据成员和方法的任何调用前添加前缀因此如果我在该类中调用方法或从该类获取值我需要使用self method or sel
字母尺度和随机文本上的马尔可夫链

我想使用 txt 文件中的一本书中的字母频率生成随机文本以便每个新字符 string lowercase 取决于前一个如何使用马尔可夫链来做到这一点或者使用每个字母都有条件频率的 27 个数组更简单我想使用来自的字母频率生成随机文本
获取运行云功能的运行时服务帐户

有没有办法以编程方式从云功能获取运行时服务帐户的电子邮件我知道我可以猜测默认的 App Engine 帐户因为它始终是 appspot gserviceaccount com 但这不是我想要的我本来期待有一些环境变量 https
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

类型双关：省略放置 new 和析构函数

已经有很多关于严格别名规则和类型双关的帖子但我找不到我可以理解的关于对象数组的解释我的目标是拥有一个内存池非模板类用于存储对象数组基本上我只需要在访问时知道实际类型它可以被视为一个非模板向量其迭代器将是模板我想到的设计提出了几
从 Scala/Spark 写入 SQL Server 日期时间数据类型

我正在尝试使用类似的方法从 databricks 笔记本批量插入 SQL Server 表批量复制到 Azure SQL 数据库或 SQL Server https docs databricks com spark latest dat
Prism 6 区域管理器 RequestNavigate 无法导航某些区域

我有一个用户控件其中定义了多个用于注入视图的 Prism 区域我决定使用 Prism 视图导航来处理切换我的 SelectedMenuContentRegion 基于用户操作如下所示我遇到了问题我确信问题出在我的使用上但我无法
更改WinForm中标题栏的颜色

是否可以在 C 中更改 WinForm 标题栏的颜色 Form1 X lt I want to change the color of this 我解决了这个问题这是代码 DllImport User32 dll CharSet Char
使用 Javascript/CSS 设置 IE“光学变焦”功能

我维护的网站的设计相当严格使用像素来表示字体大小尺寸绝对定位等现在有一个功能请求要求添加用户调整字体大小的功能虽然我知道如果不使用相对尺寸从头开始重新设计网站这是不可能的但我发现该网站与 IE7 IE8 缩放功能 Ctrl
如何将 HTML 代码转换为 JSON 对象？

我正在构建一个 Angular 7 应用程序在此应用程序中我让用户编辑 HTML 然后我希望将其转换为 JSON 以便以有意义的方式存储它简而言之我想获取任何 HTML 代码并将其处理为 JSON 对象我怎样才能做到这一点我会将
WPF/Silverlight 中的动画资源？

我正在寻找一些好的资源来增强 WPF Silverlight 中使用的动画故事板概念有什么指点吗发布的一个链接是 WPF 特定的对于 Silverlight 这里还有一些其他资源 MSDN 动画概述 http msdn micros
UnsatisfiedLinkError：dlopen 失败：无法找到引用的符号“__aeabi_memcpy4”

我刚刚从 NDK 12 x 更新到 13 x 现在遇到以下崩溃 Caused by java lang UnsatisfiedLinkError dlopen failed cannot locate symbol aeabi memcpy
android dexclassloader 获取所有类的列表

我在我的 Android 应用程序中使用来自 asset 或 sdcard 的外部 jar 为此我使用 DexClassLoader DexClassLoader cl new DexClassLoader dexInternalStor
使用 Android SDK 随机访问文件 > 2GB

谁能告诉我如何使用 android SDK 随机访问超过 2GB 的文件我试图寻找 gt 2147483647 的位置并得到异常值对于定义的数据类型来说太大这很奇怪因为查找命令的参数是 long 类型详细内容请参见代码示例 Ran
Python 中是否有 Mechanize 的替代方案？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在使用Python 3 6 而我必须填写表格不幸的是 mechanize 不适用于 Python 3 作为机械化的替代方案您有何建
水平滚动视图无法正常工作 swiftUI

我试图显示一些水平视图但它不起作用下面是我正在使用的代码 State var userDataList UserModel var body some View VStack spacing 10 VStack prefView pad
iOS App 中 AVAudioPlayer 和 MPMusicPlayerController 的独立音量控制。

在我的应用程序中我使用 AVAudioPlayer 播放下载的音频同时使用 MPMusicPlayerController 播放用户 iPod 音乐库中的音频我需要能够调整 AVAudioPlayer 实例的音量使其声音更大比来自
为什么 GCC 9.1.0 有时会抱怨 strncpy() 的这种使用？

这是一个 40 行 MCVE 最小完整可验证的示例 https stackoverflow com help mcve 或者接近最小的东西从最初包含 32 个标头的 1675 行源文件中删减其中大多数包含多个其他标头编译它gcc
gcc 如何知道内联汇编中使用的寄存器大小？

我有内联汇编代码 define read msr index buf asm volatile rdmsr d buf 1 a buf 0 c index 使用该宏的代码 u32 buf 2 read msr 0x173 buf 我发现反汇
如何在活动脚手架导轨 3 中添加新链接

我需要在我的出租车列表页面中添加一个新链接地图我使用的是 active scaffold 和 Rails 3 2 1 我当前的页面如下所示我需要在每条记录中显示类似于编辑删除显示的链接地图在我的数据库中我有字段名称纬度经
你怎么知道无限长的承诺链何时完全结束？

我试图使用 Promise 强制序列化一系列 Ajax 调用用户每次按下按钮时都会进行这些 Ajax 调用我可以成功地序列化操作如下所示 sample async function real world this is an Ajax
在 MS 企业库或 Log4net 等第 3 方组件上创建包装器是一个好习惯吗？

这更像是一个很好的练习题我想提供不同的通用库如日志记录缓存等有很多第三方库如 MS 企业库 log4Net NCache 等我想知道直接使用这些服务或在每个服务上创建包装器并使用 DI 在代码中注入该服务是否是一个好习惯 reg
C++ iostream 的自定义操纵器

我想为 ostream 实现一个自定义操纵器以对插入流中的下一个项目进行一些操作例如假设我有一个自定义操纵器quote std ostringstream os std string name Joe os lt lt SELECT
pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表

来自 R 背景我发现非常高使用Indexpandas 中的对象有点令人不安例如如果train是一个pandas DataFrame 有什么特殊原因吗train columns应该返回一个Index而不是一个列表如果它是一个Ind

pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表

pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表 的相关文章

随机推荐

热门标签

pandas 中的索引对象——为什么 pd.columns 返回索引而不是列表的相关文章