Pandas 使用什么规则来生成视图和副本？

2024-05-11

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑。

例如，如果我有，

df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9))

我明白，一个query返回一个副本，这样就像

foo = df.query('2 < index <= 5')
foo.loc[:,'E'] = 40

对原始数据框没有影响，df。我还了解标量或命名切片返回一个视图，以便对这些进行赋值，例如

df.iloc[3] = 70

df.ix[1,'B':'E'] = 222

会改变df。但当涉及到更复杂的情况时，我就迷失了。例如，

df[df.C <= df.B] = 7654321

changes df, but

df[df.C <= df.B].ix[:,'B':'E']

才不是。

Pandas 是否使用了我所缺少的简单规则？这些具体案例中发生了什么；特别是，如何更改数据框中满足特定查询的所有值（或值的子集）（正如我在上面的最后一个示例中尝试做的那样）？

注意：这与这个问题 https://stackoverflow.com/q/17960511/656912;我已经读过文档 http://pandas.pydata.org/pandas-docs/dev/indexing.html#returning-a-view-versus-a-copy，但我并没有受到启发。我还阅读了有关此主题的“相关”问题，但我仍然缺少 Pandas 使用的简单规则，以及如何将其应用于（例如）修改值（或值的子集）在满足特定查询的数据框中。

这是规则，后续覆盖：

所有操作都会生成一个副本
If inplace=True提供后，它将就地修改；只有部分操作支持此功能
一个索引器，设置，例如.loc/.iloc/.iat/.at将设置到位。
获取单一数据类型对象的索引器几乎总是一个视图（取决于内存布局，它可能不是，这就是为什么它不可靠）。这主要是为了效率。（上面的例子是针对.query;这会always返回一个副本，其评估方式为numexpr)
获取多数据类型对象的索引器始终是副本。

你的例子chained indexing

df[df.C <= df.B].loc[:,'B':'E']

不保证工作（因此你应该never做这个）。

相反，做：

df.loc[df.C <= df.B, 'B':'E']

因为这是faster并将永远有效

链式索引是两个独立的 python 操作，因此不能被 pandas 可靠地拦截（你经常会得到一个SettingWithCopyWarning，但这也不是 100% 可检测到的）。这dev docs http://pandas-docs.github.io/pandas-docs-travis/indexing.html#indexing-view-versus-copy您指出的，提供了更完整的解释。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 使用什么规则来生成视图和副本？的相关文章

如何在 Postgresql 中将 GIST 或 GIN 索引与 hstore 列一起使用？

我正在使用 postgresql 9 3 的 hstore 我正在尝试对 hstore 列使用索引就像文档所述 http www postgresql org docs 9 3 static hstore html 我的问题是索引似乎没有被
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
按边距（“全部”）值列对 Pandas 数据透视表进行排序

我试图根据 pandas 数据透视表中的行总和对最后一列边距 aggrfunc 进行降序排序我知道我在这里错过了一些简单的东西但我无法弄清楚数据框数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
索引在 NOT IN 或 <> 子句中起作用吗？

我读过至少 Oracle 数据库中的普通索引基本上是 B 树结构因此存储处理适当根节点的记录小于根的记录被迭代地存储在树的左侧部分而大于根的记录被存储在右侧部分正是这种存储方法有助于通过树遍历实现更快的扫描因为深度和广度都
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

mocha——手表和猫鼬模型

如果我让 mocha 监视更改每次保存文件时 mongoose 都会抛出以下错误 OverwriteModelError 无法覆盖Client模型一旦编译我知道猫鼬不允许两次定义模型但我不知道如何让它与mocha watch clie
如何调试.NET Windows Service OnStart方法？

我用 NET 编写的代码仅在作为 Windows 服务安装时才会失败该故障甚至不允许服务启动我不知道如何进入 OnStart 方法如何调试 Windows 服务应用程序 http msdn microsoft com en us l
如何在查询中生成序列号？

我们使用 PostgreSQL v8 2 3 如何在查询输出中生成序列号我想显示查询返回的每一行的序列号例子 SELECT employeeid name FROM employee 我希望生成并显示从一开始的每一行的序列号你有两个选
如何使用 javascript 禁用组合键？

I would like to disable view source shortcut key for IE using JavaScript To disable Ctrl C I am using the following func
超慢的表格布局性能

我遇到了糟糕的 TableLayout 性能我在这里读过一些帖子谈论同样的事情 Android 动态创建表性能不佳 https stackoverflow com questions 9813427 android dynamical
pdflatex: \includegraphics{} -> 找不到文件

首先我知道这个问题已经存在了成百上千次但我在过去四个小时内找到的给出的答案都没有解决我的具体问题我在这里变得疯狂我将非常感谢任何帮助和建议尝试编译一个非常简单的 tex 文件其中包括包括图形命令我最终收到文件未找到错误
AS3 [Event(name="", type="")]，有什么意义？

我使用 FlashDevelop3 R2 和 Flex 3 3 SDK 进行开发在很多情况下我必须使用嵌入元数据标签如下所示 Embed source path to file private var Asset Class 我很好地理
Spring Oauth2. DaoAuthenticationProvider 中未设置密码编码器

我对 Spring Oauth 和 Spring Security 很陌生我正在尝试在我的项目中使用 client credentials 流程现在我设法使用自己的 CustomDetailsS ervice 来从系统中已存在的数据库
通过API更新Twitter背景

我在通过 Twitter 的 API 更新背景时遇到了一些问题 target url http www google com logos 11th birthday gif ch curl init curl setopt ch CURLO
用于验证 InetSocketAddresses 的正则表达式（ipv4/v6 + 端口地址）

我在寻找testedipv4 和 ipv6 的正则表达式InetSocket地址 http download oracle com javase 6 docs api java net InetSocketAddress html toSt
在 WebView 中打开 PDF 文件

大约 2 天我尝试在我的自定义中打开 PDF 文件WebvView 这是我的WebView code import android app AlertDialog import android app ProgressDialog imp
当我移动我的 pygame 角色时，它会留下痕迹[重复]

这个问题在这里已经有答案了我一直在尝试用 Python 制作一个游戏但是当我移动我的角色时它会留下痕迹我知道它并没有显示出那么多但如果你靠近的话你可以看到这条踪迹这真的让我很困扰这是我的代码 import pygame im
jQuery异步ajax查询和返回值问题（范围、闭包）

由于异步查询和变量范围问题代码无法正常工作我不明白如何解决这个问题使用 async false 更改为 ajax 方法不是一个选项我知道闭包但我如何在这里实现它不知道我已经在这里看到了有关 js 中的闭包和 jQuery 异
Win7下Jupyter Notebook中撤消文本输入

我很惊讶我没有在 Win7 下的 Jupyter Notebook 上或在网络上找到这个问题的答案我只是错误地覆盖了调用块的大部分但不是全部自动保存可以追溯到之前的一些我不想恢复的更改 Jupyter Notebook 中文本输入的撤
android中ScrollView中的图像

在我的应用程序中我想放置一个 png 文件并且希望它在横向和纵向模式下都被视为滚动图像请建议代码或示例要使您的 Imageview 在高度不适合时滚动您可以在 xml 中的 ScrollView 内添加一个 ImageView 并
即使在 Excel 2007 中插入行时也保持绝对引用

我有一个电子表格我希望单元格公式始终查看特定单元格即使插入行或列并且特定单元格移动也是如此实际上我总是想查看表格的顶部单元格即使在表格顶部插入了新行例如单元格 A2 的公式为 E 2 现在我突出显示第 1 行并执行插入行
std::make_pair 与浮点数组（float2，无符号整数）

我有一个用 float2 unsigned int 对模板化的向量例如 std vector
当我们第一次部署 WAR 文件时，某些代码可以运行吗？

是否有任何方法或 API 可以使用以便每当我部署新的 WAR 文件时部分代码都应该执行或者当 Tomcat 启动时相应的 servlet 应该连续启动或运行一些代码恢复一个老问题因为唯一的答案没有显示任何例子为了在部署取消部
返回即将推出的 YouTube API V3 视频安排日期？

我想要返回 YouTube 中的直播的安排日期 Example of scheduled streams YT链接 https www youtube com channel UCP7jMXSY2xbc3KCAE0MHQ A https w
Pandas 使用什么规则来生成视图和副本？

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑例如如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index

Pandas 使用什么规则来生成视图和副本？

Pandas 使用什么规则来生成视图和副本？ 的相关文章

随机推荐

热门标签

Pandas 使用什么规则来生成视图和副本？的相关文章