如何在多索引 Pandas 数据框中按组更新前 N 行的值？

2023-12-06

我正在尝试更新多索引数据框中的前 N 行，但在寻找解决方案时遇到了一些麻烦，所以我想为它创建一个帖子。

示例代码如下：

# Imports
import numpy as np
import pandas as pd

# Set Up Data Frame
dates = pd.date_range('1/1/2000', periods=8)
df = pd.DataFrame(np.random.randn(8, 4), columns=['A', 'B', 'C', 'D'])
df['DATE'] = dates
df['CATEGORY'] = ['A','B','A','B','A','B','A','B']

# Set Index
df.set_index(['CATEGORY','DATE'],inplace=True)
df.sort(inplace=True)

# Get First Two Rows of Each Category
df.groupby(level=0).apply(lambda x: x.iloc[0:2])

# Set The Value of Column 'C' Equal to Zero
# ???

因此，我能够使用“iloc”选择行，但之后我不确定如何将“C”列设置为零。感觉也许我的处理方式是错误的。任何帮助将不胜感激。谢谢！

怎么样？首先定义一个函数，它接受一个数据帧，并用指定的值替换前 x 条记录。

def replace_first_x(group_df, x, value):
    group_df.iloc[:x, :] = value
    return group_df

然后，将其传递到groupby对象与应用。

In [97]: df.groupby(level=0).apply(lambda df: replace_first_x(df, 2, 9999))
Out[97]: 
                               A            B            C            D
CATEGORY DATE                                                          
A        2000-01-01  9999.000000  9999.000000  9999.000000  9999.000000
         2000-01-03  9999.000000  9999.000000  9999.000000  9999.000000
         2000-01-05     1.590503     0.948911    -0.268071     0.622280
         2000-01-07    -0.493866     1.222231     0.125037     0.071064
B        2000-01-02  9999.000000  9999.000000  9999.000000  9999.000000
         2000-01-04  9999.000000  9999.000000  9999.000000  9999.000000
         2000-01-06     1.663430    -1.170716     2.044815    -2.081035
         2000-01-08     1.593104     0.108531    -1.381218    -0.517312

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

multiindex

如何在多索引 Pandas 数据框中按组更新前 N 行的值？的相关文章

如何使用 lstm 执行多类多输出分类

I have multiclass multioutput classification see https scikit learn org stable modules multiclass html https scikit lear
scikit-learn LinearRegression 的意外交叉验证分数

我正在尝试学习使用 scikit learn 来完成一些基本的统计学习任务我认为我已经成功创建了适合我的数据的线性回归模型 X train X test y train y test cross validation train test
Pandas：根据其他多级列对最里面的列进行分组排序

考虑下面的 df In 3771 df pd DataFrame A a 11 B b 11 C C1 C1 C2 C1 C3 C3 C2 C3 C3 C2 C2 D D1 D2 D1 D3 D3 D2 D4 D4 D1 D2 D3 E v
检查字符串是否以 XXXX 开头

我想知道如何在Python中检查字符串是否以 hello 开头在 Bash 中我通常这样做 if string hello then do something here fi 我如何在Python中实现同样的效果 aString hell
Plotly - 不同颜色的表面

我正在尝试在 Plotly for Python 中绘制多个曲面每个曲面具有不同的颜色具体来说表面显示了在相空间中不同点采取行动的预测奖励函数由于我在每个点都有多个可能的操作因此每个点都是不同的表面我想对每个表面进行独特的着色
在python中浏览ftp目录

我正在尝试使用 ftplib 使用 Python 3 从 ftp 服务器下载多个文件夹我有一个文件夹名称列表它们都位于文件夹 root 中问题是我不知道如何浏览它们当我使用cwd我可以进入更深的目录但是如何再次起来呢我正在尝试得
Pandas Dataframe.to_csv 小数=',' 不起作用

在 Python 中我正在将 Pandas Dataframe 写入 csv 文件并希望将小数分隔符更改为逗号像这样 results to csv D Data Kaeashi BigData ProcessMining Voorbe
如何消除 matplotlib 轴的相对偏移

当我尝试对具有足够大数字的范围进行绘图时我得到一个所有刻度都有相对偏移的轴例如 plot 1000 1001 1002 1 2 3 我在横坐标轴上得到这些刻度 0 0 0 5 1 0 1 5 2 0 1e3 问题是如何删除 1e3并得到
ctypes.ArgumentError：不知道如何转换参数

我在C库中定义了一个函数如下所示 int Test char str1 int id1 char str2 float val float ls 我想在Python中使用它所以我编写了以下Python代码 str1 a str2 b i
如何在Python模拟中调用模拟方法

我想创建一个模拟方法来调用被模拟的底层方法我正在想象类似以下的内容但我找不到任何有关模拟对象的文档该对象包含对被模拟对象的引用我将其表示为 wrapped method foo below from mock import patc
如何在 PySide/PyQt 中制作一个位于屏幕中央的小部件？

这段代码有效但我想知道是否有更简单的方法 def center self qr self frameGeometry cp gui QDesktopWidget availableGeometry center qr moveCenter
中断QThread睡眠

我想知道如何暂停 QThread 然后在收到信号时恢复我已阅读并知道我可以做这样的事情 def run self self ready False while not self ready self sleep 1 QtCore Slot
Django 自定义查询集过滤器

在 Django 中是否有一种标准方法可以为查询集编写复杂的自定义过滤器就像我能写的一样 MyClass objects all filter field val 我想做这样的事情 MyClass objects all filter
os.path.expanduser("~") 的替代方案？

在Python 2 7 x中 os path expanduser Unicode 已损坏这意味着如果的扩展中包含非 ASCII 字符则会出现异常 http bugs python org issue13207 http bugs p
通过 Tweepy 在 Twitter 上更新状态时的回溯

我一直在尝试使用 Twitter 在 Twitter 上发布我的 Rpi 读数tweepy 但首先我想检查一下是否tweepy本来可以正常工作但事实并非如此我正确安装了软件包但是当我尝试运行简单的代码来发布某些内容时出现错误是的
带有 graphviz_layout 的水平树

在Python中使用networkx 我可以用以下方法绘制垂直树 g nx balanced tree 2 4 pos nx graphviz layout g prog dot nx draw g pos labels b all no
如果我更改当前工作目录，为什么 __file__ 会变成无效路径？

执行中test py from tmp import os print os path abspath file os chdir var print os path abspath file output tmp test py var
从 s3 获取 ogg 轨道的长度而不下载整个文件

如何在不下载整个文件的情况下获取 ogg 文件的播放长度我知道这是可能的因为 HTML5 标签和 VLC 都可以在加载 URL 后立即显示整个播放长度而无需下载整个文件有标题或我可以阅读的内容吗也许甚至是比特率我可以将其除以文件
每次 apache 重新启动时，flask-login 会话都会被破坏

我正在使用烧瓶登录https github com maxcountryman flask login https github com maxcountryman flask login和领域记住登录用户 http packages py
Python 线程与 Linux 中的多处理

基于此question https stackoverflow com questions 807506 threads vs processes in linux我假设创建新流程应该几乎和创造新线程在Linux中然而很少的测试显示出截

随机推荐

XPages ValuePicker 仅限 1000 个

我使用 valuePicker 和 DojoListTextBox 设计元素如果我有超过 1 000 个值则此值选择器最多列出 1 000 条记录如何增加这个限制我只是想让它列出我有多少个值
AES 填充无效且无法删除

我正在使用 AES 加密算法来加密和解密项目中的值我的代码几乎每次都能工作但有时我会得到Padding is invalid and cannot be removed错误我的项目是 ASP NET Core 3 1 项目它发布在
在运行集成测试之前，如何让 Maven 构建等待 Jetty 服务器以分叉模式启动？

我有一份关于代码覆盖率的报告一体化 test 我确实有集成测试并且这些测试在 Maven 构建中成功运行当我单击 HTML 报告右上角的会话链接时我可以在列表中看到我的测试类但我看不到现在由测试执行的主要类并且所有覆盖率报告百
如何在C#中的列表框中插入复选框？

我想要一个代码来在 C Sharp 的列表框中插入一个复选框选择该复选框后必须选择列表框中的所有项目您可以使用 CheckListBox 显示一个列表其中每个项目旁边都有一个复选框但是要制作一个选择列表中所有内容的复选框它必须是
socket.io 删除特定侦听器

我正在使用 Socket io v0 9 16 和铬34 我正在尝试删除特定侦听器或取消订阅特定订阅像这样的东西 socket on testComplete function data console log test comple
JavaScript - 如何同时播放多个视频？

我有一个array我希望同时播放的视频元素我在网上找到的唯一方法是使用new MediaController 但这似乎并没有得到广泛如果有支持的话我期望做的是 var videos document querySelectorAll
Kubernetes 上的 Angular（入口路由）

我需要如何配置 Angular 7 应用程序正在运行的入口 apiVersion extensions v1beta1 kind Ingress metadata name myingress annotations nginx ingre
如何在 R 中建立多项式回归模型？

我有一个包含 70 个变量的数据集我想尝试对其进行多项式回归如果列数是三四我可以手动编写这样的代码 model lt lm y poly var1 3 poly var2 3 poly var4 4 如果我们有 70 个变量我们将
如何创建仅在链接 pthread 时才使用互斥体的库？

我正在 Linux 上创建一个 C 库它有多个函数它们一起对一些全局数据进行操作为了使这些函数是线程安全的它们必须在代码中的适当位置使用互斥体在 Linux 中为了在应用程序中使用 pthreads 需要链接到适当的库 lp线程
在触摸设备上的浏览器中禁用双击“缩放”选项

我想要disable the 双击缩放功能性在指定元素上在浏览器中在触摸设备上无需禁用所有缩放功能例如可以多次点击一个元素来发生某件事这在桌面浏览器上运行良好如预期但在触摸设备浏览器上它会放大仅 CSS 解决方案 Add
SQL 忽略 WHERE 子句

M SSMS SQL 我的 WHERE 子句中的这一行抛弃了我的 WHERE 子句的其余部分 WHERE AND b DESIGNATION IS NOT NULL OR c DESIGNATION IS NOT NULL 由于某种原因当
JfreeChart自定义票据标签

我正在使用 JFreechart 在生成的报告中绘制图表JasperReports 实际上我正在使用动态报告它使用 JasperReports 我正在策划一个barchart我想在轴上的标签上添加自定义字符串图片会更好地解释一切 Now
在保存为 PNG 之前将新创建的 iOS 图像旋转 90 度

我已经阅读了许多与此相关的答案但我仍然无法让它工作我有一个用户可以在其中签名的视图它看起来是这样的 http d pr i McuE 我可以成功检索该图像并将其保存到文件系统但我需要在保存之前将其旋转 90 度以便签名从左到右读取
mysql_real_escape_string 和 array_map 返回空白字符串？

我还没有学会如何使用参数化查询根据本网站上的其他一些帖子这是我明天早上绝对需要做的第一件事并且我想将大量表单数据放入查询中转义我两次遇到过这个解决方案 POST array map mysqli real escape strin
Amazon SES 从实例配置文件元数据服务器检索凭证时出错。（客户端错误：404）

在让 AWS SES 正常工作时遇到一些问题我想从我的网站向用户发送电子邮件看起来凭证没有经过验证但是我使用了从 IAM 生成的正确凭证我还尝试了服务器根密钥但它给了我同样的错误我已经没有关于如何进一步解决调试的想法因此任何
Spring Batch 和 Cloudera hadoop 版本不兼容

我正在尝试 Spring Batch 字数统计程序并遇到这样的版本问题 ERROR org springframework batch core step AbstractStep
函数生成；更改其他功能的默认值（部分）

我需要一个函数生成器它接受另一个函数和该函数的任何参数并设置新的默认值我以为 hadley 的pryr partial这就是那个神奇的功能它完全符合我的要求只是您无法更改新的默认值所以在这里我可以改变sep在我的新paste函数
线程安全数据集

我想让 DataTable DataSet 的更新操作成为线程安全的有大约 20 个线程每个线程使用以下命令更新大约 40 行全局 DataTableRows Find pk 数据表的方法每个线程将更新 DataTable 的不同行
如何提高 boost Interval_map 查找的性能

我正在使用一个boost icl interval map将字节范围映射到一组字符串该地图是从已排序的磁盘文件加载的然后我使用下面的代码进行查找问题是查找速度非常慢在我的测试中我在地图中插入了 66425 个范围我分析了代码
如何在多索引 Pandas 数据框中按组更新前 N 行的值？

我正在尝试更新多索引数据框中的前 N 行但在寻找解决方案时遇到了一些麻烦所以我想为它创建一个帖子示例代码如下 Imports import numpy as np import pandas as pd Set Up Data Fra

如何在多索引 Pandas 数据框中按组更新前 N 行的值？

如何在多索引 Pandas 数据框中按组更新前 N 行的值？ 的相关文章

随机推荐

热门标签

如何在多索引 Pandas 数据框中按组更新前 N 行的值？的相关文章