如何替换数据帧每行中大于某个阈值的前 n 个元素

2024-04-09

我有一个巨大的数据框，仅包含数字（下面显示的数据框仅用于演示目的）。我的目标是替换数据帧的每一行中的第一行n大于某个值的数字val by 0.

举个例子：

我的数据框可能如下所示：

   c1  c2  c3  c4
0  38  10   1   8
1  44  12  17  46
2  13   6   2   7
3   9  16  13  26

如果我现在选择n = 2（替换数量）和val = 10，我想要的输出将如下所示：

   c1  c2  c3  c4
0   0  10   1   8
1   0   0  17  46
2   0   6   2   7
3   9   0   0  26

在第一行中，只有一个值大于val所以只有一个被替换，在第二行中所有值都大于val但只能替换前两个。第 3 行和第 4 行的模拟（请注意，不仅前两列受到影响，而且一行中的前两个值可以位于任何列中）。

一个简单且非常丑陋的实现可能如下所示：

import numpy as np
import pandas as pd

np.random.seed(1)

col1 = [np.random.randint(1, 50) for ti in xrange(4)]
col2 = [np.random.randint(1, 50) for ti in xrange(4)]
col3 = [np.random.randint(1, 50) for ti in xrange(4)]
col4 = [np.random.randint(1, 50) for ti in xrange(4)]

df = pd.DataFrame({'c1': col1, 'c2': col2, 'c3': col3, 'c4': col4})

val = 10
n = 2

for ind, row in df.iterrows():
    # number of replacements
    re = 0

    for indi, vali in enumerate(row):
        if vali > val:
            df.iloc[ind, indi] = 0
            re += 1
            if re == n:
                break

这是可行的，但我确信有更有效的方法可以做到这一点。有任何想法吗？

你可以编写自己的有点奇怪的函数并使用 with axis=1:

def f(x, n, m):
    y = x.copy()
    y[y[y > m].iloc[:n].index] = 0
    return y

In [380]: df
Out[380]:
   c1  c2  c3  c4
0  38  10   1   8
1  44  12  17  46
2  13   6   2   7
3   9  16  13  26

In [381]: df.apply(f, axis=1, n=2, m=10)
Out[381]:
   c1  c2  c3  c4
0   0  10   1   8
1   0   0  17  46
2   0   6   2   7
3   9   0   0  26

Note: y = x.copy()需要制作该系列的副本。如果您需要就地更改值，则可以省略该行。你需要额外的y因为通过切片，您将得到一个副本而不是原始对象。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

pandas

DataFrame

如何替换数据帧每行中大于某个阈值的前 n 个元素的相关文章

Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
检查两个数是否是彼此的排列？

给定两个数字 a b 使得 1 例如 123 是 312 的有效排列我也不想对数字中的数字进行排序如果您指的是数字的字符例如 1927 和 9721 则至少有几种方法如果允许排序一种方法是简单地sprintf将它们放入两个缓冲
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
linux perf：如何解释和查找热点

我尝试了linux perf https perf wiki kernel org index php Main Page今天很实用但在解释其结果时遇到了困难我习惯了 valgrind 的 callgrind 这当然是与基于采样的 pe
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
为什么在展开的 ADD 循环内重新初始化寄存器会使其运行速度更快，即使循环内有更多指令？

我有以下代码 include
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
NHibernate - CreateCriteria 与 CreateAlias

假设以下场景 class Project public Job Job class Job public Name 假设我想使用 Criteria API 搜索其 Job 名称为 sumthing 的所有项目我可以使用 CreateAli
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

了解 JavaScript 闭包 - 冻结传递给回调的变量

我对 JavaScript 闭包还没有基本的了解我有一个关于具体情况的问题这也许也是基本和常见的例子 3 秒内从 1 数到 3 请参阅此处的 JSFiddle http jsfiddle net nAh8x http jsfiddle
如何在 Scala Breeze 中压缩两个 DenseVector？

我想拉两个拉链DenseVectors对每一对进行运算得到一个新的向量作为结果使用 scala breeze 实现此目的的最佳方法是什么我可以通过使用他们来解决这个问题data字段但我需要构建一个新的DenseVector从结果数组
UITextView 不更新其 contentSize

我正在动态调整 aUITextView的高度和的高度UITableViewCell当其内容发生变化时它就会被嵌入但我也可以粘贴预定义的文本由于此粘贴是以编程方式进行的因此问题是将选定的文本位添加到UITextView的短信并致电
通过字符串查找可绘制对象[重复]

这个问题在这里已经有答案了可能的重复 Android 从 drawable String 打开资源 https stackoverflow com questions 2349652 android open resource from
GeoAlchemy2：获取某个点的经纬度

考虑以下SQLAalchemy http www sqlalchemy org GeoAlchemy2 http geoalchemy 2 readthedocs org en 0 2 6 index html具有几何字段的 ORM fro
面向方面编程（AOP）有哪些缺点？

面向方面编程有哪些可能的和关键的缺点例如新手的神秘调试可读性影响我认为最大的问题是没人知道如何定义切面的语义 or 如何非程序地声明连接点如果您无法独立于要嵌入的上下文来定义某个方面的功能或者无法以不损害其嵌入的上下文的方式定义
如何在 Go 和 Android 之间使用 RSA

我 1 在 Go 中创建公钥并将其发送到 Android 2 android使用下面的代码来加密它的数据以字符串类型发送到Go 3 去获取字符串数据并尝试解密但不能我的Go代码 DecryptWithPrivateKey decrypt
Is
Angular2指令“无法使用输出元数据读取未定义的属性‘订阅’”

关于 Angular2 指令我想使用outputs而不是使用 Output因为我有很多自定义事件并且希望保持 DRY 但是我有TypeError Cannot read property subscribe of undefined 而
SET 查询中“在此上下文中无效使用聚合函数”(Neo4j)

我想知道为什么这被认为是 Neo4j 的 Cypher 中聚合函数的无效使用 MATCH p Project EMPLOYS n Person SET p youngest MIN n age 虽然以下被认为是有效的用例 MATCH p P
MYSQL声明变量

我不明白这个脚本有什么问题 BEGIN DECLARE crs INT DEFAULT 0 WHILE crs lt 10 DO INSERT INTO continent name VALUES cont crs SET crs crs
我应该使用 SIMD 或向量扩展还是其他什么？

我目前正在开发一个开源 3D 应用程序框架c questions tagged c 2b 2b with c 11 questions tagged c 2b 2b11 我自己的数学库是这样设计的XNA数学库 http msdn micro
无法向 Mongoose 查询返回的对象添加新属性[重复]

这个问题在这里已经有答案了我正在使用 Node js MongoDB 和 Express 编写 API 我似乎无法向我正在迭代的位置对象添加新属性我根本不明白我的代码的问题 loc是一个普通的对象它应该可以工作我错了吗 GET Lo
`require` 在 php 中不起作用

这是我现在正在获取的错误 PHP Fatal error require Failed opening required base data home apps s civic planet 191520 20180221t115719 4
列表活动中的上下文菜单

我有带有自定义数组适配器的列表活动当长按列表项时我无法获取上下文菜单
如何使用 vue-cli 3 创建两个单独的包？

我想构建两个独立的 vue 应用程序它们将在 Express 应用程序中的两条不同路径上提供服务公共 vue 应用程序和管理 vue 应用程序这两个应用程序有自己的路由器和商店但它们共享许多自定义组件如何编辑默认的 webpac
Distcp 源长度不匹配

我在执行时遇到问题distcp两个不同的命令之间hadoop簇引起原因 java io IOException 长度不匹配来源 hdfs ip1 xxxxxxxxxxx xxxxx 和目标 hdfs nameservice1 xxxx
Rails 使用 puma，将 localhost:3000 更改为 localhost:3000/example

我开发了一个 Rails 5 应用程序可以很好地运行http 本地主机 3000 http localhost 3000 现在我需要该应用程序在 localhost 3000 example 中启动并且该链接通过这个新主机例如 lo
源 bashrc 在 cron 中不起作用

我们都知道 cron 会忽略 bashrc 和 bash profile 中定义的变量因此我们必须在 cron 中定义它我经常做类似问题中写的同样的事情https unix stackexchange com questions 679
如何替换数据帧每行中大于某个阈值的前 n 个元素

我有一个巨大的数据框仅包含数字下面显示的数据框仅用于演示目的我的目标是替换数据帧的每一行中的第一行n大于某个值的数字val by 0 举个例子我的数据框可能如下所示 c1 c2 c3 c4 0 38 10 1 8 1 44 12 1

如何替换数据帧每行中大于某个阈值的前 n 个元素

如何替换数据帧每行中大于某个阈值的前 n 个元素 的相关文章

随机推荐

热门标签

如何替换数据帧每行中大于某个阈值的前 n 个元素的相关文章