基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？

2023-12-22

如果不诉诸循环遍历数据帧的每一行（这对于大型数据集来说可能非常慢），我如何使用连续两列的计算结果，2*A - B, 在列中查找值B并从该新行中提取列中的数据C并放入列中D原始行的。

例如，在下面的 DataFrame 中，行2 has 2*A - B equal 1。柱子B in row 0 has a 1，所以来自列的数据C in row 0应该放在列中D of row 2.

In [1] import pandas as pd
In [2] a = [3,3,3]
In [3] b = [1,3,5]
In [4] c = [3,4,5]

In [5] df1 = pd.DataFrame({'A': a , 'B': b, 'C':c})
Out[5] print(df1)

   A  B  C
0  3  1  3
1  3  3  4
2  3  5  5

生成的 DataFrame 应如下所示：

    A  B  C  D
0   3  1  3  5
1   3  3  4  4
2   3  5  5  3

我假设每个组合只有一个唯一值A and B。虽然上面的例子可以通过简单的转置列来完成C进入专栏D，我想要一个更通用的解决方案，可以扩展到数据不适合转置的情况。

如果你能保证独特的组合，那么......

mapping = dict(df[['B', 'C']].values)
df['D'] = (2 * df.A - df.B).replace(mapping)
df    
   A  B  C  D
0  3  1  3  5
1  3  3  4  4
2  3  5  5  3

创建一个映射B价值观C价值观。执行运算 (2 * A - B)，并使用mapping较早生成以获得适当的C value.

如果映射不存在，则不会替换计算值。如果您希望将其替换为NaN，你可能会使用map反而：

df['D'] = (2 * df.A - df.B).map(mapping)
df
   A  B  C  D
0  3  1  3  5
1  3  3  4  4
2  3  5  5  3

它的工作原理是df.replace会，但非映射值被替换为NaN.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

mapping

基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？的相关文章

行未从树视图复制

该行未在树视图中复制我在按行并复制并粘贴到未粘贴的任何地方后制作了弹出复制 The code popup tk Menu tree opportunity tearoff 0 def row copy item tree opportun
在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
将 Pandas 列中的列表拆分为单独的列

这是我在 pandas 数据框中的特征列 Feature Cricket 82379 Kabaddi 255 Reality 4751 Cricket 15640 Wildlife 730 LiveTV 13 Football 4129
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
Pandas Dataframe：将包含列表的行扩展到多行，并为所有列提供所需的索引

我在 pandas 数据框中有时间序列数据索引为测量开始时的时间列中包含以固定采样率记录的值列表连续索引列表中元素数量的差异这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe

随机推荐

Ubuntu 上 Android Studio 的键盘问题

在 Ubuntu 上使用 Android Studio 时有时 IDE 将停止响应键盘输入或开始输入随机字符如何解决这个问题或者可能的解决方法这是一个已知问题 http tools android com knownissues i
twinx 杀死刻度标签颜色

我正在绘制带有两个 y 轴的双图第二轴ax2是由创建的twinx 问题是第二个 y 轴的着色通过yticks不再工作了相反我必须set color单独的标签这是相关代码 fig plt figure fill between dat
如何使用卷从 docker 中的转储或 sql 文件恢复数据库？ [复制]

这个问题在这里已经有答案了我正在尝试在 docker 中运行我的数据库其中已经有一些数据但是当我在 docker 中运行它时它给出了空那么如何在 docker PostgreSQL 映像中恢复我的数据库首先启动 docker
HtmlUnit在浏览页面时是否加载图像？

如上它加载图像吗默认情况下否你必须使用htmlImage 获取图像读取器 http htmlunit sourceforge net apidocs com gargoylesoftware htmlunit html HtmlIm
LNK1104 无法打开文件“...lib.obj”

我正在尝试更新 Visual Studio 2012 C 项目以便可以在 Visual Studio 2015 更新 3 中编译它们我已经把它缩小到一个项目中的一个错误我完全被难住了 LNK1104 无法打开文件 C Program
在 Spring Security 中使用 CSRF 令牌获取 403

我遇到了多个选项卡的问题如果我从第一个选项卡注销并打开另一个选项卡登录并注销后如果我返回第一个选项卡并登录我会收到 403 例如第一个选项卡的注销页面已由 spring security 和 thymeleaf 添加到表单中
为什么javascript文件加载两次console.log和alert并且jquery“click”运行两次

为什么javascript文件加载两次两次 window load function function console log hi this is the console output vm 和 Category 是同一个文件问题不仅仅
在Application_End中检测站点登录url

我在 web config 中有这个条目
如何单元测试（使用 JUnit 或 mockito）recyclerview 项目点击

我目前正在尝试使用 junit 和 mockito 对 recyclerview 添加 onitemclicklistener 进行单元测试这是我的代码 private void mypicadapter TreeMap
Apple/iPhone 开发 IDE 首选项？

我要做一些我从未想过会做的事情学习如何为 Apple 硬件编程在使用过 C C C NET 甚至在 DOS 的黄金时代 Borland Turbo C 中的一个小型 DOS4G W 内存扩展器有人吗甚至在孩童时期就玩过 Atari
PL/pgSQL 函数：如何使用执行语句返回具有多列的普通表

我有这个PL pgSQL必须返回一些用户信息的函数 CREATE OR REPLACE FUNCTION my function user id integer RETURNS TABLE id integer firstname char
Xamarin、安卓。使用 F# 在 VS2015 中打开 *.axml 文件时出现异常，

在以下位置打开布局文件时收到以下错误消息F 项目 System NullReferenceException 未将对象引用设置到实例一个物体的在 Xamarin VisualStudio Android MonoAndroidDesig
TeamCity：部署生成的安装程序（工件）的最佳实践

我们有一个 TeamCity 服务器它可以生成夜间可部署的版本我们希望我们的 Beta 测试人员能够访问这些夜间构建执行此操作的最佳实践是什么 TeamCity 服务器不是公开的它位于我们的办公室因此我认为最好的方法是通过 FTP
如何在 Android 中创建自定义评分栏

大家好我需要在我的应用程序中执行评级所以我需要创建自定义评级栏任何人都可以帮助我吗样式 xml 它必须位于您的值文件夹中
Google API：如何增加访问令牌的到期日期？

Google API 过期日期为 1 小时问题是我使用 API 是为了允许用户使用管理 SDK 功能列出群组向群组添加成员等没有人可以在一小时内完成任何一件事这需要用户每天多次登录他们的帐户来管理他们的组如果您只想使用 Goog
CRM 2011 sdk - 获取实体计数而不检索数据行

我正在使用 CRM 2011 SDK 来处理远程 CRM 2011 服务我需要检索联系人总数超过 20000 个我尝试过一个简单的 LINQ 查询例如 Aggregate c In service ContactSet Into C
是否可以停止使用 httpConnection.connect() 连接到 URL 的线程？

我有一个线程连接到一个 url 以获取一些数据有时方法httpConnection connect 花了太多时间才得到响应我想将此连接线程的加载对话框限制为 5 段我尝试在代码中添加超时但它不起作用 URL formattedUrl
如何在 C# 中获取应用程序的安装日期

我在 Windows 机器上安装了我的应用程序在我的 C 程序中我需要获取该应用程序的安装日期有没有办法从注册表或其他位置获取此信息如果您有任何想法请告诉我所有这些信息都应存储在 HKEY LOCAL MACHINE SOFTW
如何在 Angular Material 的网格中设置行间距？

我似乎找不到一种方法来设置角度材质的行间距网格列表 https material angular io components grid list overview 我尝试过装订线尺寸但它只显示我的图块内容我找不到 Angular Mat
基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？

如果不诉诸循环遍历数据帧的每一行这对于大型数据集来说可能非常慢我如何使用连续两列的计算结果 2 A B 在列中查找值B并从该新行中提取列中的数据C并放入列中D原始行的例如在下面的 DataFrame 中行2 has 2 A B e

基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？

基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？ 的相关文章

随机推荐

热门标签

基于列数据计算从 Pandas DataFrame 中的另一行查找数据的最快方法？的相关文章