以最有效的方式比较两个 pandas DataFrame

2024-01-09

让我们考虑两个 pandas 数据框：

import numpy as np
import pandas as pd

df = pd.DataFrame([1, 2, 3, 2, 5, 4, 3, 6, 7])

check_df = pd.DataFrame([3, 2, 5, 4, 3, 6, 4, 2, 1])

如果想做以下事情：

If df[1] > check_df[1] or df[2] > check_df[1] or df[3] > check_df[1]然后我们分配给 df 1，否则分配给 0
If df[2] > check_df[2] or df[3] > check_df[2] or df[4] > check_df[2]然后我们分配给 df 1，否则分配给 0
我们对 DataFrame 的末尾应用相同的算法

我的原始代码如下：

df_copy = df.copy()
for i in range(len(df) - 3):
    moving_df = df.iloc[i:i+3]
    if (moving_df >check_df.iloc[i]).any()[0]:
        df_copy.iloc[i] = 1
    else:
        df_copy.iloc[i] = -1
df_copy


    0
0   -1
1   1
2   -1
3   1
4   1
5   -1
6   3
7   6
8   7

如果有可能在没有循环的情况下做到这一点，您能给我一个建议吗？

IIUC，这很容易通过rolling.min:

df['out'] = np.where(df[0].rolling(N, min_periods=1).max().shift(1-N).gt(check_df[0]),
                     1, -1)

output:

保持最后的项目不变：

m = df[0].rolling(N).max().shift(1-N)
df['out'] = np.where(m.gt(check_df[0]),
                     1, -1)
df['out'] = df['out'].mask(m.isna(), df[0])

output:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

以最有效的方式比较两个 pandas DataFrame 的相关文章

scikit-learn LinearRegression 的意外交叉验证分数

我正在尝试学习使用 scikit learn 来完成一些基本的统计学习任务我认为我已经成功创建了适合我的数据的线性回归模型 X train X test y train y test cross validation train test
使用 Flask 从 Jinja 模板中的 settings.py 文件获取变量

假设我有 settings py 文件其中包含一堆常量将来可能会更多如何访问 Jinja 模板中的这些变量 Flask 会自动将您的应用程序的配置包含在标准上下文 http flask pocoo org docs templatin
Python（openpyxl）：将数据从一个excel文件转移到另一个（模板文件）并用另一个名称保存，同时保留模板

我有一个templateexcel 文件名为template xlsx其中有许多张我想从单独的地方复制数据 csv文件到第一页template xlsx 命名为data 并将新文件另存为result xlsx同时保留原来的模板文件我想粘
如果新文件不存在则写入新文件，如果存在则追加到文件

我有一个程序可以写入用户的highscore到一个文本文件该文件由用户选择时命名playername 如果具有该特定用户名的文件已经存在那么程序应该附加到该文件以便您可以看到多个highscore 如果具有该用户名的文件不存在例如
django/whitenoise 存储后端导致错误

我在调试关闭时在 heroku 上运行 django 应用程序时遇到了 500 错误使用 rollbar 了解发生错误的原因后它报告了以下内容 ValueError The file media img 1 jpg could not
Plotly - 不同颜色的表面

我正在尝试在 Plotly for Python 中绘制多个曲面每个曲面具有不同的颜色具体来说表面显示了在相空间中不同点采取行动的预测奖励函数由于我在每个点都有多个可能的操作因此每个点都是不同的表面我想对每个表面进行独特的着色
如何在 pySpark 数据框中添加行 ID [重复]

这个问题在这里已经有答案了我有一个 csv 文件我在 pyspark 中将其转换为 DataFrame df 经过一番改造后我想在 df 中添加一列这应该是简单的行 ID 从 0 或 1 开始到 N 我将 df 转换为 rdd 并使
Pandas Dataframe.to_csv 小数=',' 不起作用

在 Python 中我正在将 Pandas Dataframe 写入 csv 文件并希望将小数分隔符更改为逗号像这样 results to csv D Data Kaeashi BigData ProcessMining Voorbe
如何消除 matplotlib 轴的相对偏移

当我尝试对具有足够大数字的范围进行绘图时我得到一个所有刻度都有相对偏移的轴例如 plot 1000 1001 1002 1 2 3 我在横坐标轴上得到这些刻度 0 0 0 5 1 0 1 5 2 0 1e3 问题是如何删除 1e3并得到
seaborn 未在定义的子图中绘制

我正在尝试用这段代码并排绘制两个图表 fig ax1 ax2 plt subplots 1 2 sns displot x X train Age hue y train ax ax1 sns displot x X train Fare
中断QThread睡眠

我想知道如何暂停 QThread 然后在收到信号时恢复我已阅读并知道我可以做这样的事情 def run self self ready False while not self ready self sleep 1 QtCore Slot
Python 对象初始化错误。或者我误解了对象的工作原理？ [复制]

这个问题在这里已经有答案了 1 import sys 2 3 class dummy object 4 def init self val 5 self val val 6 7 class myobj object 8 def init s
Django外键：获取相关模型？

是否可以通过外键字段本身获取外键的相关模型例如如果我有 3 个模型 class ModelA models Model field1 models CharField max length 10 class ModelB models
您能否从函数、args 和 kwargs 确定变量将如何分配？

我有一些样板逻辑我想包装几个具有相同可选关键字的函数现在看起来像下面的代码但是这仅处理 opt key 作为关键字传递的情况而不是按位置传递解决这个问题的一种方法是了解如何解决参数分配是否有一些元函数接受函数 args 和 k
Django 自定义查询集过滤器

在 Django 中是否有一种标准方法可以为查询集编写复杂的自定义过滤器就像我能写的一样 MyClass objects all filter field val 我想做这样的事情 MyClass objects all filter
将 Python 3 的“范围”“向后移植”到 Python 2 是一个坏主意吗？

我的一门课程要求用 Python 完成作业作为练习我一直使用如下脚本确保我的程序可以在 Python 2 和 Python 3 中运行 bin bash Run some PyUnit tests python2 test py pyt
SQL查询中的Python列表作为参数[重复]

这个问题在这里已经有答案了我有一个 Python 列表比如说 l 1 5 8 我想编写一个 SQL 查询来获取列表中所有元素的数据例如 select name from students where id IN THE LIST l
将glade接口放入python中

我在 Glade 中制作了一个 gui 我想将其放入 python 程序中我正在调整我在网上找到的教程中的说明以将其加载到我的林间空地文件中 http www pygtk org articles pygtk glade gui Cre
从另一个列表的元素创建一个新列表，引用后者的元素

我想从前一个元素创建一个新列表但不复制它们这就是发生的事情 In 23 list range 10 In 24 list2 list 0 4 In 25 list Out 25 0 1 2 3 4 5 6 7 8 9 In 26 lis
如果我更改当前工作目录，为什么 __file__ 会变成无效路径？

执行中test py from tmp import os print os path abspath file os chdir var print os path abspath file output tmp test py var

随机推荐

如何在Python中按顺时针/逆时针方向对点列表进行排序？

我得到了坐标点列表我想按顺时针逆时针对它们进行排序这是我提到的清单 985 268 112 316 998 448 1018 453 1279 577 1196 477 1161 443 986 0 830 0 983 230 998
MYSQL使用count(*)进行选择查询

我有一个关于 MYSQL 中的选择查询的问题我有两个不同的表我想获得某个结果我使用了 COUNT 方法它只给了我结果 gt 1 但实际上我想使用包含零的所有计数该怎么做我的查询是 SELECT first subscriber
什么时候一个对象适合垃圾收集器？

考虑这个示例代码 1 public class GC 2 private Object o 3 private void doSomethingElse Object obj o obj 4 public void doSomething
声明终止。在语句完成之前最大递归 100 已用完

设置表和示例数据 USE LDS GO Object Table dbo Table DownLineList Script Date 11 14 2013 11 45 31 SET ANSI NULLS ON GO SET QUOTED
UIImage imageNamed 不适用于 ios 5.0

我使用这段代码图像集图像 UIImage imageNamed 电子邮件受保护 cdn cgi l email protection 它适用于 ios 4 3 但在 ios 5 0 上我看不到我的图像有谁知道这个问题属于哪一类您通常不
DataGridView - 父子数据库关系 - 更新子 DataGridView 数据

有人愿意帮助我完成以下事项吗我有两个 DataGridView 对象每个对象显示一个 DataTable 其中两个数据表与以下代码相关 DataSet dSet new DataSet DataTable ParentList List
找不到 uri [//<type>/] 和方法 [PUT] 的处理程序

我正在尝试使用插入文档 api 的自动增量 id 功能向我的 elasticsearch 索引发出原始 NodeJS http 请求所以这适用于curl curl XPOST http host 3333 catalog products
JavaScript 中的土耳其语大小写转换

我想在我想要的语言环境中将 JavaScript 中的字符串转换为小写或大写我认为标准功能就像toUpperCase and toLocaleUpperCase 不能满足这个需要 toLocale函数没有按其应有的方式运行例如在我的系
无法解析远程名称

我正在为 Windows Mobile 6 创建移动应用程序我正在 url 网站上上传图像为此我使用 webrequest 和 webresponse 类在获得响应时我收到此类错误无法解析远程名称我的代码是字符串网址 htt
在 lucene BooleanQuery 中将整个句子与空格匹配

我有一个搜索字符串 Tulip INN Riyadhh Tulip INN Riyadhh LUXURY Suites of Tulip INN RIYAHdhh 如果我提到的话我需要搜索词 Tulip INN Riyadhh 它必须返回
获取页面墙上其他人的帖子（Facebook API）

我四处寻找但找不到答案所以我在这里尝试是否可以在页面墙上获取其他人的帖子参见图片作为示例 http d pr i fklT http d pr i fklT 通过 Facebook 的 API 我尝试过使用 PAGE ID post
如何在没有输出的情况下打开 IPython 笔记本？

我有一个 IPython 笔记本我不小心转储了一个巨大的输出 15 MB 导致笔记本崩溃现在当我打开笔记本并尝试删除有问题的单元格时笔记本再次崩溃从而使我无法解决问题并使笔记本恢复稳定我能想到的最好的解决方法是将输入单元手动粘贴
Spark.eventLog.dir和spark.history.fs.logDirectory有什么区别？

Spark中事件日志目录和历史服务器日志目录有什么区别 spark eventLog dir hdfs var log spark apps spark history fs logDirectory hdfs var log spark
Heroku 上的 Spring Boot Gradle 应用程序：无法访问 jarfile

我有一个 spring boot gradle 应用程序可以通过执行以下操作在我的 PC 上成功运行 heroku local 当我去的时候它也可以成功部署在heroku上 git push heroku master 这是我的结果 Co
Java socket编程中如何实现客户端与服务器的持续交互

Java Socket 编程中如何实现客户端与服务器的持续交互在我的程序中我的目录中有许多文件夹即 F read 我正在将包含文件的文件夹从客户端传输到服务器当第一次请求时一个文件夹从客户端传输到服务器当再次向客户端发送另一个文
SplitAt 3 然后继续分裂

我想在 Haskell 中每 3 个字母分割一个字符串我尝试过使用splitAt但我必须重复此操作直到字符串每 3 个字母被分割一次有没有办法做到这一点 E g WEAREDISCOVERED 会成为 WEA RED ISC OVE
将字符串拆分为交替的单词（Scala）

我想将一个字符串分割成交替的单词总会有一个偶数 e g val text this here is a test sentence 应该转换为某种有序集合类型其中包含 this is test and here a sentence 我
numpy 中的局部均值滤波器

我有一个 512x512x512 numpy 数组是否有任何有效的方法来执行均值过滤器其中每个数组值都被所有 3x3x3 本地值替换我们正在寻找类似的东西scipy ndimage filters median filter但用平均值
无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

张量流keras中的层有一个方法build它用于将权重创建推迟到您了解输入内容的时间图层的构建方法 https www tensorflow org api docs python tf keras layers Layer build
以最有效的方式比较两个 pandas DataFrame

让我们考虑两个 pandas 数据框 import numpy as np import pandas as pd df pd DataFrame 1 2 3 2 5 4 3 6 7 check df pd DataFrame 3 2 5

以最有效的方式比较两个 pandas DataFrame

保持最后的项目不变：

以最有效的方式比较两个 pandas DataFrame 的相关文章

随机推荐

热门标签