在 pandas 数据框中的两列之间传输值

2023-12-19

我有一个像这样的熊猫数据框：

p q
0.5 0.5
0.6 0.4
0.3 0.7
0.4 0.6
0.9 0.1

所以，我想知道，如何将较大的值传输到 p 列，反之亦然的 q 列（将较小的值传输到 q 列），如下所示：

p q
0.5 0.5
0.6 0.4
0.7 0.3
0.6 0.4
0.9 0.1

您可以存储一些条件系列np.where()然后将它们应用到数据框：

s1 = np.where(df['p'] < df['q'], df['q'], df['p'])
s2 = np.where(df['p'] > df['q'], df['q'], df['p'])
df['p'] = s1
df['q'] = s2
df
Out[1]: 
     p    q
0  0.5  0.5
1  0.6  0.4
2  0.7  0.3
3  0.6  0.4
4  0.9  0.1

你也可以使用.where():

s1 = df['p'].where(df['p'] > df['q'], df['q'])
s2 = df['p'].where(df['p'] < df['q'], df['q'])
df['p'] = s1
df['q'] = s2
df

我测试了从 100 行到 100 万行的不同行的执行时间，以及需要通过的答案axis=1 can be 10,000 times slower!:

Erfan 的 numpy 答案看起来是大型数据集以毫秒为单位执行最快的答案
My .where()答案也具有出色的性能，可以将执行时间保持在毫秒级（我假设`np.where()会有类似的结果。
我以为MHDG7的答案会是最慢的，但实际上它比Alexander的答案更快。
我猜亚历山大的回答很慢，因为它需要通过axis=1。事实上，MGDG7 和 Alexander 的答案是逐行的（其中axis=1），这意味着对于大型数据帧来说它会大大减慢速度。

正如您所看到的，一百万行数据帧需要几分钟才能执行。而且，如果您有 1000 万行到 1 亿行的数据帧，这些单行代码可能需要几个小时才能执行。

from timeit import timeit
df = d.copy()

def df_where(df):
    s1 = df['p'].where(df['p'] > df['q'], df['q'])
    s2 = df['p'].where(df['p'] < df['q'], df['q'])
    df['p'] = s1
    df['q'] = s2
    return df


def agg_maxmin(df):
    df[['p', 'q']] = df[['p', 'q']].agg([max, min], axis=1)
    return df


def np_flip(df):
    df = pd.DataFrame(np.flip(np.sort(df), axis=1), columns=df.columns)
    return df


def lambda_x(df):
    df = df.apply(lambda x: [x['p'],x['q']] if x['p']>x['q'] else [x['q'],x['p']],axis=1,result_type='expand')
    return df


res = pd.DataFrame(
    index=[20, 200, 2000, 20000, 200000],
    columns='df_where agg_maxmin np_flip lambda_x'.split(),
    dtype=float
)

for i in res.index:
    d = pd.concat([df]*i)
    for j in res.columns:
        stmt = '{}(d)'.format(j)
        setp = 'from __main__ import d, {}'.format(j)
        print(stmt, d.shape)
        res.at[i, j] = timeit(stmt, setp, number=1)

res.plot(loglog=True);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

python27

在 pandas 数据框中的两列之间传输值的相关文章

键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

ng-repeat 仅显示最后一个元素

我正在使用 AngularJs 开发消息收件箱我遇到了一个问题我想仅显示其中的最后一个元素ng repeat 我做了一些研究发现下面的代码应该可以工作 div class inbox ul div span recipient id
Flutter 将 Draggable Scrollbar 添加到 CustomScrollView？它一直给我“参数类型 CustomScrollView 无法分配给 BoxScrollView”

一个简单的例子是 Scaffold floatingActionButton fab floatingActionButtonLocation fabLocation body Scrollbar child CustomScrollVie
并发/待办事项示例不起作用

我正在尝试 ToDo 示例并在尝试并发处理时遇到了未处理的异常 dataservice js 包含这些行saveFailed error method if detail detail ExceptionType indexOf Opti
该证书的颁发者无效 Apple Push Services

我已创建证书以在我的应用程序中启用推送服务但每次我尝试在钥匙串中添加证书时添加证书后都会显示以下错误该证书的颁发者无效我想我已经弄清楚了这一点我导入了新的 WWDR 证书将于 2023 年到期 https developer ap
Codeigniter 中国家/地区和城市的 Ajax 下拉菜单？

我正在我们的 Codeigniter 框架中借助 ajax 使国家和城市下降数据库的结构如下所示 Country country id country name State country id state id state name c
如何在 Chrome 扩展中使用 google 创建登录信息

我最近刚刚构建了一个插件需要在其中集成 Google Login 我搜索并发现chrome identity使用谷歌帐户对用户进行身份验证但这效果不佳所以我通过使用下面的代码找到了一个解决方案 var manifest chrome
使用 VBA 宏删除 PowerPoint 中的图片

我正在使用以下 VBA 宏删除 PowerPoint 幻灯片中的所有图片 Public Function delete slide object slide no Reference existing instance of PowerPo
Zend Action 助手与插件

我有一个出现在每个页面上的侧边栏侧边栏的第一个元素是 a 登录表单或 b 当前用户的详细信息取决于用户是否登录我已经阅读了一些实现此目的的方法并计划在引导程序中初始化侧边栏占位符当需要将用户详细信息或登录表单附加到侧边栏时我应
Allegro CL 在调用（读取）函数时冻结

每当我打电话给 read 在 Allegro Common Lisp 9 0 中调试窗口中断抱歉我想不出更清晰的术语鼠标变成旋转的蓝色死亡轮窗口拒绝评估任何新输入尽管它可以仍然可以输入 IDE 的其他部分不受影响屏幕看起来像
关于加快选边速度的建议

我正在用 C 构建一个图形编辑器用户可以在其中放置节点然后将它们与有向或无向边连接完成后 A 寻路算法确定两个节点之间的最佳路径我拥有的具有 x y 连接节点列表以及 F G 和 H 分数的 Node 类具有 Start Fin
标准库方法的成员函数指针问题

这个问题源于将指向重载类方法的成员函数指针传递到模板函数中 https stackoverflow com questions 31309846 passing a member function pointer to an overlo
丰富的卡片属性 Markdown 格式

我在英雄卡中的文本属性的降价格式方面遇到问题这是代码示例 HeroCard heroCard new HeroCard Text Place1 Berlin n n Place2 Hamburg Buttons cardButtons 它
使用 Google Earth Engine 计算每个地区、月份和年份的 NDVI？

我想计算每个区域管理级别 3 也称为 Wearda 月份和年份的平均 NDVI 所以我的最终结果看起来像这样 regions year month NDVI region 1 2010 1 0 5 region 1 2010 2 0 6
如果没有空间，操作栏会将选项卡转换为列表导航

I have an actionbar with a logo a title 2 tabs and a search function On a phone 3 5 everything works fine The actionbar
Git：跟踪还是取消跟踪 Android API 密钥？

我正在使用适用于 Android 的 Google 地图 API 当我想在旅行时处理代码时我将代码从桌面推送到 Github 然后从 Github 下载到我的笔记本电脑上就 Google Maps API 而言我需要将 API 密钥放
Xcode 6 iOS 8 UITableView rowHeight 属性返回 -1 [重复]

这个问题在这里已经有答案了我有一个UITableView在我的项目中的 Xcode 中我设置了rowHeight to be 44 in StoryBoard 在 iOS7 中一切正常但在 iOS8 rowHeight 返回值 1这导
Java：showInputDialog 中的自定义按钮

如何将自定义文本添加到 JOptionPane showInputDialog 的按钮我知道这个问题带有自定义按钮的 JOptionPane showInputDialog https stackoverflow com question
在滚动时有效调整 UITableViewCell 的大小

大概的概念我希望在用户滚动列表时动态调整 UITableViewCells 的大小也就是说使项目在到达列表底部时尺寸增大注意事项这是一个每秒需要刷新多次的进程因为调用如下 void scrollViewDidScroll UIS
caret：结合分层的 createMultiFolds (repeatedCV) 和 groupKFold

我的问题与中提出的问题非常相似插入符号结合 createResample 和 groupKFold https stackoverflow com questions 48142617 caret combine createresamp
在 pandas 数据框中的两列之间传输值

我有一个像这样的熊猫数据框 p q 0 5 0 5 0 6 0 4 0 3 0 7 0 4 0 6 0 9 0 1 所以我想知道如何将较大的值传输到 p 列反之亦然的 q 列将较小的值传输到 q 列如下所示 p q 0 5 0 5

在 pandas 数据框中的两列之间传输值

在 pandas 数据框中的两列之间传输值 的相关文章

随机推荐

热门标签

在 pandas 数据框中的两列之间传输值的相关文章