python pandas 对列的操作

2024-04-19

您好,我想知道使用 pandas 对 python 中的列进行操作的最佳方法。

我有一个经典数据库,我已将其作为数据框加载,并且我经常必须对每一行进行操作,如果标记为“A”的列中的值大于x,则用列“C”减去列“替换该值” D'

现在我做类似的事情

for i in len(df.index):
    if df.ix[i,'A'] > x :
        df.ix[i,'A'] = df.ix[i,'C'] - df.ix[i, 'D']

我想知道是否有一种更简单的方法来执行此类操作,更重要的是最有效的方法,因为我有大型数据库

我曾尝试过不使用 for i 循环,就像在 R 或 Stata 中一样,建议我使用“a.any”或“a.all”,但我在这里或 pandas 文档中都没有找到任何内容。

提前致谢。


您可以使用布尔掩码与.loc or .ixDataFrame 的属性。

mask = df['A'] > 2
df.ix[mask, 'A'] = df.ix[mask, 'C'] - df.ix[mask, 'D']

如果你有很多分支,那么你可以这样做:

def func(row):
    if row['A'] > 0:
        return row['B'] + row['C']
    elif row['B'] < 0:
        return row['D'] + row['A']
    else:
        return row['A']

df['A'] = df.apply(func, axis=1)

apply通常应该比 for 循环快得多。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python pandas 对列的操作 的相关文章

  • 有没有办法离线将多个 Plotly HTML 文件合并/嵌入到一个页面/HTML 文件中?

    我正在尝试将多个图表合并成一个 HTML 报告来发送 问题是我真的不认为子图是最好的主意 因为图表相对不相关 不同的 X Y 轴 我所需要做的只是将图表附加到 1 个 HTML 文件中 有一个指南解释了如何使用绘图 URL 来完成此操作 但
  • Python中的键盘可中断阻塞队列

    It seems import Queue Queue Queue get timeout 10 键盘可中断 ctrl c 而 import Queue Queue Queue get 不是 我总是可以创建一个循环 import Queue
  • 是否可以在 SQLAlchemy 中创建一个可以创建父记录的事件侦听器?

    有两个表 父表和子表 我想创建一个事件监听器 触发器 如果孩子没有父母 它可以创建父母 这就是我试图做的 class parent db Model tablename parent id db Column db Integer prim
  • 在 python 中返回 self [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个代表对象的类 我有很多方法可以修改这个对象状态 没有明显的返回或显然没有任何返回 在 C 中 我会将所有这些方法声明为void
  • 为什么通过selenium切换到alert不稳定?

    为什么通过selenium切换到alert不稳定 例如 1 运行代码 一切顺利 一切都很顺利 但如果这段代码在几分钟内运行 那么可能会出现错误 例如 没有可以单击的元素 等等 2 在一个站点上有一个警报窗口 alert driver swi
  • Matplotlib 动画未显示

    当我在家里的电脑上尝试这个时 它可以工作 但在工作的电脑上却不行 这是代码 import numpy as np import matplotlib pyplot as plt import matplotlib animation as
  • 混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”

    我得到了 Classification metrics can t handle a mix of multilabel indicator and multiclass targets 当我尝试使用混淆矩阵时出错 我正在做我的第一个深度学
  • Python lmfit:拟合 2D 模型

    我正在尝试将二维高斯拟合到一些灰度图像数据 该数据由一个二维数组给出 lmfit 库实现了一个易于使用的模型类 它应该能够做到这一点 不幸的是文档 http lmfit github io lmfit py model html http
  • 模拟导入失败

    我该如何制作import pkg失败moduleA py 我可以打补丁pkg如果从中导入某些内容则会失败 否则不会失败 test py import os import moduleA from unittest mock import p
  • 将 pandas DataFrame 与 Series 进行比较

    我看过this https stackoverflow com questions 26285661 working with comparing dataframes and series and generating new dataf
  • 插入失败“OperationalError:没有这样的列”

    我尝试使用我尝试修复的姓名和电话创建一个数据库 但它会随时向我重播 File exm0 py line 14 in
  • NumPy 中 exp(-x^2) 的快速傅立叶变换

    I have to calculate numerically the 2nd derivative of a Gaussian function I ve read every question on this topic here bu
  • 来自字典列表列表的 Pandas DataFrame

    我有一个数据结构 它是字典列表的列表 Height 86 Left 1385 Top 215 Width 86 Height 87 Left 865 Top 266 Width 87 Height 103 Left 271 Top 506
  • 如何使用Django模板作为组件?

    我有 5 个模板 index html detail html tag html login html register html and a 基本 html 所有 5 个模板都会扩展基本 html 索引 html 详细信息 html 标签
  • 查找一个列表在另一个列表中的值的索引

    我有两个 Python 整数列表 x and y 的所有元素x出现在某处y 而且只有一次 对于每个元素x 我想知道对应值的索引y 然后我想将这些索引设置为一个列表z 下面的代码按照我刚刚描述的方式工作 然而 对于一项任务来说 这似乎有点笨拙
  • 如何通过pygit2获取当前签出的Git分支名称?

    这个问题应该与 如何获取Git中当前的分支名称 https stackoverflow com questions 6245570 how to get current branch name in git 获取 git 当前分支 标签名称
  • 尝试输入字符串时出现名称错误[重复]

    这个问题在这里已经有答案了 import pickle import os import time class Person def init self number address self number number self addr
  • Snakemake根据字典输入和输出

    我正在尝试重命名 Snakemake 管道中的一些文件 假设我有三个文件 FileA txt FileB txt FileC txt 我希望根据字典重新命名它们dict A 0 B 1 C 2 to get RenamedFile0 txt
  • 交响二阶颂歌

    我有一个简单的二阶 ODE 的齐次解 当我尝试使用 Sympy 求解初始值时 它返回相同的解 它应该替代 y 0 和 y 0 并产生一个没有常数的解 但事实并非如此 这是建立方程的代码 它是一个弹簧平衡方程 k 弹簧常数 m 质量 我在其他
  • 在大型文本文件中查找重复记录

    我在一台 Linux 机器 Redhat 上 并且有一个 11GB 的文本文件 文本文件中的每一行包含单个记录的数据 并且该行的前 n 个字符包含该记录的唯一标识符 该文件包含略多于 2700 万条记录 我需要验证文件中不存在具有相同唯一标

随机推荐

  • 模块“tensorflow._api.v2.train”没有属性“GradientDescentOptimizer”

    我使用Python 3 7 3并安装了tensorflow 2 0 0 alpha0 但是存在一些问题 例如 模块 tensorflow api v2 train 没有属性 GradientDescentOptimizer 这是我的全部代码
  • 如何在CWorkerThread中编写简单的后台线程

    我正在尝试在 Internet Explorer 的附加组件中异步运行函数 我正在用 VC 编写 BHO 按照建议here https stackoverflow com questions 4285346 threading in bho
  • 使用 ruby​​ 解压缩(zip、tar、tag.gz)文件

    我想解压很多 zip 文件 是否有模块或脚本可以检查 zip 文件的格式并对其进行解压缩 这应该适用于Linux 我不关心其他操作系统 要从 tar gz 文件中提取文件 您可以使用随 Ruby 分发的包中的以下方法 require rub
  • “constexpr”函数的“noexcept”行为

    的措辞 expr unary noexcept 改变于C 17 之前 n4140 5 3 7 noexcept 运算符 expr unary noexcept https timsong cpp github io cppwp n4140
  • 无模板 Django + AJAX:Django 的 CSRF 令牌会在浏览会话过程中更新吗?

    我当前的设置是 AngularJS Django 1 5 我完全放弃了 Django 模板引擎的使用 即后端几乎是一个 API 服务器 由于我没有使用csrf tokentemplate 标签 Django 反过来 不会设置和发送csrft
  • 将 qDebug 重定向到 QTextEdit

    我想用qInstallMessageHandler handler 重定向qDebug to QTextEdit 我在类中定义了一个处理函数 void Spider redirect QtMsgType type const QMessag
  • 视图内的滚动视图无法正常反应本机

    在这里 我正在尝试一个简单的代码 但如果保留在另一个视图中 滚动视图将无法工作 代码是这样的 return
  • android studio 立即删除我的复制和粘贴导入语句

    我有一个由 android studio 0 8x 设置的项目 空白活动 但是当我粘贴 ctrl v 一些导入语句时 如下所示 import android app Activity import android content res R
  • 判断一个变量是否在数组中? [复制]

    这个问题在这里已经有答案了 我有一个变量 var code de 我有一个数组 var countryList de fr it es 有人可以帮助我 因为我需要检查该变量是否在 CountryList 数组内 我的尝试在这里 if cod
  • CUDA 中的广义霍夫变换 - 如何加快分箱过程?

    正如标题所示 我正在对并行计算机视觉技术进行一些个人研究 使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换 我遇到的唯一问题是在投票过程中 我调用atomicAdd 来防止多个同时写入操作 但我似乎没有获得太多的性能效率 我在网上搜索
  • 拖动我的 MKAnnotationView 后拖动地图不会随之移动 MKAnnotationView

    MKPinAnnotationView 不允许您使用自定义图像作为 图钉 并同时启用拖动 因为一旦开始拖动 图像就会变回默认图钉 因此我使用 MKAnnotationView 而不是 MKPinAnnotationView 虽然使用 MKA
  • 无法将“&Thing”与“Thing”进行比较

    我知道该错误意味着什么 但我无法修复它 我在用着mockers为了测试我的工作 当我尝试验证提供给模拟特征函数的结构参数时 我陷入了困境 简化的代码 cfg test extern crate mockers cfg test extern
  • Google feed api 已弃用,我如何找到网站的 rss feed? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我使用 Google Feed API 来查找特殊关键字或网站的 rss feed 现在这个 api
  • 如何计算EMGU中两幅图像之间的相关性?

    我有两个图像 假设它们具有相同的大小 我想使用 EMGU 和 C 计算两个图像之间的相关性 我没有找到任何函数可以做到这一点 并自己实现了相关性计算 但我宁愿使用内置函数 有这样的功能吗 Thanks I think 图像 MatchTem
  • Symfony2 隐藏字段上的数据转换器

    我已经搜索过 但没有发现有人遇到这个问题 我已经按照食谱中的规定创建了自己的数据转换器 一切似乎都是正确的 但我收到错误 表单的视图数据应该是 Niche SecurityBundle Entity BusinessUser 类的实例 但它
  • didEnterRegion 以更大的半径调用(iOS)

    我希望更精确地调用 didEnterRegion 但我无法做到这一点 以下是我所做的 我使用了 distanceFilter 和desiredAccuracy 的最佳值 Apple 提供的最精确的 GPS 设置 并设置了目标 CLCircu
  • 使用 cocoapods 更改导入的库

    我正在使用 cocoapods 进行一个项目 突然我发现自己在其中一个库中进行了一些更改 我怎样才能确保这些更改永远不会被覆盖pod update 有没有办法在不更新 github 项目的情况下在 pod 中引入更改 更新 分叉项目 我尝试
  • Solr 索引与存储

    我对太阳能场的索引和存储属性的行为有点困惑 例如 如果我在 Schema xml 中有以下内容
  • 初始化NSObject时预留了多少内存?

    当我在 Objective c 中使用这个语句时 NSObject object NSObject alloc init 为对象保留多少内存 您可以使用以下代码测试对象的大小 import
  • python pandas 对列的操作

    您好 我想知道使用 pandas 对 python 中的列进行操作的最佳方法 我有一个经典数据库 我已将其作为数据框加载 并且我经常必须对每一行进行操作 如果标记为 A 的列中的值大于x 则用列 C 减去列 替换该值 D 现在我做类似的事情