使用多个条件在数据框中创建列

2024-01-19

我正在尝试使用基于数据框中其他信息的多个条件语句在 Pandas 数据框中创建一个新列。我尝试使用 .iteritems() 进行迭代。这有效，但看起来不优雅，并返回一个我不知道如何理解和/或纠正的通知。

我的代码片段是：

proj_file_pq['pd_pq'] = 0

for key, value in proj_file_pq['pd_pq'].iteritems():

    if proj_file_pq['qualifying'].iloc[key] - \
        proj_file_pq['avg_pd'].iloc[key] < 1:
        proj_file_pq['pd_pq'].iloc[key] = \
            proj_file_pq['qualifying'].iloc[key] - 1

    elif proj_file_pq['qualifying'].iloc[key] > \
        proj_file_pq['avg_start'].iloc[key]:
        proj_file_pq['pd_pq'].iloc[key] = \
            proj_file_pq['qualifying'].iloc[key] - \
                proj_file_pq['avg_finish'].iloc[key]

    elif proj_file_pq['qualifying'].iloc[key] + \
        proj_file_pq['avg_pd'].iloc[key] > 40:
        proj_file_pq['pd_pq'].iloc[key] = \
            40 - proj_file_pq['qualifying'].iloc[key]

    else:
        proj_file_pq['pd_pq'].iloc[key] = proj_file_pq['avg_pd'].iloc[key]

print(proj_file_pq[['Driver', 'avg_start', 'avg_finish', 'qualifying',\
                     'avg_pd', 'pd_pq']].head())

这是结果输出：

C:\Python36\lib\site-packages\pandas\core\indexing.py:189: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  self._setitem_with_indexer(indexer, value)
              Driver  avg_start  avg_finish  qualifying  avg_pd  pd_pq
0  A.J. Allmendinger     18.000      21.875          16   3.875  3.875
1        Alex Bowman     14.500      18.000           8   3.500  3.500
2      Aric Almirola     21.250      19.250          13  -2.000 -2.000
3      Austin Dillon     18.875      18.375          17  -0.500 -0.500
4        B.J. McLeod     33.500      33.500          36   0.000  2.500

原始数据帧具有以下头部：

{'Driver': {0: 'A.J. Allmendinger', 1: 'Alex Bowman', 2: 'Aric Almirola', 3: 'Austin Dillon', 4: 'B.J. McLeod'}, 'qualifying': {0: 16, 1: 8, 2: 13, 3: 17, 4: 36}, 'races': {0: 8, 1: 6, 2: 8, 3: 8, 4: 2}, 'avg_start': {0: 18.0, 1: 14.5, 2: 21.25, 3: 18.875, 4: 33.5}, 'avg_finish': {0: 21.875, 1: 18.0, 2: 19.25, 3: 18.375, 4: 33.5}, 'avg_pd': {0: 3.875, 1: 3.5, 2: -2.0, 3: -0.5, 4: 0.0}, 'percent_fl': {0: 0.0036250647332988096, 1: 0.0071770334928229675, 2: 0.03655483224837256, 3: 0.006718346253229974, 4: 0.0}, 'percent_ll': {0: 0.0031071983428275505, 1: 0.001594896331738437, 2: 0.03505257886830245, 3: 0.006718346253229974, 4: 0.0}, 'percent_lc': {0: 0.9587884806355512, 1: 0.6226415094339622, 2: 0.9915590863952334, 3: 0.9607745779543198, 4: 0.2398212512413108}, 'finish_rank': {0: 25.0, 1: 17.0, 2: 20.5, 3: 19.0, 4: 35.0}, 'pd_rank': {0: 7.0, 1: 9.0, 2: 26.0, 3: 23.0, 4: 19.5}, 'fl_rank': {0: 28.0, 1: 21.0, 2: 8.0, 3: 22.0, 4: 35.0}, 'll_rank': {0: 19.0, 1: 24.0, 2: 6.0, 3: 16.0, 4: 31.0}, 'overall': {0: 79.0, 1: 71.0, 2: 60.5, 3: 80.0, 4: 120.5}, 'overall_rank': {0: 22.0, 1: 20.0, 2: 13.0, 3: 24.0, 4: 34.0}, 'pd_pts': {0: 3.875, 1: 3.5, 2: -2.0, 3: -0.5, 4: 0.0}, 'fl_pts': {0: 0.5455722423614707, 1: 1.0801435406698563, 2: 5.50150225338007, 3: 1.0111111111111108, 4: 0.0}, 'll_pts': {0: 0.2338166752977732, 1: 0.12001594896331738, 2: 2.6377065598397595, 3: 0.5055555555555555, 4: 0.0}, 'finish_pts': {0: 22.0, 1: 30.0, 2: 26.5, 3: 28.0, 4: 12.0}, 'total_pts': {0: 26.654388917659244, 1: 34.70015948963317, 2: 32.63920881321983, 3: 29.016666666666666, 4: 12.0}}

感谢有关改进这一点的建议。

设置您的条件：

c1 = (df.qualifying - df.avg_pd).lt(1)
c2 = (df.qualifying.gt(df.avg_start))
c3 = (df.qualifying.add(df.avg_pd).gt(40))

以及您相应的输出：

o1 = df.qualifying.sub(1)
o2 = df.qualifying.sub(df.avg_finish)
o3 = 40 - df.qualifying

Using np.select:

df['pd_pq'] = np.select([c1, c2, c3], [o1, o2, o3], df.avg_pd)

              Driver  qualifying       finish_pts  total_pts  pd_pq
0  A.J. Allmendinger    0.233817    ...    22.0    26.654389  3.875
1        Alex Bowman    0.120016    ...    30.0    34.700159  3.500
2      Aric Almirola    2.637707    ...    26.5    32.639209 -2.000
3      Austin Dillon    0.505556    ...    28.0    29.016667 -0.500
4        B.J. McLeod    0.000000    ...    12.0    12.000000  2.500

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

使用多个条件在数据框中创建列的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
Docker 中的 Python 日志记录

我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本我正在尝试查找由 Python Logger 模块生成的日志文件下面是我的Python脚本 import time import logging
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

Xlib XGetWindowProperty 返回零项

我在读取某些 XWindow ICCCM 属性时遇到问题问题实际上是当我尝试读取 NET WM STATUS 属性时我正在使用的功能是 int get property value Display display Window wind
如何在 vaadin 网格中显示复选框而不是布尔值？

我正在尝试将我的布尔值显示为 vaadin 网格中的复选框我无法使用多选模式因为我需要两列带有复选框复选框外壳的列有标题但复选框本身外壳没有标题有人有想法吗我建议使用这个仓库https github com vaadin gri
除了ant之外，java最好的构建工具是什么？

不知怎的我不太喜欢IDE 但我还没有找到一个特别好的工具来从源代码构建java应用程序我欢迎各种反馈 Maven 是另一种选择但我不知道我是否会称其为最佳如果使用得当 Ant 的优点是简单我发现 Maven 更重并且更难穿透
不带命名空间的 Python XpathEvaluator

我需要编写一个动态函数来查找 ATOM xml 文档子树上的元素为此我写了这样的内容 tree etree parse xmlFileUrl e etree XPathEvaluator tree namespaces def http
使用 Android 应用程序链接作为 OAuth2 重定向 URI

是否可以使用 Android 应用程序链接从https 例如 https my app com callback在 OAuth2 流程结束时从 Android WebView 重定向回我的应用程序我知道正常的深度链接是如何工作的例如c
悬停时为标签添加下划线

我想要我的 a 悬停时标签会带有下划线我有以下代码但它不起作用 a
为什么我随 Alcatraz 安装的 Xcode 插件（例如 clang 格式）在更新到新版本 Xcode 后不再工作？

今天我更新到 Xcode 6 3 2 但无法运行 Clang 代码格式化看起来它甚至没有安装每次更新 Xcode 时我都必须重新安装 Alcatraz 和大部分软件包为什么才能使它们在新版本的 Xcode 上运行这次我重新安装
Android Jsoup，为什么我无法获取正确的img src

我无法获得正确的 img src 这是我想要获取的 HTML 该图像是数据方案 URI img class rg i Q4LuWd tx8vtf src alt 大阪保護猫 SAVE CAT CAFE 而且这是我的代码 val url
为什么解决背包问题不被视为线性规划？

为什么背包问题不属于线性规划算法尽管背包问题陈述看起来与中的问题相似线性规划背包可以写成整数线性规划程序与普通的线性规划不同该问题要求解中的变量是整数已知线性规划可在多项式时间内求解而整数线性规划是 NP 完全的读者练习证明
ASP.NET Core 2.1 Razor页面返回带有模型的页面

我正在使用 ASP NET Core 2 1 创建身份服务器我使用 Asp Identity 并搭建了登录和注册页面我有以下页面 AllowAnonymous public class RegisterModel PageModel p
iPhone PHP 集成

我想制作一个 iPhone 应用程序将一些数据发送到 php 网站哪种方法最好有人知道像 facebook 这样的应用程序是如何做到的吗我可以避免使用 SSL 吗 Thanks Cocoa Touch 有 HTTP 类例如 CFH
mySQL 5.7 使用新的 json 功能将行返回为 json

我正在回顾一些新的JSON 特性 https dev mysql com doc refman 5 7 en json html并想知道是否有一种聪明或明显的方法将行集作为 JSON 对象返回理想情况下无需命名键或使用任何类型的字符
重命名了Heroku的主机名，现在找不到应用程序

我之前的 Heroku 应用程序名称位于 shielded meadow 9293 heroku com 这是我创建 Heroku 遥控器并启动测功机时的名称一切顺利后我把名字改成了 platformdesignmadness hero
手动创建 Django QuerySet 或者手动将对象添加到 QuerySet

基本上我需要一种优雅的方式来执行以下操作 obj1 Model1 objects select related model2 get attribute1 value1 obj2 Model1 objects select related
如何更改 django 表单字段的帮助文本？

这是我的群组消息模型它扩展了另一个模型Message其中还有一些其他字段例如text time etc class GroupMessage Message group models ForeignKey Group related n
如何在 PHP 中获取当前日期/时间作为日期对象

如何获取今天的日期作为日期对象我正在尝试计算某个开始日期和今天之间的差异以下内容将不起作用因为getdate 返回一个数组而不是日期对象 today getdate start date create 06 20 2012 diff
将堆栈标签传递到 Cloudformation 中的嵌套堆栈

我可以使用以下命令轻松地将参数传递给嵌套的 Cloudformation 堆栈AWS CloudFormation Stack 包括参考值 MyNestedStack Type AWS CloudFormation Stack Condit
对“strnlen_s”、strncpy_s“、strncat_s”的未定义引用[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 length strnlen s str i sizeof str i create array to hold all strings
如何防止 asp.net 将我放置在服务器控件中的自定义属性设为小写

我有一个 aspx 页面及其上的控件为了在客户端 javascript 中使用它我想为我的元素放置属性我想在标记中完成这一切而不是在代码后面看来放置的属性在客户端将全部小写例如
使用多个条件在数据框中创建列

我正在尝试使用基于数据框中其他信息的多个条件语句在 Pandas 数据框中创建一个新列我尝试使用 iteritems 进行迭代这有效但看起来不优雅并返回一个我不知道如何理解和或纠正的通知我的代码片段是 proj file pq

使用多个条件在数据框中创建列

使用多个条件在数据框中创建列 的相关文章

随机推荐

热门标签

使用多个条件在数据框中创建列的相关文章