将数据框与从应用函数创建的另一个数据框合并？

2023-12-28

我有一个数据框，df，工资数据：

State,Annual Salary
New York, 132826
New Hampshire,128704
California,127388
Vermont,121599
Idaho,120011

还有一个函数，get_taxes_from_api调用 API 并返回输入州的税号和年薪作为只有 1 行的数据框，如下所示：

State,annual.fica.amount,annual.federal.amount,annual.state.amount
North Carolina,8918,40334,6364

它的类型是：<class 'pandas.core.frame.DataFrame'>不是系列。我想在 df 的每一行上调用 API，然后合并每个生成的 1 行数据帧。就像是：

State,Annual Salary,annual.fica.amount,annual.federal.amount,annual.state.amount
North Carolina, 116500,8918,40334,6364
New York, 132826, . . . 
New Hampshire,128704, . . . 
California,127388, . . . 
Vermont,121599, . . . 
Idaho,120011, . . .

我该怎么做呢？我遇到了一个错误，我下面的 lambda 创建了一个 Series 而不是一个 dataframe，所以像这里一样使用 result_type=expand 进入了这个兔子洞'https://stackoverflow.com/a/62849468/2415706' https://stackoverflow.com/a/62849468/2415706但它仍然坏了：

all_tax_df = df[['State','Annual Salary']].apply(lambda row: get_taxes_from_api(row['State'],row['Annual Salary']), axis=1, result_type='expand')


# merge all_tax_df with df on 'State'

你不需要指定result_type为了.apply() https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.apply.html当里面应用的函数时调用.apply()返回 pandas 系列。来自官方文件 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.apply.html:

在函数内返回一个 Series 类似于传递 result_type='展开'。生成的列名称将是系列指数。

此外，对于默认的result_type=None:

默认行为（无）取决于返回值应用函数：....如果应用函数返回一个系列，这些是扩展到列。

作为你的API（里面的应用函数.apply()调用）返回一个 1 行 DataFrame，您可以通过以下方式轻松将其转换为 Series.squeeze() https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.squeeze.html调用，如下所示：

df[['State','Annual Salary']].apply(
    lambda row: get_taxes_from_api(row['State'], row['Annual Salary']).squeeze(), axis=1)

这样的结果apply()call 仅包含 API 调用返回的列，不包含该列Annual Salary在你的原始数据框中。您可以致电.merge() https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.merge.html将原始数据帧与返回的结果数据帧合并apply()以获得您想要的布局。您可以在一行中执行 2 个步骤：

all_tax_df = df.merge(df[['State','Annual Salary']].apply(
    lambda row: get_taxes_from_api(row['State'], row['Annual Salary']).squeeze(), axis=1))

Test Run

col = ['State','Annual Salary']
dat = [['New York', 132826], ['New Hampshire',128704], ['California',127388], ['Vermont',121599], ['Idaho',120011]]
df = pd.DataFrame(dat, columns=col)

def get_taxes_from_api(state, annual_salary):
    return pd.DataFrame({'State': [state], 
                         'annual.fica.amount': [int(annual_salary * 0.067)], 
                         'annual.federal.amount': [int(annual_salary * 0.3)], 
                         'annual.state.amount': [int(annual_salary * 0.048)]})


all_tax_df = df.merge(df[['State','Annual Salary']].apply(
    lambda row: get_taxes_from_api(row['State'], row['Annual Salary']).squeeze(), axis=1))



print(all_tax_df)




           State  Annual Salary  annual.fica.amount  annual.federal.amount  annual.state.amount
0       New York         132826                8899                  39847                 6375
1  New Hampshire         128704                8623                  38611                 6177
2     California         127388                8534                  38216                 6114
3        Vermont         121599                8147                  36479                 5836
4          Idaho         120011                8040                  36003                 5760

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将数据框与从应用函数创建的另一个数据框合并？的相关文章

ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
更新 SQLAlchemy 中的特定行

我将 SQLAlchemy 与 python 一起使用我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码但它不起作用 session

随机推荐

删除图中的文本

我正在使用绘图功能sizetree from library plotrix 版本 3 8 1 这个函数有一个showcount允许括号中的一些计数显示在绘图上的参数见下图但我想知道为什么当我使用showcount FALSE 它们周围
Python 游戏网络

我目前在寻找网络游戏编程资源时遇到困难特别是Python 我不知道任何其他语言我在 Python 中发现了很多关于通用网络的东西但我不确定这就是我需要的因为我相信游戏网络还涉及一些其他因素我正在尝试创建一个在不同计算机上玩的 2
Python。如何使用libxml2获取属性值

我使用的是 MINIDOM 但它不提供 xpath 方法我现在尝试使用 libxml2 但在检索属性值时遇到问题我的 xml 摘录如下
jersey 2.3.1 和 spring 集成兼容性问题

我正在尝试创建将使用球衣和弹簧的宁静服务项目设置我最初下载了 jersey1 8 依赖的 jar 我还得到了 jersey spring 1 8 并且我使用 com sun jersey spi spring container serv
如何使用一对 FrameLabels 制作绘图网格？

创建行列网格图整个网格具有单个 FrameLabel 的最简单方法是什么我需要类似的东西 p ListPlot RandomInteger 10 5 Joined gt True Axes gt False Frame gt Tru
Google 地图 API 3 搜索框

我不知道如何在我的谷歌地图中实现搜索框我有它用户可以从表单中选择一些内容然后在地图上加载标记现在我想添加他们可以使用谷歌搜索框输入城市和州的位置例如在maps google com上这可以通过 API v 3 来完成吗 Goog
Eclipse：选择不包含任何可以在服务器上运行的资源

我无法将 Maven Java Web 应用程序项目运行到 Eclipse IDE 中配置的 Tomcat 最初我可以右键单击该项目并在 tomcat 服务器上运行它但自从我将项目共享到存储库后我无法执行此操作我从存储库中断开了项目
确定 JS AudioContext.analysisrNode 中的频率

背景我的目标是创建一个基于 JavaScript 的 Web 应用程序来分析和显示音频源包括页内源中的频率信息
当理论规定使用已检查异常时，我是否应该使用相关的内置未检查异常？

SO 上有很多关于检查与非检查异常主题的帖子这个答案 https stackoverflow com a 19061110 2520359可能是最全面信息最丰富的然而我仍然对遵循那里提出的逻辑感到矛盾这是有原因的我正在围绕一
我应该在我的应用程序中包含命令行模式吗？

出于学习目的我正在 C 和 winforms 中开发一个类生成应用程序我认为包含允许在脚本中使用应用程序的命令行模式可能会很好在我的应用程序中包含命令行模式是一个很好的做法吗最好有两个不同的程序一个带有 GUI 一个用于命令行实
如何使 Flask/Jinja2 加载可执行 zip 存档中的捆绑模板？

我已将 Flask Web 应用程序打包成可执行的 Python 压缩存档 zipapp https docs python org 3 6 library zipapp html 我在加载模板时遇到问题 Flask Jinja2 无法找到
如果 ASP.NET 破坏了 DIV 的 ID，如何从 javascript 访问该 DIV？

我有一个包含 div 元素的网页在页面上有 javascript 来引用 div document getElementById divId 在另一位开发人员重新设计该页面以使用 ASP 母版页之前该方法一直运行良好 Now docu
流复制和逻辑复制的区别

有人能告诉我更多关于 PostgreSQL 中物理复制和逻辑复制之间的区别吗 TL DR 逻辑复制发送逐行更改物理复制发送磁盘块更改逻辑复制对于某些任务更好而物理复制对于其他任务更好请注意在 PostgreSQL 12 更新时的当
Rails 购物车 - 未添加到当前订单

这里是 Rails 菜鸟我正在构建一个基本的购物车它之前运行良好在不更改任何代码的情况下我 git reset hard 到我以前的提交它正在工作它就崩溃了这是细分 Github 仓库 https github com chr
编译引用的dll

使用VS2005和VB NET 我有一个项目它是我创建的数据存储的 API 编译时创建api dll 我在同一解决方案中有第二个项目它有一个对 API 项目的项目引用编译时将创建wrapper dll 这基本上是特定于应用程序的 AP
显示对象而不是字符串

在这里我附上了我的问题的快照和代码它只向我显示作为对象的内容但完美地显示组名这个问题的快照在下面的链接中给出只需浏览这张图片 http imageupload org d 4DA941521 快照 gt 我想要特定组名称的子数据
使用 kafka 进行 Spark 结构化流处理只会导致一批（Pyspark）

我有以下代码我想知道为什么它只生成一批 df spark readStream format kafka option kafka bootstrap servers IP option subscribe Topic option st
如何设计一个数据库来存储属性，通过同义词选择属性

我正在为房地产应用程序设计一个数据库事实证明它比我预期的更复杂也许我把事情复杂化了这些问题本质上是由于以下因素的存在造成的同义词例如术语公寓公寓和顶层公寓本质上都指的是同一类型的房产属性不同的属性类型有不同的属性例如
批处理：连接变量和字符串以形成输出路径

我有一个批处理文件用户在其中输入文件的路径然后从该路径中提取文件名我使用该文件名创建一个同名的文件夹在该文件夹中我想创建一个 log txt 文件我在批处理文件中调用的进程可以将其日志消息写入其中这是代码 set p path
将数据框与从应用函数创建的另一个数据框合并？

我有一个数据框 df 工资数据 State Annual Salary New York 132826 New Hampshire 128704 California 127388 Vermont 121599 Idaho 120011 还

将数据框与从应用函数创建的另一个数据框合并？

Test Run

将数据框与从应用函数创建的另一个数据框合并？ 的相关文章

随机推荐

热门标签

将数据框与从应用函数创建的另一个数据框合并？的相关文章