生成新列作为其他列的组合

2024-04-18

我有一个 DataFrame，其中包含列中标识符的多个组件以及与另一列中标识符关联的值。我希望能够创建 n 列，使得每一列都是标识参数。

            foo    Type      ID     Index    Value  
25090        x       A        0       0     23272000
25090        x       A        0       0     23272000
25091        x       A        1       0     22896000
25092        x       B        0       1     20048000
25093        y       A        0       0     19760000
25092        y       B        0       1     20823342

我想让它有 n 列Type_ID_Index分组（我可以通过 groupby 获得）并且每一列都有各自的值。我希望该值与 foo 关联。

i.e.

           foo          A_0_0     A_1_0     B_0_1      
25090        x         23272000  22896000  20048000
25090        x         23272000  22896000  20048000
25091        x         23272000  22896000  20048000
25092        x         23272000  22896000  20048000
25093        y         19760000  21568000  20823342
25092        y         19760000  21568000  20823342

我该如何实现这个目标？

从您的示例数据开始

In [3]: df
Out[3]: 
      foo  bar Type  ID  Index     Value

25090   x    9    A   0      0  23272000
25090   x    5    A   0      0  23272000
25091   x    3    A   1      0  22896000
25092   x    3    B   0      1  20048000
25093   y    6    A   0      0  19760000
25092   y    4    B   0      1  20823342

通过应用连接每个行标识符join逐行。

In [4]: identifier = df[['Type', 'ID', 'Index']].apply(
             lambda x: '_'.join(map(str, x)), axis=1)

从您的值列创建一个系列，并通过标识符和 foo 对其进行索引。

In [5]: v = df['Value']

In [6]: v.index = pd.MultiIndex.from_arrays([df['foo'], identifier])

In [7]: v
Out[7]: 
foo       
x    A_0_0    23272000
     A_0_0    23272000
     A_1_0    22896000
     B_0_1    20048000
y    A_0_0    19760000
     B_0_1    20823342
Name: Value, dtype: int64

将其解开，并将其加入到“foo”上的原始 DataFrame 中。

In [8]: df[['foo', 'bar']].join(v.drop_duplicates().unstack(), on='foo')
Out[8]: 
      foo  bar     A_0_0     A_1_0     B_0_1

25090   x    9  23272000  22896000  20048000
25090   x    5  23272000  22896000  20048000
25091   x    3  23272000  22896000  20048000
25092   x    3  23272000  22896000  20048000
25093   y    6  19760000       NaN  20823342
25092   y    4  19760000       NaN  20823342

请注意，我将重复项放入v在拆开它之前。这是至关重要的。如果数据集中任何位置的相同标识符具有不同的值，则会遇到麻烦。

小要点：您的示例输出中有一行 (25094) 在您的示例输入中丢失。另外，我的输出中的 NaN 是有意义的：当 foo='y' 时，A_1_0 未指定任何值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

生成新列作为其他列的组合的相关文章

python 中的并行处理

在 python 2 7 中进行并行处理的简单代码是什么我在网上找到的所有示例都很复杂并且包含不必要的代码我该如何做一个简单的强力整数分解程序在每个核心 4 上分解 1 个整数我真正的程序可能只需要2个核心并且需要共享信息我知
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
Kivy - 有所有颜色名称的列表吗？

在 Kivy 中小部件 color属性允许输入其值作为字符串颜色名称也例如在 kv file Label color red 是否有所有可能的颜色名称的列表就在这里来自Kivy 的文档 https kivy org doc sta
删除 Django 1.7 中的应用程序（和关联的数据库表）

是否可以使用 Django 1 7 迁移来完全删除卸载应用程序及其所有跟踪主要是其所有数据库表如果没有在 Django 1 7 中执行此操作的适当方法是什么 python manage py migrate
Python 中的流式传输管道

我正在尝试使用 Python 将 vmstat 的输出转换为 CSV 文件因此我使用类似的方法转换为 CSV 并将日期和时间添加为列 vmstat 5 python myscript py gt gt vmstat log 我遇到的问题是
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
.pyx 文件出现未知文件类型错误

我正在尝试构建一个包含 pyx 文件的 Python 包 pyregion 但在构建过程中出现错误检查以下输出 python setup py build running build running build py creating b
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
将seaborn.palplot轴添加到现有图形中以可视化不同调色板

将seaborn人物添加到子图中是usually https seaborn pydata org examples cubehelix palette html创建图形时通过传递 ax 来完成例如 sns kdeplot x y cma
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
在系统托盘中隐藏 tkinter 窗口 [重复]

这个问题在这里已经有答案了我正在制作一个程序来提醒我朋友的生日这样我就不会忘记祝福他们为此我制作了两个 tkinter 窗口 1 First one is for entering name and birth date 2 Sec
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
Django 与谷歌图表

我试图让谷歌图表显示在我的页面上但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

pdfkit-警告：阻止访问文件

在 HTML 文件中使用本地图像时使用 pdfkit 库将 HTML 转换为 pdf 时出现错误阻止对文件的访问如何在 HTML 文件中使用本地图像我遇到了同样的问题我通过向 pdfkit from file 添加 enable
深层复制 System.Windows.Forms.WebBrowser 对象/恢复状态

本质上我想要做的是复制一个 WebBrowser 对象以便我可以执行相当于在新选项卡中打开或在新窗口中打开操作从而维护任何已发布的数据我不仅仅想导航到与原始 WebBrowser 对象中相同的 URL 而是想重复 HttpW
许多库上的 APK META-INF 中复制的重复文件？

我在尝试构建 APK 时收到此错误错误任务 app transformResourcesWithMergeJavaResForDebug 执行失败 com android build api transform TransformExc
为什么我应该使用&而不是&？

我为什么要使用 amp 代替为我的网站编写 HTML 时在哪里可以找到我应该编码的其他符号的列表酒吧也是吧如果我将符号按原样粘贴到 html 中可能会遇到什么问题事情是我有一些附属链接我担心如果我在某些情况下用编写它们
PTVS 和 numpy System.Int64 转换中的 numpy 64 位支持

我正在尝试使用 IronPython 和 numpy 编写一些调用 NET 程序集的代码版本信息 numpy 2 0 0 1 scipy 1 0 0 2 铁Python 2 7 1 我根据此处给出的说明安装了 scipy 和 numpy
UIViewContentModeScaleAspectFill 不裁剪

我正在尝试使用以下命令以固定尺寸 100x100 绘制一些缩略图UIImageView 我将图像视图的帧大小设置为 100x100 并将contentMode to UIViewContentModeScaleAspectFill 我的理解
ruby irb 在 Windows 上使用 gitbash shell - 无法使用箭头键修改命令输入？

当我执行 Rails Console 时我的 git bash shell 允许我使用向上箭头来调用命令并使用向左向右箭头来修改我输入的文本当我跑步时irbshell 忽略退格键和箭头键我不确定为什么箭头键在 Rails 控制台的
使用数据中的参数调用 C# 方法

比如说我有一个像这样的 XML 字符串
加载Python lib'/tmp/_MEItueAuk/libpython3.7m.so.1.0'时出错：dlopen：/lib/x86_64-linux-gnu/libc.so.6：找不到版本“GLIBC_2.28”

我已经安装了minidcos https minidcos readthedocs io 使用下面的命令 curl fail L https github com dcos dcos e2e releases download 2019 1
如何在Android中渲染OBJ或FBX？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有几个 obj 和 fbx 格式的 3D 对象其中包含 mtl 和纹理文件我想知道哪个是在 An
嵌套 foreach 到 Linq [重复]

这个问题在这里已经有答案了我是 LINQ 新手请帮助我将这行嵌套代码转换为 LINQ foreach var rule in rules foreach var package in packages if rule KeyFrom p
在 RxJava 中，如何在错误时重试/恢复，而不是完成可观察的

我想要实现的是监控特定变化的偏好当检测到更改时使用新值启动新的网络调用变换结果在 UI 中显示结果我知道更改何时发生现在我认为我需要对某个主题调用 onNext 然后这应该会触发 Rx 链最后我可以更新 UI mViewPe
不使用Setup.exe手动安装Cygwin

在不使用预制安装实用程序时我无法找到正确安装 Cygwin 所需的所有文件这背后的原因是我的公司计算机阻止了 exe 的使用并且不允许我安装它他们说工作不需要它但希望我执行某些任务 Cygwin 会让事情变得更简单所以我的问题是
获取插入行的行数据（Mysql、PHP、mysqli）

当我插入一行时我需要取回该行的 postid 自动递增 PK 我目前正在使用它来获取它 get postid to return if result db gt query SELECT postid FROM posts WHERE t
是否可以在多个函数中重用“param”块？

假设我有一个包含多个函数的脚本这些函数采用完全相同的参数相同的位置相同的类型和约束如下所示 function Verb1 MyValue CmdletBinding param parameter Mandatory true St
tensorflow map_fn TensorArray 形状不一致

我正在使用 map fn 函数并注意到它输出一个 TensorArray 这应该意味着它能够输出锯齿状张量其中内部张量具有不同的第一维度我尝试使用以下代码查看此操作 import tensorflow as tf import n
从 Spark DataFrame 中的单个列派生多个列

我有一个 DF 它有一个巨大的可解析元数据作为 Dataframe 中的单个字符串列我们称之为 DFA 带有 ColmnA 我想通过函数 ClassXYZ Func1 ColmnA 将这一列 ColmnA 分成多个列该函数返回一个类 C
将 CSS include 放在 body 中间有多糟糕？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案那么这个问题是在之后出现的this one https stackoverflow com questions 584294 how bad i
如何在Groovy中执行shell命令并获取返回码$？

我无法从 Groovy 中执行 shell 脚本获得返回代码不是输出或错误对于我尝试过的所有方法它要么要求我转义要么只是打印而不是给我 1 或 0 groovy 75 美元符号后的字符串主体字符非法解决方案要么转义文字美元符号
生成新列作为其他列的组合

我有一个 DataFrame 其中包含列中标识符的多个组件以及与另一列中标识符关联的值我希望能够创建 n 列使得每一列都是标识参数 foo Type ID Index Value 25090 x A 0 0 23272000 25090

生成新列作为其他列的组合

生成新列作为其他列的组合 的相关文章

随机推荐

热门标签

生成新列作为其他列的组合的相关文章