Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序

2024-02-25

我有一个 MultiIndex pandas DataFramedf_multi like:

import pandas as pd

df_multi = pd.DataFrame([['A', 'A1', 0,234,2002],['A', 'A1', 1,324,2550],
['A', 'A1', 2,345,3207],['A', 'A1', 3,458,4560],['A', 'A2', 0,569,1980],
['A', 'A2', 1,657,2314],['A', 'A2', 2,768,4568],['A', 'A2', 3,823,5761]], 
columns=['Product','Scenario','Time','Quantity','Price']).set_index(
['Product', 'Scenario'])

和单个索引 DataFramedf_single like:

df_single = pd.DataFrame([['A', -3,100],['A', -2,100], ['A', -1,100]],
columns=['Product','Time','Quantity']).set_index(['Product'])

对于第一个索引级别中的每个“产品”df_multi，对于第二级中的每个“场景”，我想附加/连接中的行df_single，其中包含一些要附加在正“时间”值之前的负“时间”值df_multi begin.

我还希望生成的 DataFrame 首先由 ['Product','Scenario'] 进行多重索引（就像df_multi），然后按“时间”的升序值排序行。换句话说，期望的结果是：

df_result = pd.DataFrame([['A', 'A1', -3,100,'NaN'],['A', 'A1', -2,100,'NaN'],
['A', 'A1', -1,100,'NaN'],['A', 'A1', 0,234,2002],['A', 'A1', 1,324,2550],
['A', 'A1', 2,345,3207],['A', 'A1', 3,458,4560],['A','A2', -3,100,'NaN'],
['A', 'A2', -2,100,'NaN'],['A', 'A2', -1,100,'NaN'],['A', 'A2', 0,569,1980],
['A', 'A2', 1,657,2314],['A', 'A2', 2,768,4568],['A', 'A2', 3,823,5761]],
columns=['Product','Scenario','Time','Quantity','Price']).set_index(
['Product', 'Scenario'])

EDIT:

df_single没有“场景”值，这可能会令人困惑。只要“Product”匹配，相同的行df_single将被附加到中的每个场景df_multi，并且他们只是免费“继承”场景值。
我正在使用的实际数据框架相当大（每个产品几千个“产品”，几千个“场景”，每个场景几百个“时间”步骤，加上我在示例中没有写的额外列），所以我需要以完全自动化（并且希望快速）的方式来完成此操作。

我尝试用所有的来实现这个join, concat and merge，而我没有成功。实现预期结果的最佳方法是什么？

考虑将索引重置为a的列merge，后面跟着一个groupby聚合仅返回每组一次出现的情况并避免重复。然后，运行串联，concat，然后进行列排序并设置多索引。

# MERGE AND AGGREGATION
df_temp = df_multi.reset_index().merge(df_single.reset_index(), on='Product', suffixes=['','_'])\
                                .groupby(['Product', 'Scenario', 'Time_'])['Quantity_'].max()\
                                .reset_index().rename(columns={'Time_':'Time','Quantity_':'Quantity'})

# ROW BIND CONCATENATION
df_final = pd.concat([df_multi.reset_index(), df_temp])\
                    .sort_values(['Product','Scenario', 'Time'])\
                    .set_index(['Product', 'Scenario'])[['Time', 'Quantity', 'Price']]
print(df_final)
#                   Time  Quantity   Price
# Product Scenario                        
# A       A1          -3       100     NaN
#         A1          -2       100     NaN
#         A1          -1       100     NaN
#         A1           0       234  2002.0
#         A1           1       324  2550.0
#         A1           2       345  3207.0
#         A1           3       458  4560.0
#         A2          -3       100     NaN
#         A2          -2       100     NaN
#         A2          -1       100     NaN
#         A2           0       569  1980.0
#         A2           1       657  2314.0
#         A2           2       768  4568.0
#         A2           3       823  5761.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

join

MERGE

concatenation

Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序的相关文章

在 Django 中处理 subprocess.call()

我正在开发的应用程序的简单想法是用户给出 Linux 命令 Linux 命令的结果将显示在网络浏览器中这是我的观点 py from django shortcuts import render to response from djang
如何让服务器监听多个端口

我想用同一台服务器监听 100 个不同的 TCP 端口这是我目前正在做的事情 import socket import select def main server socket socket socket socket AF INET
在 ReportLab 中向画布元素添加超链接的最简单方法是什么？

我正在使用 ReportLab 使用 Python 制作 pdf 我想向画布添加一个形状并让该形状充当超链接使以下示例中的矩形链接到 google com 的最简单方法是什么 from reportlab pdfgen import c
如何从 Django 中的 ModelForm 手动创建选择字段？

我有一个ModelForm其中字段之一名为creator is a ForeignKey 因此对于 form creator Django 渲染
在 Python 中打开文本文件时出现问题

这看起来应该很简单 f open C Users john Desktop text txt r 但我收到此错误 Traceback most recent call last File
Python 中的类位于不同的文件中吗？

与 Java 或 php 非常相似我习惯将类与文件分开 Python 中也是同样的情况吗另外我应该如何命名该文件像classname py一样小写还是像ClassName py一样如果我想从此类创建一个对象我是否需要做一些特殊的
当按下 flutter 中编写的按钮时，有没有办法运行 python 脚本？

本质上我想做的是按下我在 Flutter 中编程的按钮当按下该按钮时 Python 脚本应该开始在我的 Android 设备上运行我想在 python 中使用 youtube dl 用于下载 Youtube 视频库但我想知道是否
Linux 中如何确定哪个进程正在使用某个端口

我目前正在其默认端口上运行 RethinkDB 因为如果我将浏览器指向localhost 8080我看到 RethinkDB Web 界面我想关闭 RethinkDB 并使用以下命令在另一个端口上重新打开它 port offset争论然
将数据导入 Django 的好方法

我想定期将数据导入 Django 项目我需要告诉我的数据提供者我想要以什么格式接收数据我应该以 Json XML CSV 格式请求吗在 Django 中通常如何处理这个问题 Django 有一个用于导入数据的完整框架称为 Fixtu
利用“写入时复制”将数据复制到 Multiprocessing.Pool() 工作进程

我有一点multiprocessingPython 代码看起来有点像这样 import time from multiprocessing import Pool import numpy as np class MyClass objec
如何在关心 NaN 值的同时获取数据框中值的百分比变化？

我有以下数据框 Date A 2015 01 01 10 2015 01 02 14 2015 01 05 NaN 2015 01 06 NaN 2015 01 07 5 2015 01 10 1 2015 01 11 NaN 2015 0
pytube 在 Android 中传输视频所需的时间太长

我在用pytube在 Android 中流式传输视频借助chaquopy 视频文件 py from pytube import YouTube def video link yt YouTube f https www youtube c
如何在 python 解释器 shell 中重复最后一个命令？

如何重复上一条命令常用键向上 Ctrl 向上 Alt p 不起作用他们创造出无意义的人物 ve kakarukeys localhost ve python Python 2 6 6 r266 84292 Nov 15 2010 21
AIORedis 和 PUB/SUB 不是 asnyc

I used aioredis http aioredis readthedocs org en latest examples html用于编写异步服务该服务将侦听某个通道并以异步方式运行一些命令基本上我从示例页面 http aior
如何在 nltk 中使用 hunpos 标记文本文件？

有人可以帮我解决在 nltk 中标记语料库的 hunpos 语法吗我要导入什么hunpos HunPosTagger module http nltk googlecode com svn trunk doc api nltk tag h
连接字符串：两个字符串列表的“乘法”[重复]

这个问题在这里已经有答案了对于字符串列表将乘法运算定义为连接 l1 aa bb cc l2 11 22 l3 l1 op l2 预期输出 l3 aa11 aa22 bb11 bb22 cc11 cc22 我们可以简单地使用 for l
使用 NaN 获取 pandas 系列模式的最快方法

我需要找到 pandas groupby 对象或单个系列的模式最常见元素为此我有以下函数 def get most common srs from collections import Counter import numpy as n
字典条目被覆盖？ [复制]

这个问题在这里已经有答案了我发现一些输入没有存储在 Python 3 的字典中运行这段代码 N int input How many lines of subsequent input graph for n in range N st
在 Scala 中有效地重复字符/字符串 n 次

我想更有效地执行以下操作 def repeatChar char Char n Int List fill n char mkString def repeatString char String n Int List fill n cha
Python TDD 目录结构

Python 中是否有用于 TDD 的特定目录结构教程讨论测试的内容但不讨论测试的位置通过研究 Python Koans 怀疑它是这样的 project main program py This has main method sta

随机推荐

GAPI 的 OAuth - 首次登录 Javascript 后避免身份验证和授权

我创建了一个 chrome 扩展可以读取电子邮件执行某些操作并使用 javascript 的 google 客户端 API 创建任务我使用 chrome 身份进行身份验证和授权扩展按预期工作然而它每隔一段时间就会要求签名我想要
Boost::Log 和日志编号

我最近尝试通过 Boost log 将一些日志记录添加到一个小型应用程序中但是使用日志轮换由于某种原因我无法让它在日志目录中拾取正确的计数器例如如果我的Logs目录包含文件Log 000 log and Log 001 log我
将 javascript 注入 SwiftUI WebKit

如何将 SwiftUI WebKit 视图的文本大小设置为 State 变量我有这段代码允许我在 SwiftUI 中使用 WebViews import SwiftUI import WebKit struct WebView UIVi
如何在 Angular 2 中实现 Chart.js？

我正在使用最新版本的 Angular 2 V4 0 0 并且我想在我的项目中使用 Chart js 库中的图表而不会有太多复杂性如何在我的 Angular 项目中实现 Chart js 并且不会在最终生产中给我带来问题您可以按照以下说
如何在Opencart中添加子选项？

我使用的是最新的3 0 2 0版本的opencart 对于选项我想添加子选项我也想像选项一样对子选项进行定价从 2009 年及更早的时间起有很多关于 opencart 的依赖选项的讨论但它从未出现在核心版本中为什么大家都说实现依
有任何 API 或 Web UI 项目来管理 Docker 私有注册表吗？

我找不到如何管理私人注册表中的图像我可以推送或拉取图像因为我知道 id 但如何获取推送图像的列表举例来说一个人想要查看其组织的私人注册表下的可用图像她该怎么办除非我弄错了否则我找不到 API 或 Web UI 来发现注册表内容
更改 Mac/Linux 上进程的用户所有者？

我有一个以 root 身份运行的程序该应用程序调用另一个程序 processA 来运行当 processA 运行时它由 root 拥有但我希望它的所有者是当前登录的用户怎么做嗯这有点棘手取决于它是守护进程服务还是运行此命
可以从 Google Chrome 设置面板中的地址栏（小书签）运行 Javascript 吗？

我想制作一个书签来打开谷歌浏览器的设置面板并通过单击清除我的缓存一段时间以来我有一个书签可以打开 Chrome 的设置面板并已选择清除缓存设置单击书签通常在新选项卡中打开它后我必须打开该选项卡并提交表单然而在开发时
msiexec MsiSetExternalUI 的外部处理程序

早上好我希望为 msiexec 实现一个外部处理程序但不能阻止 msiexec 执行任何不同的操作我希望能够利用 MsiSetExternalUI 拦截所有消息但仍然对最终用户具有相同的响应和对话框我的主要目标是拦截安装 msi
UIImage 方面适合并对齐到顶部

看起来像aspect fit默认情况下将图像与框架底部对齐有没有办法override对齐同时保持aspect fit intact 编辑这个问题早于自动布局事实上在提出这个问题的同一周汽车布局就在 WWDC 2012 上公布了简
如何使用 ChefSpec 测试我的 LWRP？

我创建了自定义 LWRP 但是当我运行ChefSpec https github com sethvargo chefspec单元测试它不知道我的 LWRP 操作这是我的resource actions install uninstal
配置文件模板生成makefile

Linux 中几乎所有开源 C 项目都有一个配置文件用于在构建源代码之前生成 Makefile 我正在从头开始编写一个项目这个配置文件有任何模板吗大多数时候配置文件不是手动创建的而是由诸如autoconf http www
在 Windows 10 上的 Lyrix.exe（Delphi 7 旧应用程序）上加载数据库时出错

有一个用 Delphi 7 编写的名为 Lyrix 的应用程序似乎我只有可执行文件夹以及不再运行的安装程序我无法让它在 Windows 10 上运行但它似乎在 Windows XP 7 和 8 1 上运行良好它说 Error c
如何使用CHMOD获得“drwx---r-x+”文件夹权限？ - Bash 脚本 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在通过网络移动某些文件时遇到问题这似乎是由文件权限引起的目前我有具有此权限 drwxrwxrwx 的文件夹我需要运行一个 bash
录制第二个音频剪辑时 MediaRecorder 崩溃

我正在尝试使用 MediaRecorder 录制音频剪辑但当我启动停止和再次启动时我的 Logcat 中不断出现这些错误该活动也将结束 INFO DEBUG 1285 INFO DEBUG 1285 Build fingerprin
Apache poi 分页符

我需要创建一个简单的 Word 文档用于从 java 程序打印有必要将输出打印在单独的页面上我正在使用以下代码 XWPFDocument document new XWPFDocument XWPFParagraph paragraph
读取文件内容时出现奇怪的字符

我不确定出了什么问题 for line in open textfile r print line Output abcd 该文件是使用 textpad 使用 Unix EOL 和 UTF8 编码创建的现在它可以在 notepad 上使
屏幕阅读器无法读取 Firefox 中的 Aria-Live

我遇到一个问题屏幕阅读器无法读取 FireFox 中 aria live 部分中更改的文本这是一个简单的页面示例在 Chrome 中屏幕阅读器会读取更改而在 FireFox 中则不会 div div 难道我做错了什么除了人们在
MySQL查询选择过去N天的记录

我有一张桌子上面有date added列的格式为2014 09 30 20 39 17我有一个网页其中包含供用户使用的过滤器选项基本上我想使用变量来选择不同的日期范围如下所示 SELECT FROM table WHERE date
Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序

我有一个 MultiIndex pandas DataFramedf multi like import pandas as pd df multi pd DataFrame A A1 0 234 2002 A A1 1 324 2550

Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序

Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序 的相关文章

随机推荐

热门标签

Pandas：如何将多索引数据帧与单个索引数据帧连接起来，以及自定义排序的相关文章