Pandas：连接数据帧并保留重复索引

2024-03-09

我有两个数据框，我想将它们按列（axis=1）与内部联接连接起来。其中一个数据帧有一些重复的索引，但行不重复，我不想丢失其中的数据：

df1 = pd.DataFrame([{'a':1,'b':2},{'a':1,'b':3},{'a':2,'b':4}],
                   columns = ['a','b']).set_index('a')

df2 = pd.DataFrame([{'a':1,'c':5},{'a':2,'c':6}],columns = ['a','c']).set_index('a')

>>> df1
   b
a   
1  2
1  3
2  4
8  9

>>> df2
   c
a   
1  5
2  6

默认concat行为是用 NaN 填充缺失值：

>>> pd.concat([df1,df2])
    b   c
a
1   2 NaN
1   3 NaN
2   4 NaN
1 NaN   5
2 NaN   6

我想保留 df1 中的重复索引并用 df2 中的重复值填充它们，但在 pandas 0.13.1 中，列上的内部联接会产生错误。在更新版本的 pandas concat 中，我想要做的事情：

>>> pd.concat([df1, df2], axis=1, join='inner')
   b  c
a      
1  2  5
1  3  5
2  4  6

实现我想要的结果的最佳方法是什么？有分组解决方案吗？或者也许我不应该使用concat at all?

您可以执行合并并设置参数以使用左侧和右侧的索引：

In [4]:    
df1.merge(df2, left_index=True, right_index=True)
Out[4]:
   b  c
a      
1  2  5
1  3  5
2  4  6

[3 rows x 2 columns]

Concat 应该有效，它对我有用：

In [5]:

pd.concat([df1,df2], join='inner', axis=1)
Out[5]:
   b  c
a      
1  2  5
1  3  5
2  4  6

[3 rows x 2 columns]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

concatenation

Pandas：连接数据帧并保留重复索引的相关文章

带有指针数组的 cython

我在 python 中有一个 numpy ndarrays 列表具有不同的长度并且需要非常快速地访问 python 中的列表我认为指针数组就可以解决问题我试过 float type t list of arrays no of ar
美丽的汤从谷歌搜索中提取href

谷歌搜索给出了以下 HTML 的第一个结果 h3 class r a href https rads stackoverflow com amzn click com 0470284889 class l vst em Quantitati
将打开关闭的 Google Chrome 浏览器添加到 Selenium linkedin_scraper 代码中

我正在尝试抓取一些知名人士的 LinkedIn 个人资料该代码获取一堆 LinkedIn 个人资料 URL 然后使用Selenium and scrape linkedin收集信息并将其作为 json 文件保存到文件夹中我遇到的问题是
创建圆形图像 PIL Tkinter

Currently I have a zoom feature in my application that works very well however I d like the actual zoom box to be a circ
使用信号时出现 django TransactionManagementError

我有一个与 django 的用户和 UserInfo 一对一的字段我想订阅用户模型上的 post save 回调函数以便我也可以保存 UserInfo receiver post save sender User def saveUse
在 Python 3 中动态导入模块的问题

我遇到的情况是在我的 Python 3 项目中在运行时必须包含某些模块我在用着importlib import module为了这第二次更新我确实找到了一种方法来做一些接近我想要的事情一些额外的代码可能会使我的一些链接稍微偏离一
使用字母而不是数字进行顺序计数[重复]

这个问题在这里已经有答案了我需要一种方法将字符串递增到 z 然后将 aa 递增到 az 然后将 ba 递增到 bz 依此类推就像 Excel 工作表中的列一样我将向该方法提供前一个字符串它应该增加到下一个字母 PSEUDO C
在加载“cv2”二进制扩展期间检测到递归

我有一个小程序在 pyinstaller 编译后返回 opencv 错误但无需编译即可工作我在 Windows 10 上使用 Python 3 8 10 Program 导入 pyautogui将 numpy 导入为 np导入CV2
使用 Python 的文本中的词频但忽略停用词

这给了我文本中单词的频率 fullWords re findall r w allText d defaultdict int for word in fullWords d word 1 finalFreq sorted d iterit
理解@property装饰器和继承[重复]

这个问题在这里已经有答案了这里是 Python 3 以防万一它很重要我试图正确理解如何实现继承 property使用我已经搜索了 StackOverflow 并阅读了大约 20 个类似的问题但无济于事因为他们试图解决的问题略有不同
如何使用 python 操作系统更改驱动器？

我正在尝试更改当前目录C to Y 我试过 import os os chdir Y 但我不断收到错误消息提示无法找到驱动器本质上我正在寻找相当于 cd d cmd 中的命令你确定吗Y 确实是有效的驱动器号吗 Try os chdir
InvalidArgumentException：消息：无效参数：“using”必须是字符串

我对 python 很陌生试图创建可重用的代码当我尝试通过传递 Login 类下使用的所有参数来调用 test main py 中的 Login 类和函数 login user 时我收到错误 InvalidArgumentExcept
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
管理文件字段当前 url 不正确

在 Django 管理中只要有 FileField 编辑页面上就会有一个当前框其中包含指向当前文件的超链接但是此链接会附加到当前页面 url 因此会导致 404 因为不存在这样的页面例如 http 127 0 0 1 8000
如何从数据框的单元格中获取值？

我构建了一个条件从我的数据框中提取一行 d2 df df l ext l ext df item item df wn wn df wd 1 现在我想从特定列中获取一个值 val d2 col name 但结果我得到一个包含一行和一列
x11 - 导入错误：没有名为“kivy.core.window.window_x11”的模块

目前我正在尝试构建一个我通过 buildozer 用 Python 和 Kivy 编写的应用程序无论我在做什么我都会遇到 window x11 的问题即使我在代码中注释掉所有与 Windows 相关的内容或执行本文中描述的所有操作这
PyQt - 如何检查 QDialog 是否可见？

我有个问题我有这个代码 balls Ball for i in range 1 10 因此当我说 Ball 时这将在 QDialog 上绘制一个球然后当这完成后我正在移动球QDialog无限循环中我想说类似的话while QDi
如何使用数据库在 Django 中的应用程序之间交换数据？

我正在使用 Django 在网络上工作我创建了 2 个应用程序第一个用于客户端注册并将其数据添加到数据库第二个应用程序供用户访问和查看交互界面这个想法是使用第二个应用程序从数据库中的客户端获取数据并使用它向用户显示一些信息我的问
向量化 numpy bincount

我有一个 2d numpy 数组 A我要申请np bincount 到矩阵的每一列A生成另一个二维数组B由原始矩阵每列的 bincounts 组成A 我的问题是 np bincount 是一个采用一维数组的函数它不是像这样的数组方法B A

随机推荐

Java 类加载器和依赖解析

有人可以澄清一下类加载器的作用不仅是加载单个类而且还加载其依赖项吗如果是这样整个过程到底需要什么如果可能的话我正在寻找实施细节例如在某些时候必须从某个地方网络或文件系统位置读取字节并且必须根据类规范名称和类的预知来计
Hyperledger Fabric 中的多个智能合约

如何在 Hyperledger Fabric 的同一个应用程序中实施多个智能合约哪个配置文件包含实现此目的的设置我将使用 Hyperledger Fabric 版本 1 4 中的 Fabcar 示例来回答您的问题我的回答是基于 Jav
OPC 新手指南：如何编写 C# Hello World 客户端？

这是我的情况我们开发了一款用于监控太阳能发电厂的软件我必须介绍 OPC 作为一种从物理设备本身获取数据的新方法这就是为什么我最终尝试了解 OPC 但迄今为止这令人沮丧我已经安装了 Matrikon 模拟器并使用 Matrikon
Jquery - 将html字符串附加到变量中的html字符串

我正在尝试创建一个 HTML 字符串然后使用额外的 HTML 和属性修改该 HTML 字符串但它不起作用我究竟做错了什么 document ready function body on click button function va
将激活上下文 API 与不同位置的许多 dll 一起使用

我在位置 A 运行的 Net 客户端中使用激活上下文 API 在 WS2008 上的位置 B 与 A 完全不同的位置不是同一台计算机上的同级后代等加载 COM 组件无需注册通过在 ACTCTX 中传递位置 B 它工作正常但是我现
主线程执行完成后，Spring Batch 线程不返回

我是春季批次的新手我已经通过使用多个线程从 spring 创建并成功执行了作业它工作得很好除了程序执行完成时程序流不会结束停止即即使主方法的最后一条语句被执行程序也不会退出我不确定它是否继续等待线程完成或什么有人可以就此
不使用 Excel 写入 Excel 电子表格中的某些单元格？

我想在未安装 Excel 的服务器上写入 Excel 电子表格所以Excel自动化是不可能的我还需要写信给certain使用 NET 的单元这可能吗如何实现 ODBC 驱动程序可用于在某些工作表单元格插入数据吗无需使用昂贵的第三方
Assert.That 与 Assert.True

更喜欢什么 Assert That obj Foo Is EqualTo true or Assert True obj Foo 对我来说这两种资产是等价的应该优先选择哪一种在这种特殊情况下没有区别您将看到大致相同详细程度的输出
IntelliJ IDEA 中的“变量从未分配”警告只能“部分”抑制

Java EE IntelliJ Idea 2016 3 我编写了一个类并声明了一个私有字段 Inject注解我已经通过添加成功地从检查结果窗口中删除了未使用的声明通知javax inject Inject to 设置 gt 编辑
grunt-contrib-connect 中间件 CORS 解决方案，具有 keepalive true

对于我的本地开发系统我尝试使用 grunt contrib connect 为前端资产提供服务我需要一个在 Firefox 中使用字体的跨域解决方案服务器运行得很好但我似乎无法设置标头我正在使用 grunt contrib con
单个元素中的多个文本节点？

有人可以帮我看一下下面的屏幕截图并解释以下内容到底是怎么回事我如何以编程方式检测它我如何以编程方式修复摆脱它我相信发生的事情是我在一个单一的文本节点中有多个文本节点preelement 我感觉很多年前我在MDN上读到这样的事情是可
android:dither="true" 不抖动，出了什么问题？

我一直在尝试让 android 抖动活动的背景图像到目前为止没有成功我不知道出了什么问题这就是我所做的我的活动布局的根元素是 LinearLayout
为什么自定义类型接受 Python 中的临时属性（而内置类型不接受）？

我想知道为什么人们能够为自定义类型的实例创建一个新属性新意味着先前未在类主体中定义但无法为内置类型执行相同的操作在类型上比如object本身代码示例 gt gt gt class SomeClass object pass gt
Python导入模块错误

我在项目中导入模块时遇到问题我正在创建测试但无法从测试文件导入我的 main 来测试应用程序的一个端点teste ex py 这是我的项目结构 backend api api init py main py testes init py
如何在django模板中使用生成器方法？

我想在 django 模板中使用 python 生成器可以吗例如我有模型它包含生成器对象如下所示 class TestMe models Model property def gen self yield 1 yield 2 上下
Pycharm不显示数据库表

更新PyCharm 版本2017 1 后 PyCharm不显示sqlite3数据库表不再存在我已经测试了连接并且可以正常工作 In sqlite客户端我可以列出所有表并进行查询其他人也遇到这个问题吗在这种情况下无论如何都能解决吗我使
为 Clojure 协议提供多种实现

我有一个公开常见数据相关函数的命名空间 get images insert user 然后我有两个具有相同功能并以不同方式实现它们的数据库后端他们按原样实现接口每个后端都包含在一个命名空间中我似乎无法找到如何完成此任务的良好解决方案
Java 项目中服务器和客户端包的共享资源

我有一个 Java 项目其中包含服务器包和客户端包另外我还有一个图书馆包我使用 eclipse 并将所有内容放入一个 Java 项目中每个部分服务器客户端和库都位于单独的包中问题是当我导出时所有内容都会添加到 Jar 文件中
如何在 Azure Key Vault 中序列化和反序列化 PFX 证书？

我有一堆字符串和 pfx 证书我想将它们存储在 Azure Key Vault 中只有允许的用户应用程序才能获取它们将字符串存储为 Secret 并不难但是如何以可以检索它并反序列化为证书的方式序列化证书 X509证书2 http
Pandas：连接数据帧并保留重复索引

我有两个数据框我想将它们按列 axis 1 与内部联接连接起来其中一个数据帧有一些重复的索引但行不重复我不想丢失其中的数据 df1 pd DataFrame a 1 b 2 a 1 b 3 a 2 b 4 columns a b s

Pandas：连接数据帧并保留重复索引

Pandas：连接数据帧并保留重复索引 的相关文章

随机推荐

热门标签

Pandas：连接数据帧并保留重复索引的相关文章