多索引 pandas 更新

2024-03-22

有两个数据帧 df1 和 df2：

import pandas as pd
import numpy as np
import datetime

A = list(range(3,9))
B = [datetime.date(2019,1,1), datetime.date(2019,1,3), datetime.date(2019,1,2), datetime.date(2019,1,8), datetime.date(2017,6,2), datetime.date(2011,5,6)]
C = list('abcdef')
D = list('LMNOPQ')
E = list(range(5,11))

df1 = pd.DataFrame({'A': A, 'B': B, 'C': C, 'D': D, 'E': E})

a = list(range(3,7))
b = [datetime.date(2010,1,1), datetime.date(2019,1,3), datetime.date(2019,1,2), datetime.date(2010,2,10)]
c = list('xymb')
d = list('GZYP')

df2 = pd.DataFrame({'A': a, 'B': b, 'C': c, 'D': d})

行索引 1 和 2 具有相同的列“A”和“B”。

使用 df2 列“C”和“D”的数据更新 df1 的最佳方法是什么？

df3 = df1.set_index(['A', 'B']).update(df2.set_index(['A', 'B']))

...不起作用

预期输出是：

    A   B           C   D   E
0   3   2019-01-01  a   L   5
1   4   2019-01-03  y   Z   6
2   5   2019-01-02  m   Y   7
3   6   2019-01-08  d   O   8
4   7   2017-06-02  e   P   9
5   8   2011-05-06  f   Q   10

这是工作，只需要分隔行，因为更新会更改原始 df ，因此不需要分配。

df1=df1.set_index(['A', 'B'])
df1.update(df2.set_index(['A', 'B']))
df1=df1.reset_index()
df1
   A          B  C  D   E
0  3 2019-01-01  a  L   5
1  4 2019-01-03  y  Z   6
2  5 2019-01-02  m  Y   7
3  6 2019-01-08  d  O   8
4  7 2017-06-02  e  P   9
5  8 2011-05-06  f  Q  10

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

多索引 pandas 更新的相关文章

将 Pandas 数据框单元格中的设置值拆分为多行

我有一个以下形式的 pandas DataFrame col1 col2 1 a hu fdf ko dss 2 b sdsjdn lk 3 c sds aldj dhva 现在我想将设置值拆分为多行使其看起来像这样 col1 col2
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
删除 Pandas 数据框中的 NaN/NULL 列？

我有一个dataFrame在 pandas 中有些列的值全部为空是否有内置函数可以让我删除这些列 Yes dropna See http pandas pydata org pandas docs stable missing data
熊猫系列到二维数组

所以我使用了来自的答案将二维数组放入 Pandas 系列中 https stackoverflow com questions 38840319 put a 2d array into a pandas series将 2D numpy
根据标签位置计算 Pandas DataFrame 的索引

我正在尝试计算标签的索引Pandas https pandas pydata org DataFrame在每一列中基本上我有以下内容DataFrame d col1 label1 label2 label3 col2 label2 lab
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指
Pandas - 创建一个新列

我总是使用以下内容在 pandas 中创建新列 df new column value 我正在使用这种方法但是收到了设置副本的警告在不创建副本的情况下创建新列的方法是什么尝试使用 df loc new column value 正如
将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame 这是我到目前为止所做的我正在使用读取 csv 文件pd read csv并将它们附加到列表中出于这个问题的目的让我们考虑以下代码 imp
获取 pandas 数据框中每列的前 k 个元素的索引的快速方法

我有一个非常大的 pandas 数据框大约有 500 000 列每列大约有 500 个元素长对于每一列我需要检索该列中前 k 个元素的索引列位置所以如果 k 等于 2 这是我的数据框 A B C D w 4 8 10 2
为什么我无法在 Python Worksheet 中导入 Pandas？

我在做时遇到这个错误import pandas as pd 回溯最近一次调用文件 udf code py 第 10 行位于 main ModuleNotFoundError 函数中没有名为 pyarrow 的模块 PYTHON WOR
float() 参数必须是字符串或数字，而不是“时间戳”

我无法使 scilearn 与日期时间系列一起工作找到了这篇文章但对我没有帮助 Pandas 类型错误 float 参数必须是字符串或数字 https stackoverflow com questions 41256626 panda
Python Pandas：向类 pandas.core.series.Series 添加方法

我想在 Python 中处理时间序列因此 Pandas 的 Series 类非常完美并且有很多有用的方法现在我想添加一些我需要但未实现的方法例如假设我有兴趣添加一个方法该方法将两次一值附加到时间序列中让我们调用该方法appen
真实值与预测值的降维可视化

我有一个数据框如下所示 label predicted F1 F2 F3 F40 major minor 2 1 4 major major 1 0 10 minor patch 4 3 23 major patch 2 1 11 min
将特定权重乘以列并在新列中相加

我有三列数据想要将不同的标量值乘以每一列然后将它们求和到一列中假设我想将 Attibute 1 乘以 10 将 Attribute 2 乘以 5 将 Attribute 3 乘以 2 Attribute 1 Attribute 2 A
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
使用 pandas 创建虚拟变量时 Jupyter Notebook 内核崩溃

我正在参加 Walmart Kaggle 竞赛并且正在尝试创建 FinelineNumber 列的虚拟列对于上下文 df shape回报 647054 7 我正在尝试制作一个虚拟列df FinelineNumber 其中有 5 196
在 pandas 中按范围加入/合并的最佳方式

我经常使用 pandas 通过范围条件进行合并连接例如如果有 2 个数据框 A A id A 值 B B id B 低 B 高 B 名称它们很大并且大小大致相同假设每个有 2M 条记录我想在 A 和 B 之间进行内部联接因此
带圆角的 Seaborn 条形图

我正在尝试绘制一些条形图但想控制角的圆度我尝试按照堆栈问题中提供的答案进行操作Matplotlib 中带圆角的条形图 https stackoverflow com questions 58425392 bar chart with r
无法包含外部 pandas 文档 Pycharm v--2018.1.2

我无法包含外部 pandas 文档Pycharm v 2018 1 2 例如 numpy gt http docs scipy org doc numpy reference generated module name element na
从时间序列生成日期特征

我有一个数据框其中包含如下列 Date temp data holiday day 01 01 2000 10000 0 1 02 01 2000 0 1 2 03 01 2000 2000 0 3 30 01 2000 200 0 30

随机推荐

如何为Google的MLKIT使用图像格式YUV_420_888

ImageReader 从相机预览中获取每一帧是具有格式的图像YUV 420 888 我想用它作为 MLKIT 的输入在谷歌的文档中我可以运行检测器输入是 Bitmap 媒体图像字节缓冲区字节数组 A File 我尝试转换YUV
ExpressJS：承诺和错误处理中间件

我定义了一些错误处理中间件和返回承诺的路由但是当这个承诺出现错误时我必须手动附加 catch err gt next err 在每一个承诺之后虽然这不是问题但对于 ExpressJs 来说查看路由是否返回 Promise 如果返回
快速使函数中的计时器无效

我正在尝试创建一个带有主比赛时钟和开始停止按钮的曲棍球比赛时钟应用程序但我的 stopGameclock 函数遇到了问题计时器不会失效通过在这里搜索其他问题我认为这与我有关 var gameclockTimer NSTimer 接
NSArray 和 NSMutableArray 的区别

黑白有什么区别NSArray and NSMutableArray NSMutableArray 以及所有其他类Mutable名称中可以修改所以如果你创建一个普通的NSArray 您以后无法更改其内容无需重新创建它但如果你创建一个
IdentityServer4 PKCE 错误：“转换后的代码验证程序与代码质询不匹配”

我无法获得使用 Postman 工作的 IdentityServer4 PKCE 授权使用在线工具我创建了必要的部分选择一个随机字符串 1234567890 获取其 SHA 256 哈希值 c775e7b757ede630cd0aa11
Safari 中存在块作用域变量的 bug？

我正在测试是否可以使用块作用域来替换 IIFE 以通过闭包创建私有变量在 Safari 11 0 3 11604 5 6 1 1 中进行测试之前一切进展顺利该版本支持块作用域但存在块和闭包的错误例如 let i 0 functi
ConcurrentDictionary 陷阱 - GetOrAdd 和 AddOrUpdate 的委托工厂是否同步？

的文档ConcurrentDictionary没有明确说明所以我想我们不能指望代表valueFactory and updateValueFactory让它们的执行同步分别来自 GetOrAdd 和 AddOrUpdate 操作所以
在文件中每行的开头和结尾添加字符

在每行的开头和结尾添加一些字符的最佳方法是什么可以使用 Vim 或其他方式完成吗在vim中你可以这样做 s 1 s regex replace 是用于搜索和替换的 vim 命令使其适用于整个文件 and 分别表示行的开始和结束捕捉
在摩卡测试之间重新导入模块

在我的节点打字稿快递应用程序中我将配置设置存储在settings json作为对象加载和导出的文件config ts 每个使用配置设置的模块都会像这样导入模块 import Config from config config ts看起来
如何使用 C# 验证文件是否是受密码保护的 ZIP 文件

给定文件路径如何验证该文件是否是受密码保护的 zip 文件即我将如何实现这个功能 bool IsPasswordProtectedZipFile string pathToFile 我不需要解压缩该文件我只需要验证它是否是 ZIP
可拖动的CALayer

有什么方法可以让用户拖动 CALayer 吗如果是这样怎么办在可可 Mac 中图层本身无法接收鼠标事件您必须在包含该层的视图或视图控制器中进行事件处理 If a mouseDragged 事件起源于某个层请参见 CALayer
在C++中使用const成员变量有什么优点

我写代码像 template
python-re：如何匹配字母字符

如何将字母字符与正则表达式匹配我想要一个角色 w但不在 d 我希望它与 unicode 兼容这就是为什么我不能使用 a zA Z 你的前两句话互相矛盾在 w但不在 d 包括下划线我从你的第三句话假设你不需要下划线在信封背面使用维恩
iOS：用于登录屏幕的表格样式文本字段？

我想制作一个像 Facebook 应用程序那样的登录屏幕我想要复制的部分是两个文本字段它们堆叠起来看起来像一个表格组但我不明白他们是怎么做到的谁知道其中的窍门我无法发布图片因为我是 stackoverflow 的新手这是一种效
PHP 图片大小小于 1mb

目前我正在使用以下内容来计算文件大小是否小于 1MB 但是由于以下代码来自 9lession 示例站点它说要检查 1mb 的大小但如果我乘以 1024 2 这就是他们在这里所做的不等于 1mb 而是 2048kb 说它上传的大小不是以
如何在 macOS 上的 SwiftUI 中检测键盘事件？

如何在 macOS 上的 SwiftUI 视图中检测键盘事件我希望能够使用击键来控制特定屏幕上的项目但不清楚如何检测键盘事件这通常是通过覆盖keyDown event NSEvent in NSView 与 Xcode 12 捆绑在一
将正则表达式匹配到第一个空格

我必须填充商店的图像并提供以下格式的图像文件夹例如BRL0368 Side jpg 5510 Dura Guard Carpet jpg 现在我想做的就是把所有这些都砍掉这样我就可以尝试在 Excel 中匹配零件编号例如 BRL03
Func 的性能和继承

我一直无法理解使用的性能特征Func lt gt 在我的代码中当使用继承和泛型时我发现自己一直在使用继承和泛型的组合让我从一个最小的测试用例开始这样我们都知道我们在说什么然后我将发布结果然后我将解释我的期望和原因最小测试用例
AWS python lambda函数：没有名为请求的模块

我对 AWS 还很陌生遇到了一些问题这是我的代码 from future import print function from urllib2 import Request urlopen URLError import request
多索引 pandas 更新

有两个数据帧 df1 和 df2 import pandas as pd import numpy as np import datetime A list range 3 9 B datetime date 2019 1 1 dateti

多索引 pandas 更新

多索引 pandas 更新 的相关文章

随机推荐

热门标签

多索引 pandas 更新的相关文章