合并DataFrame时如何合并两个列表列？

2023-11-27

我有两个DataFrame:

df1:

       date        ids
0   2015-10-13       [978]
1   2015-10-14  [978, 121]

df2:

       date        ids
0   2015-10-13  [978, 12]
1   2015-10-14     [2, 1]

当我基于合并它们时date如下：

df = pandas.merge(df1, df2, on='date', sort=False)

我将有以下DataFrame:

   date            ids_x             ids_y
0   2015-10-13    [978]            [978, 12]
1   2015-10-14    [978, 121]       [2, 1]

我希望有one ids从两个列表合并的列，例如[978, 978, 12]或者最好删除重复项并有类似的东西[978, 12].

您可以将两列添加在一起以获得您要查找的列表，然后使用df.drop() with axis=1删除ids_x and ids_y列。例子 -

df = pd.merge(df1, df2, on='date', sort=False)
df['ids'] = df['ids_x'] + df['ids_y']
df = df.drop(['ids_x','ids_y'],axis=1)

Demo -

In [65]: df
Out[65]:
         date       ids_x      ids_y
0  2015-10-13       [978]  [978, 12]
1  2015-10-14  [978, 121]     [2, 1]

In [67]: df['ids'] = df['ids_x'] + df['ids_y']

In [68]: df
Out[68]:
         date       ids_x      ids_y               ids
0  2015-10-13       [978]  [978, 12]    [978, 978, 12]
1  2015-10-14  [978, 121]     [2, 1]  [978, 121, 2, 1]

In [70]: df = df.drop(['ids_x','ids_y'],axis=1)

In [71]: df
Out[71]:
         date               ids
0  2015-10-13    [978, 978, 12]
1  2015-10-14  [978, 121, 2, 1]

如果您还想删除重复值，并且您不关心顺序，那么你可以使用Series.apply然后将列表转换为set然后回到list。例子 -

df['ids'] = df['ids'].apply(lambda x: list(set(x)))

Demo -

In [72]: df['ids'] = df['ids'].apply(lambda x: list(set(x)))

In [73]: df
Out[73]:
         date               ids
0  2015-10-13         [978, 12]
1  2015-10-14  [121, 978, 2, 1]

或者按照评论中的要求，如果您想这样做numpy.unique()，您可以将其与Series.apply还有——

import numpy as np
df['ids'] = df['ids'].apply(lambda x: np.unique(x))

Demo -

In [79]: df['ids'] = df['ids'].apply(lambda x: np.unique(x))

In [80]: df
Out[80]:
         date               ids
0  2015-10-13         [12, 978]
1  2015-10-14  [1, 2, 121, 978]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

MERGE

合并DataFrame时如何合并两个列表列？的相关文章

如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
Seaborn 热图中的自定义调色板间隔

我正在尝试绘制一个heatmap https seaborn pydata org generated seaborn heatmap html使用seaborn库绘图函数如下所示 def plot confusion matrix da
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
从主机名中提取域名

是否有一种编程方式可以从给定的主机名查找域名给出 gt www yahoo co jp 返回 gt yahoo co jp 有效但非常慢的方法是拆分为并从左侧删除 1 个组使用 dnspython 加入并查询 SOA 记录当返回有
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
使用 statsmodels.formula.api 中的 ols - 如何删除常数项？

我正在遵循第一个例子statsmodels教程 http statsmodels sourceforge net devel http statsmodels sourceforge net devel 如何指定在 ols 中不使用常数项进
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

关于 Laravel 5.1 安全性

我是 Laravel 5 1 开发项目的新手我想了解如何避免安全风险 Laravel 可以保护哪些类型的攻击什么样的攻击 Laravel 是不安全的使用中间件是处理授权的好方法我知道 Laravel 对于 CSRF 攻击是安全的有
pthread：一个 printf 语句在子线程中打印两次

这是我的第一个 pthread 程序我不知道为什么 printf 语句在子线程中打印两次 int x 1 void func void p x x 1 printf tid ld x is d n pthread self x retur
如何从列表中删除空列表（Java）

我已经搜索过这个但它是用其他语言编写的例如Python或R 我在列表中有列表我想删除空列表例如 abc def ghi jkl mno 我想 abc def ghi jkl mno 如何从列表中删除空列表谢谢你也可以尝试这个 l
操作码 (APC/XCache)、Zend、Doctrine 和自动加载器

我正在尝试使用 APC 或 XCache 作为操作码来缓存我的 php 页面我将它与 Zend 和 Doctrine 一起使用但自动加载器出现问题如果我尝试使用 APC 我会得到以下信息 Fatal error spl autoloa
实体框架和 SQLite，终极操作方法

我正在尝试让 Entity Framework 6 4 4 2020 年夏季的最新版本与 SQLite 1 0 113 1 也是 2020 年夏季的最新版本一起工作我找到了很多关于如何执行此操作的信息但这些信息并不总是有帮助它们常
Android 模拟器实例不显示“允许 USB 调试”确认以进行身份验证

我正在尝试在 Android Studio 的 Android 模拟器中运行我的移动应用程序当我运行该应用程序时它会提示我选择模拟器实例当我选择模拟器实例时应用程序的构建将启动并且所选的模拟器将启动构建完成后 Android S
从数据框中插入 RMySQL

我正在尝试使用 RMySQL 将数据添加到 MySQL 表我只需要一次添加一行但它不起作用我想做的就是这个 dbGetQuery con INSERT INTO names VALUES data 1 1 data 1 2 所以我正在
新创建的 TFS 2010 迭代不可见

我已经在 TFS 2010 中创建了一个新的迭代并且不想在新的故事和查询中使用它但是迭代不会显示在新的故事窗口中刷新VS 重新启动VS 切换到其他项目没有任何帮助我是团队项目中的项目管理员并使用我尝试使用它的同一用户创建了迭代
反应原生 Flatlist 导航

我收到错误类型错误无法读取未定义的属性导航我不明白如何将导航组件传递给每个子组件因此当用户按下某个项目时它可以使用 React Navigation 导航到 employeeEdit 组件我是新手如果这是显而易见的我很抱歉
Hibernate Session 在 ConstraintViolationException 后失效

在抛出约束违反异常后是否有任何方法可以继续使用线程绑定的休眠会话我在这里举一个简短的例子 Parent other service load 33 loads a new parent try Parent p new Parent p
将参数传递给 PrimeFaces 星级评定组件？

我正在尝试利用星级评定来自 PrimeFaces 的组件但是它不允许您传入参数这使得我无法进行查找以从数据库中获取我想要评分的实体我尝试过类似的事情但没有成功
在 PHP 中将标题转换为 url 兼容模式的最佳方法？

http domain name 1 As Low As 10 Downpayment Free Golf Membership 上面的url会报告400 bad request 如何将此类标题转换为用户友好的标题good要求您可能想使用
显示/隐藏片段并以编程方式更改可见性属性

这是一个由两部分组成的问题我所拥有的是一个 3 片段布局其中当用户点击另一个片段中找到的按钮时会动态添加第三个片段 FragmentC 然后添加后第三个片段有一个最大化最小化它的按钮 UPDATE 滚动到最后查看SOLUTION
什么是 XML 属性 xmlns:app？

XML 可以很好地用于 xmlns app http schemas android com apk res auto 但看不到最大字符数 xmlns app http schemas android com tools 这是由 Andro
尝试将 AutoMapper 用于具有子集合的模型，在 Asp.Net MVC 3 中出现 null 错误

我对 AutoMapper 完全陌生我有一个如下所示的视图 using Html BeginForm null null FormMethod Post new enctype multipart form data Html Valid
如何在 Windows 上用 Perl 创建图表？

如何使用 Perl 创建图表我正在运行创建文本报告的预定作业我想将其移至下一步用于管理并创建一些与之相关的图表这可能可行吗如果我能以某种方式使用 Office 来完成此操作那就太好了更新我将按此顺序调查的解决方案 Spr
如何使用 PHP 在给定的日期范围和时间生成 .ics 文件 [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我试图找到一种有效的方法根据给定的日期范围开始日期结束日期和提醒时间使用 PH
离子3|将 InAppBrowser 添加到提供程序时遇到问题

我需要打开一个指向我的 Ionic 3 项目的链接当我用 google 搜索时我看到了 InAppBrowser 插件实际上这个链接中只有一张图片所以如果您知道任何其他获取它的方法或直接显示这张图片这对我来说就足够了我所做的一切
命名空间中的模板函数会导致错误

假设以下代码 include
合并DataFrame时如何合并两个列表列？

我有两个DataFrame df1 date ids 0 2015 10 13 978 1 2015 10 14 978 121 df2 date ids 0 2015 10 13 978 12 1 2015 10 14 2 1 当我基于合

合并DataFrame时如何合并两个列表列？

合并DataFrame时如何合并两个列表列？ 的相关文章

随机推荐

热门标签

合并DataFrame时如何合并两个列表列？的相关文章