如何从另一个数据框中获取值的行列名称

2024-01-08

给定一个范围表(start, end):

name     blue         green          yellow        purple              
a        1, 5                        654, 678       11, 15
b                     88761, 88776  
c        1211, 1215                  38, 47    
d        89, 95                                     1567, 1578

和一个数据框df:

Supplier        colour                   
Abi             1                               
John            678          
Smith           120               
Tim             1570 
Don             87560

我怎样才能过滤df仅包含其值在colour列是否在表中提供的范围内？

并创建第三列，将列中的值关联起来colour to the row-column范围表中的名称。我想要决赛df看起来像这样：

Supplier        colour    Source                  
Abi             1         a-blue                      
John            678       a-yellow                   
Tim             1570      d-purple

谢谢你！

s = df2.stack()
print(s)

Gives:

a  1,      name          5
           blue       654,
           green       678
           yellow      11,
           purple       15
b  88761,  name      88776
c  1211,   name       1215
           blue        38,
           green        47
d  89,     name         95
           blue      1567,
           green      1578
dtype: object

And:

s = df2.stack()
s = s.str.split("[, ]+").apply(lambda x: pd.Interval(*map(int, x), closed="both"))
print(s)

Gives:

Traceback (most recent call last):
  File "/Users/PycharmProjects/sup.py", line 12, in <module>
    s = s.str.split("[, ]+").apply(lambda x: pd.Interval(*map(int,x), closed="both"))
  File "/Users/.conda/envs/lib/python3.8/site-packages/pandas/core/series.py", line 4200, in apply
    mapped = lib.map_infer(values, f, convert=convert_dtype)
  File "pandas/_libs/lib.pyx", line 2402, in pandas._libs.lib.map_infer
  File "/Users/PycharmProjects/sup.py", line 12, in <lambda>
    s = s.str.split("[, ]+").apply(lambda x: pd.Interval(*map(int,x), closed="both"))
TypeError: 'float' object is not iterable

一种方法是制作一个series with pd.IntervalIndex :

s = df2.stack()
s = s.str.split("[, ]+").apply(lambda x: pd.Interval(*map(int, x), closed="both"))
s.index = ["-".join(i) for i in s.index]
s = pd.Series(s.index, index=s)

这样你就有了：

[1, 5]              a-blue
[654, 678]        a-yellow
[11, 15]          a-purple
[88761, 88776]     b-green
[1211, 1215]        c-blue
[38, 47]          c-yellow
[89, 95]            d-blue
[1567, 1578]      d-purple
dtype: object

Now you map它到原来的df and dropna:

df["Source"] = df["colour"].map(s)
df.dropna()

Output:

  Supplier  colour    Source
0      Abi       1    a-blue
1     John     678  a-yellow
3      Tim    1570  d-purple

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

pandasgroupby

如何从另一个数据框中获取值的行列名称的相关文章

Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

如何在 Visual Studio 2008“Pro”中进行性能分析

微软将这款软件称为 Visual Studio 2008 Professional 我发现其中似乎没有应用程序性能分析器或类似的东西这使得它对我来说似乎不那么专业如果 Microsoft 不包含分析器您有哪些第三方选项可以用于 Vi
数据仓库中的时间和日期维度

I m building a data warehouse Each fact has it s timestamp I need to create reports by day month quarter but by hours to
如何分配线程来处理 Servlet 请求？

有人可以解释一下什么是每个请求线程和每个连接线程吗 servlet 适用于哪种模型如何分配线程来处理 HTTP 请求是线程请求还是连接假设我想在我的计算机中执行一项耗时的任务Servlet s doGet 方法异步我使用 Java
无需预处理器即可扩展 C/C++ 函数宏

如何在 C C 文件中测试扩展所有函数宏而不通过预处理器运行它例如是否有一个程序或方法可以改变这一点 include
PHP服务器ERR_CONNECTION_REFUSED

我无法让 php 服务器在我的本地计算机上运行我尝试使用 wampserver 和 Easy PHP 我检查了我的使用情况port 80 我更改了端口 80 to 8080 我给了 Apache 和 mysql 防火墙设置所需的权限我做
在 WPF 中将窗口的 DataContext 绑定到窗口本身

我有一个继承自 Window 的简单对话框窗口我在 XAML 中设置它的 DataContext 如下所示
从 efi 应用程序发送 TCP 或 UDP 数据包

我想开发一个在 EFI shell 中从startup nsh 自动执行的应用程序此应用程序应将原始字节发送到 IP 地址并接收一些返回的字节我到处寻找在我的代码中实现简单网络协议的解释和示例但一无所获有人可以解释并显示使用 gnu
C# 构造函数执行顺序

在 C 中当你这样做时 Class Type param1 Type param2 base param1 是先执行类的构造函数然后调用超类构造函数还是先调用基类构造函数顺序是层次结构中所有类的成员变量都初始化为默认值然后从最派
如何在 Swift 中将 base64String 转换为 String？ [复制]

这个问题在这里已经有答案了我从 NSData 中的 Web 服务响应接收到一个 base64 字符串如何在 swift 中将 dat base64 字符串转换为字符串 Code var jsonResult NSJSONSerializ
使用外部数据扩展 Keycloak 中的用户访问令牌

我们使用 Keycloak 服务作为 SSO 解决方案并将生成的 JWT 提供给不同的微服务效果非常好但现在我们遇到的问题是当用户尝试登录时 JWT 必须使用来自外部资源的数据进行扩展更具体地说一个用户可以通过一个唯一的ID作为
如何使用Wix安装.NET Framework的可再发行包？

我有一个一般任务在产品设置过程中安装 NET Framework 3 5 我执行以下操作我创建了一个自定义操作 X 自定义操作 X 通过 Process Start 启动可执行文件 Y 可执行文件 Y 终止 msiexec 进程并运行
LPHANDLE 与 HANDLE

在浏览一些代码时我发现了一个调用打开打印机 http msdn microsoft com en us library dd162751 aspx 该代码可以编译并且运行良好但是我们正在通过一个HANDLE代替LPHANDLE 如 M
正则表达式匹配 ini 值

我正在尝试匹配 ini 行值的姓氏 foo bar far boo some value 我可以匹配 boo 但我只需要 boo I do w s 但它匹配等号但我不希望它匹配顺便说一句如果没有像这样的子值我应该能够得到 foo v
使用子模块创建公共存储库

我想创建一个包含多个子模块的公共存储库裸存储库我希望不同的人克隆这个裸存储库在任何子模块中进行更改更新公共存储库然而我意识到这是相当痛苦的我希望我的存储库如下所示我有四个独立的存储库 a kernel b rootfs c
无法在 XML 文件上 insertBefore

我正在尝试编写一个脚本来更新 RSS XML 文件我希望它获取现有文件并将新项目添加到项目列表的顶部我之前已经将其添加到文件末尾但现在它根本没有添加新项目我已经在网上检查过但仍然无法使其工作这是我到目前为止所拥有的 rssDoc
python 模块存储在哪里？

我最近开始学习Python 有两个与模块相关的问题有没有办法获取机器上可用即安装的Python模块列表我使用 Ubuntu Karmic 和 Synaptic 进行包管理我刚刚安装了一个 python 模块模块代码实际存储在我的
能让代码分析理解代码契约吗？

当组合使用代码分析和代码契约时我收到很多警告例如 CA1062 http msdn microsoft com en us library ms182182 aspx Microsoft Design 在外部可见的方法 Foo Bar
ggmap，使用 coord_cartesian 将所有点推向北方

正如标题所说当我添加时coord cartesian到我的 ggmap 它将我所有的点都向上移动这是一些数据 pricedata lt structure list nodename c CIN WABRIVR 2 CIN WHEATC
Julia v0.6 函数内部宏

有人可以解决我遇到的这个宏错误吗它只在版本 0 6 中开始发生 mutable struct Foo x Int end macro test myfoo quoteblock quote myfoo x 1 end return quo
如何从另一个数据框中获取值的行列名称

给定一个范围表 start end name blue green yellow purple a 1 5 654 678 11 15 b 88761 88776 c 1211 1215 38 47 d 89 95 1567 1578 和一

如何从另一个数据框中获取值的行列名称

如何从另一个数据框中获取值的行列名称 的相关文章

随机推荐

热门标签

如何从另一个数据框中获取值的行列名称的相关文章