在两列之间的范围内搜索特定值python dataframe

2024-01-23

我有两个 csv 文件。根据 csv 文件 1 中单元格的值，我应该能够在 csv 文件 2 的列中搜索该值，并从 csv 文件 2 中的其他列获取相应的值。如果这很令人困惑，我很抱歉。通过插图可能会变得清楚

CSV 文件 1

Car   Mileage
 A       8
 B       6
 C       10

CSV 文件 2

Score  Mileage(Min)    Mileage(Max)
 1       1                 3
 2       4                 6
 3       7                 9
 4       10                12 
 5       13                15

我想要的输出 CSV 文件是这样的

Car    Mileage     Score
 A       8           3
 B       6           2
 C       10          4

汽车 A 根据其里程 8 获得 3 分，然后在 csv 文件 2 中查找该里程属于哪个范围，然后获取该范围的相应分数值。任何帮助将不胜感激提前致谢

截至撰写本文时，当前的稳定版本是 v0.21。

要读取您的文件，请使用pd.read_csv https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html -

df0 = pd.read_csv('file1.csv')
df1 = pd.read_csv('file2.csv')

df0

  Car  Mileage
0   A        8
1   B        6
2   C       10

df1

   Score  Mileage(Min)  Mileage(Max)
0      1             1             3
1      2             4             6
2      3             7             9
3      4            10            12
4      5            13            15

要查找分数，请使用pd.IntervalIndex https://pandas.pydata.org/pandas-docs/stable/generated/pandas.IntervalIndex.html通过致电IntervalIndex.from_tuples。这应该很快 -

v = df1.loc[:, 'Mileage(Min)':'Mileage(Max)'].apply(tuple, 1).tolist()
idx = pd.IntervalIndex.from_tuples(v, closed='both') # you can also use `from_arrays`


df0['Score'] = df1.iloc[idx.get_indexer(df0.Mileage.values), 'Score'].values
df0

  Car  Mileage  Score
0   A        8      3
1   B        6      2
2   C       10      4

其他创建方法IntervalIndex已概述here https://pandas.pydata.org/pandas-docs/stable/generated/pandas.IntervalIndex.from_tuples.html#pandas.IntervalIndex.from_tuples.

要写入结果，请使用pd.DataFrame.to_csv https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_csv.html -

df0.to_csv('file3.csv')

这是我在这里所做的工作的高级概述。

首先，读入您的 CSV 文件
Use pd.IntervalIndex建立区间索引tree。因此，搜索的复杂度现在是对数的。
Use idx.get_indexer http://pandas.pydata.org/pandas-docs/version/0.16.1/generated/pandas.Index.get_indexer.html查找树中每个值的索引
使用索引来定位Score值在df1，并将其分配回df0。请注意，我打电话.values，否则赋值回来时，值会错位。
将结果写回 CSV

欲了解更多信息Intervalindex，看看这个 SO Q/A -在 pandas 中查找匹配间隔 Intervalindex https://stackoverflow.com/questions/46364710/finding-matching-intervals-in-pandas-intervalindex

注意IntervalIndex是新的v0.20，所以如果您有旧版本，请确保使用以下命令更新您的版本

pip install --upgrade pandas

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在两列之间的范围内搜索特定值python dataframe 的相关文章

Python Numpy Reshape错误[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试重塑 3D numpy 数组时遇到一个奇怪的错误数组 x 的形状为 6 10 300 我想将其重塑为 6 3000 我正
在 Jupyter Notebook 中设置环境变量的不同方法

在某些情况下我在 Windows 10 计算机上使用 Jupyter 笔记本我想通过设置环境变量 GOOGLE APPLICATION CREDENTIALS 来向 GCP 进行身份验证我想知道这两种设置环境变量的方式有什么区别当
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
在 PhotoImage 下调整图像大小

我需要调整图像大小但我想避免使用 PIL 因为我无法使其在 OS X 下工作不要问我为什么无论如何因为我对 gif pgm ppm 感到满意所以 PhotoImage 类对我来说没问题 photoImg PhotoImage fi
如何在动态执行的代码字符串中使用inspect.getsource？

如果我在文件中有这段代码 import inspect def sample p1 print p1 return 1 print inspect getsource sample 当我运行脚本时它按预期工作在最后一行源代码sampl
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
如何仅注释堆积条形图的一个类别

我有一个数据框示例如下所示 data Date 2021 07 18 2021 07 19 2021 07 20 2021 07 21 2021 07 22 2021 07 23 Invalid NaN 1 1 NaN NaN NaN N
同一台机器上有多个Python版本？

Python 网站上是否有关于如何在 Linux 上的同一台计算机上安装和运行多个版本的 Python 的官方文档我可以找到无数的博客文章和答案但我想知道是否有标准官方方法可以做到这一点或者这一切都取决于操作系统我认为它是完全独
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
在 pygame 中，我如何创建一个数据结构来跟踪调整大小事件和对象的坐标？

我希望在调整屏幕大小后使鼠标事件与对象保持同步有人告诉我需要创建一个数据结构来跟踪调整事件大小新坐标以匹配调整大小如何使用简单的代数方程来完成此操作并将其集成到调整大小事件中以进行准确更新反过来做创建一个虚拟游戏地图在绘制场景
如何让 Streamlit 每 5 秒重新加载一次？

我必须每 5 秒重新加载 Streamlit 图表以便在 XLSX 报告中可视化新数据如何实现这一目标 import streamlit as st import pandas as pd import os mainDir os pa
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
错误：尝试使用 scrappy 登录时出现 raise ValueError("No element found in %s" % response)

问题描述我想从我大学的bbs上抓取一些信息这是地址 http bbs byr cn http bbs byr cn下面是我的蜘蛛的代码 from lxml import etree import scrapy try from scra
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
在 Shiny 应用程序中过滤数据时，长度为 1 的字符向量除了第一个元素之外的所有元素都将被忽略错误

我有以下闪亮的应用程序 library shiny library rhandsontable library shinydashboard library ggplot2 library dplyr setwd C Users Marc
如何处理 Tkinter 中的窗口关闭事件？

如何在 Python Tkinter 程序中处理窗口关闭事件用户单击 X 按钮 Tkinter 支持一种称为协议处理程序 http web archive org web 20201111215134 http effbot org tk
无法将matplotlib安装到pycharm

我最近开始使用Python速成课程学习Python编程我陷入困境因为我无法让 matplotlib 在 pycharm 中工作我已经安装了pip 我已经通过命令提示符使用 pip 安装了 matplotlib 现在当我打开 pych
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
正则表达式 - 匹配不包含字符串的模式

我对正则表达式很陌生并且一直在寻找方法来做到这一点但没有成功给定一个字符串我想删除以 abc 开头以 abc 结尾且中间不包含 abc 的任何模式如果我做 abc abc abc 它将匹配以 b 开头以 abc 结尾并且中间包

随机推荐

按钮栏不会粘在屏幕底部

我试图将我创建的按钮栏放在每个屏幕的底部我很容易就成功地完成了第一个屏幕现在我尝试把它放到其他屏幕上但似乎无法粘在屏幕底部当我查看 hiearchyviewer 时看起来包裹在我的布局和按钮栏周围的相对布局并没有填充整个屏幕但它
使用金属的纹理画笔（绘图应用程序）

I am trying to implement a metal backed drawing application where brushstrokes are drawn on an MTKView by textured squar
Haskell 函数反转函数调用

我有一个 lambda x f gt f x正在使用foldM操作其中x是一个值并且f a gt b 是否有内置函数可以执行此操作我可以更换吗 foldM x f gt f x 和一些f foldM f 我以为flip会这样做但需要三
如何消除 MFMessageComposeViewController 呈现的延迟？

if MFMessageComposeViewController canSendText MFMessageComposeViewController sms message vc MFMessageComposeViewControll
用于旋转图表数据标签的 Python PPTX 解决方法函数

I intend to create the following chart using Python PPTX 下面的代码实现了颜色设置字体大小和数字格式但是我还无法旋转数据标签因为我相信此 API 在 python pptx 0
动态更新 AutoCompleteTextView 适配器

我想通过从 RESTful Web 服务获取列表来定期更改 AutoCompleteTextview 给出的建议但无法使其顺利工作我设置了一个硬编码的建议列表以确保它有效 ArrayAdapter
如何使用 EmbeddedNavigator 在 DevExpress GridView 中保存行更改

我正在使用嵌入式导航器的添加编辑和删除按钮我已经订阅了gridControl1 EmbeddedNavigator ButtonClick事件然后我检查单击了哪个按钮问题是当我编辑单元格并按保存更改时 EndEdit 我没有看到新
如何在Wordnet中找到“词法文件”？

如果你看一下并选择显示选项显示词汇文件信息您将看到一个非常有用的单词分类称为词汇文件例如对于填充我们有
使用 Office Open XML 重复内容

我一直在研究 Office Open XML 文档规范的可能性我对能够将自定义 XML 内容添加到文档并将其绑定到内容控件特别感兴趣我想知道是否可以有重复的内容控制类型例如假设我的 docx 文件中有一些自定义 XML 如下所示
为什么使用 AsQueryable() 而不是 List()？

我正在使用存储库模式进行数据访问实体框架 http en wikipedia org wiki ADO NET Entity Framework and LINQ http en wikipedia org wiki Language In
Z3 Optimize 最大和最小功能背后的理论是什么？

我写这封信是为了询问 Z3 Optimize 功能背后的理论算法特别是它的maximum and minimum功能这对我来说似乎很神奇它是某种二分搜索吗它如何有效地计算出这里的最大最小值我试图搜索相关功能的源代码例如 ex
context-param可以在web.xml中引用吗？

我可以在 DD 本身中引用上下文参数吗例如
ReactiveList 和 WhenAny

我有许多检查清单ReactiveLists具有ChangeTrackingEnabled true 我只想在每个列表中至少选中一项时启用 OkCommand 此外我想确保用有效的字节值填充其他各种属性我尝试执行以下操作但它不起作用 t
如何修改 Azure Functions 中本机注入的 IConfiguration

我们需要add本地提供给 Azure Functions 的本机 IConfiguration 的配置提供程序目前我们完全替换使用以下代码将其与我们的自定义 Iconfiguration 结合使用 public class Startup
OWIN app.use vs app.run vs app.map

它们之间有什么区别app use app run app map in Owin http www asp net aspnet overview owin and katana 什么时候用什么阅读文档时并不简单 app use将一个中间
具有有限身份验证的附加组件无法打开侧边栏

我有一个 Google 文档插件它被编程为在文档打开时立即打开侧边栏当然这需要在文档中安装并启用该附加组件我发现一周以来在我们的用例中非常有用的侧边栏自动打开功能不再起作用在 StackDriver 日志中我看到此报告 onO
在 MKMapView 上使用叠加层进行缩放时出现异常： NSInvalidArgumentException NSSetM removeObject：对象不能为 nil

我添加了大约1000MKPolygon到一个MKMapView 将叠加层添加到MKMapView效果很好但是如果我快速放大和缩小偶尔放开变焦这样mapView处理它是新的visibleMapRect 我发现应用程序有时崩溃并出现
VIM 从 :shell 命令中打开文件

假设我从 with VI 发出 shell 命令然后我导航到一个目录并决定需要编辑我在那里看到的 foo txt 文件有没有办法从 shell 返回 vi 并打开 foo txt 进行编辑只要满足以下条件就有办法实现你想要的 Vim
压缩存档错误：无法访问该文件，因为该文件正在被另一个进程使用

我想压缩一个路径其中运行一个服务窗口当服务停止时它工作正常当服务运行时我有例外该进程无法访问该文件因为该文件正在被另一个进程使用过程但是当我使用 7 zip 压缩时没有任何异常我的命令 Compress Archiv
在两列之间的范围内搜索特定值python dataframe

我有两个 csv 文件根据 csv 文件 1 中单元格的值我应该能够在 csv 文件 2 的列中搜索该值并从 csv 文件 2 中的其他列获取相应的值如果这很令人困惑我很抱歉通过插图可能会变得清楚 CSV 文件 1 Car Mi

在两列之间的范围内搜索特定值python dataframe

在两列之间的范围内搜索特定值python dataframe 的相关文章

随机推荐

热门标签