给定范围内的最近邻居

2024-01-04

我面临的问题是快速找到给定范围内最近的邻居。

数据集示例：

id | string | float
0  |   AA   |  0.1
12 |   BB   |  0.5
2  |   CC   |  0.3
102|   AA   |  1.1
33 |   AA   |  2.8
17 |   AA   |  0.5

对于每一行，打印满足以下条件的行数：

字符串字段等于当前字段
浮点字段

对于 del = 1.5 的示例：

id | count
0  |  0
12 |  0
2  |  0
102|  2  (string is equal row with id=0,33,17 but only in row id=0,17 float value: 1.1-1.5<=0.1, 1.1-1.5<=0.5)
33 |  0  (string is equal row with id=0,102,17 but 2.8-1.5>=0.1/1.1/1.5)
17 |  1

为了解决这个问题，我使用了一个类BallTree使用自定义指标，但由于反向树遍历（在大型数据集上），它可以工作很长时间。有人可以建议其他解决方案，或者如何将自定义指标的速度提高到来自sklearn.neighbors.DistanceMetric?

My code:

from sklearn.neighbors import BallTree
def distance(x, y):
    if(x[0]==y[0] and x[1]>y[1]):
        return (x[1] - y[1])
    else:
        return (x[1] + y[1])

tree2 = BallTree(X, leaf_size=X.shape[0], metric=distance) 
mas=tree2.query_radius(X, r=del, count_only = True)

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

range

nearestneighbor

给定范围内的最近邻居的相关文章

从 Excel 获取输入并在 python 脚本中使用这些输入

如何从 excel 获取输入并在 python 中使用这些输入看一眼xlrd http pypi python org pypi xlrd 这是我发现的学习如何使用它的最佳参考 http www dev explorer com arti
让 Django 提供可下载文件

我希望网站上的用户能够下载路径被遮挡的文件因此无法直接下载它们例如我希望 URL 是这样的 http example com download f somefile txt 在服务器上我知道所有可下载的文件都位于该文件夹中 home
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
如何从 Windows 7 PC 上完全卸载 Python 2.7

从这里安装了Python 2 7 https www python org downloads release python 279 https www python org downloads release python 279 然后我
来自多元 t 分布的样本 python

我想知道Python中是否有一个从多元学生t分布中采样的函数我有包含 14 个元素的均值向量 14x14 协方差矩阵和自由度我想从这个 t 分布中采样一个向量对于一维情况我使用 stats t rvs df loc scale 并且
打开文件路径在 python 中不起作用[重复]

这个问题在这里已经有答案了我正在编写一个数据库程序 personica 是我的测试主题我通常在文件路径的位置有一个变量但出于测试和演示的目的我只有一个字符串在我的计算机上的这个确切位置有一个文本文件顺便说一句因为我很偏执所以
如何使用 django Rest 框架保存多对多字段对象

我有博客发布标签三个模型在博客模型中我将字段 postedin 作为发布模型的外键将标签作为标签模型的许多字段模型 py class Posted models Model name models CharField Pos
PyQt5 的 OpenGL 模块和版本控制问题（调用不正确的 _QOpenGLFunctions_(ver)）

我一直在努力得到PyQt5 helloGL 示例代码 https github com baoboa pyqt5 blob master examples opengl hellogl py编译当我尝试构建解决方案时我得到 Traceb
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
无法使用 wxPython 打开在 folium 中生成的本地 HTML 文件

我目前正在尝试将 GPS 坐标绘制为地图上的标记并在 wxPython 中显示结果我使用 folium 绘制坐标标记并生成 HTML 文件 import folium fmap folium Map 43 5321 172 6362 z
如何在 FastAPI Swagger API 中按方法类型对方法进行排序？

如何在 FastAPI Swagger 自动文档中设置 API 方法的排序顺序我希望所有方法按类型分组 GET POST PUT DELETE 这个答案 https stackoverflow com questions 24951268
AppEngine 警告 - OpenBLAS 警告 - 无法确定该系统上的 L2 缓存大小

我尝试在 GC AppEngine 上部署应用程序部署过程中没有错误但应用程序无法运行仅显示加载页面日志中唯一一个奇怪的原始日志 OpenBLAS WARNING could not determine the L2 cache s
Python-使用元组作为列表索引[重复]

这个问题在这里已经有答案了我有一个元组列表 tuples list 1 0 2 3 3 2 2 0 我想访问二维数组的元素a例如使用其中一些元组 for i in range 3 print a tuples list i 应该输出的值
使用 Celery 通过 Gevent 进行实时、同步的外部 API 查询

我正在开发一个 Web 应用程序该应用程序将接收用户的请求并且必须调用许多外部 API 来编写对该请求的答案这可以直接从主 Web 线程使用 gevent 之类的东西来扇出请求来完成或者我在想我可以将传入的请求放入队列中并使用
Django - 渲染到字符串无法加载 CSS

我正在尝试使用 Django 1 8 render to string 通过管理命令将 html 转换为 pdf 而不是使用 View request 以下代码可以将模板转换为 pdf 但它无法将 CSS 加载到模板中 def html t
Hoare Partitioning算法讲解

根据许多网站给出的伪代码我写了这个Hoare分区算法它采用一个数组根据给定的主元来分区子数组的开始和结束索引它工作得很好但是有人可以解释一下逻辑它是如何做到这一点的吗这是代码 def hoare arr start end p
Pandas 数据框可对多列和要列出的值进行字典

我有一个数据框 id key a1 1 a2 1 a3 1 a4 2 a5 2 a6 3 我想创建一本字典key作为机器号并且id列作为列表 like 1 a1 a2 a3 2 a4 a5 3 a6 我可以先使用 groupby 然后再使
类unix系统中的python和python3命令有什么区别？

我通读了每个命令的描述但每个命令的描述都是完全相同的所以我不明白这两个命令在类 Unix 系统中的工作方式有何不同谁能解释其中的区别吗 Python3命令的引入是因为python命令指向了python2 从那时起 Python3 已成
重写 __cmp__ python 函数

嗨我是压倒一切的 cmp 如果传递的第二个对象是None 或者如果它不是一个实例someClass 然后返回 1 我不明白这里到底发生了什么 class someClass def cmp self obj if obj None ret

随机推荐

如何发送 FastAPI 响应而不将用户重定向到另一个页面？

我正在使用 FastAPI 创建一个 API 它接收form data从 HTML 页面处理数据需要一些时间并返回一条消息说明此任务已完成这是我的后端 from cgi import test from fastapi import
安装 geopandas 的问题

我正在尝试在我的笔记本电脑 Windows 10 版本 1709 机器上安装 geopandas 执行 pip install geopandas 命令后我收到以下消息 command python setup py egg info
为什么jsp改变时tomcat不需要重启

我一直在使用JSP Servlet很长一段时间我知道每当我们改变任何东西Servlet我们需要重新启动 Tomcat 服务器才能获取更改如果 JSP 发生更改 tomcat 不需要重新启动据我所知JSP页面被转换成Servlet仅当编
如何检测浏览器中的链接复制情况？

昨天我和一个出租车司机聊天当他提到我是一名程序员时他告诉我几天前他经历了以下情况在尝试从浏览器地址栏中复制 URL 时出现一个消息框带有类似的消息请不要复制此链接而是注册我不是网络开发人员所以这可能是一个蹩脚的问题但我想
Jenkins 插件中的变量替换

我正在开发一个新的 Jenkins 插件该插件将在 Jenkins 作业的构建阶段执行并且要求允许用户在插件的作业配置中指定变量名称而不是文字值目的是当作业执行时用户指定的变量名称将被替换为与该变量关联的实际值并且插件将在运行
ASP.NET MVC - 动态样式表

我想让用户选择网站的背景颜色并将所选颜色保存在数据库中当用户登录时后台将显示正确的颜色基于以下website http www codeproject com KB aspnet CSSVariables aspx 我可以在范围内设置
如何有条件地为张量赋值[屏蔽损失函数]？

我想创建一个 L2 损失函数忽略标签值为 0 的值 gt 像素张量batch 1 包含标签同时output是净输出的张量两者的形状均为 None 300 300 1 labels mask tf identity batch 1 l
laravel phpexcel 更新中不明确的类解析

我尝试使用 php excel 更新 laravel 同时安装我在作曲家中发现了以下警告 Error Warning Ambiguous class resolution SettingsController was found in bo
可移植地处理 C++ 中的异常错误

我正在致力于将 Visual C 应用程序移植到 GCC 应该在 MingW 和 Linux 上构建现有代码使用 try except 1 在几个地方阻塞这样几乎没有什么除了内存不足类型错误会让程序退出而不做一些最小的日志记录使用
Git merge - 三路“git merge”

I am trying to simulate the example on three way merge process in git given here https git scm com book en v2 Git Branch
Psr7 Http Message，为什么不可变？

我正在看PSR 7 https github com php fig http message tree master src接口并思考如何实现它们我也一直在读这篇博文 http evertpot com psr 7 issues 显然
Vue.js：v-for完成后的事件

我正在尝试使用 Vue js 构建一个简单的聊天应用程序我的问题是当写入新消息时消息区域需要滚动到底部我使用 v for 指令循环遍历消息 v for 更新 DOM 时是否有事件我已经做到了以便消息区域 div 监听组件的消息数
时间序列作为 data.table 中的“ts”列？

我有多组时间序列数据希望帮助找出将它们放入 R 并使用 R 进行分析的最佳方法我对 data table 非常熟悉但对 R 不太熟悉ts支持时间序列分析的类我特别想知道如何使用ts http stat ethz ch R manua
Selenium - 如何在 iframe 上定位元素

我正在尝试在 iframe 中查找元素但我无能为力这是我的代码和我收到的错误这是我的脚本 public class Add Lists public static void main String args throws Interr
在android中滚动listView时重新加载图像

我正在尝试编写一个新闻列表应用程序我已经解析了来自服务器的 JSON 数据并创建了 CustomListAdapter 我的listView中有三个textView和imageView 它工作得很好图像已加载我将其设置为 imageV
使用 OnItemClickListener 从 ListView 和数据库中删除项目

我创建了一个数据库并设法将添加的项目显示到 ListView 中现在我需要一种方法来从 ListView 和数据库中删除项目 public class ZeigeFaecherListe extends AppCompatActivity
从详细 JSON 升级到 JSON 轻量级会对只查看数据而不查看元数据的人产生什么影响？

谁能用简单的英语简洁地向我解释一下 WCF 数据服务的详细 JSON 和 JSON light 之间的主要区别是什么我找到了微软的一份名为 JSON light at aglance 的文档不过有23页那么长我不关心元数据我只关心数
批处理文件打开窗口并调整其大小

我目前正在尝试通过批处理文件打开两个窗口然后调整它们的大小并移动它们分屏打开单独的窗口很容易 echo off cd C Program Files x86 Internet Explorer start iexplore exe c
将八位字节字符串转换为 Unicode 字符串，Python 3

我正在尝试使用 Python 3 将带有八进制转义 Unicode 的字符串转换回正确的 Unicode 字符串如下所示 training 345 256 214 346 210 220 345 276 214 txt 是读入的字符串 t
给定范围内的最近邻居

我面临的问题是快速找到给定范围内最近的邻居数据集示例 id string float 0 AA 0 1 12 BB 0 5 2 CC 0 3 102 AA 1 1 33 AA 2 8 17 AA 0 5 对于每一行打印满足以下条件的行数

给定范围内的最近邻居

给定范围内的最近邻居 的相关文章

随机推荐

热门标签

给定范围内的最近邻居的相关文章