理解 scipy.spatial.KDTree 中的 `leafsize`

2023-11-27

问题陈述：

我在 3D 空间中有 150k 个点，它们的坐标存储在尺寸为 [150k, 3]（以毫米为单位）的矩阵中。

我想找到给定点的所有邻居p在半径范围内r。我想以最准确的方式做到这一点。

我应该如何选择我的leafsize范围？

from scipy.spatial import KDTree
import numpy as np

pts = np.random.rand(150000,3)

T1 = KDTree(pts, leafsize=20)
T2 = KDTree(pts, leafsize=1)

neighbors1= T1.query_ball_point((0.3,0.2,0.1), r=2.0)
neighbors2= T2.query_ball_point((0.3,0.2,0.1), r=2.0)

np.allclose(sorted(neighbors1), sorted(neighbors2))
True

功能query_ball_point将为任何版本的搜索树返回正确的点集。这leafsize参数不会影响查询的结果，只会影响结果的性能。

想象一下下面显示的两棵树具有相同的数据（但叶大小参数不同），并且查询搜索红色圆圈内的所有点。

在这两种情况下，代码只会返回位于红色圆圈内的两个点。这是通过检查与圆相交的树的所有框中的所有点来完成的。这会导致每种情况下的工作量不同（即不同的性能）。对于左边的树（对应于较大的叶子尺寸），算法必须检查 13 个点是否在圆内（6 个位于上部相交框中，7 个位于下部相交框中）。在右侧的树（叶子尺寸较小）中，仅处理三个点（一个位于上部相交框中，两个位于下部相交框中）。

按照这个逻辑，您可能认为始终使用较小的叶子尺寸是有意义的：这将最大限度地减少算法结束时的实际比较数量（确定点是否实际上位于查询区域中）。但事情并不是那么简单：较小的叶子尺寸将生成更深的树，从而增加构建时间和树遍历时间的成本。获得树遍历性能与叶级比较的正确平衡实际上取决于进入树的数据类型以及您正在执行的特定叶级比较。这就是为什么 scipy 提供 leafsize 参数作为参数，以便您可以调整事物以在特定算法上获得最佳性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

理解 scipy.spatial.KDTree 中的 `leafsize` 的相关文章

如何用Python实现FIR高通滤波器？

首先我在 Stack Exchange 中问了这个问题我只得到与概念相关的答案而不是面向实现的答案所以我的问题是我正在尝试创建高通滤波器并使用 Python 实现 from numpy import cos sin pi abso
Scipy 最小化 fmin - 语法问题

我有一个函数它接受多个参数一个数组和两个浮点数并返回一个标量浮点数现在我想通过改变两个参数来最小化这个函数两个浮点数该数组在函数内部解包然后使用其内容数组和浮点数如何使用 SciPy 的 fmin 函数来完成此操作我
在 Python 中对数据进行求和

Given that the fitting function is of type 我打算将这样的函数拟合到我拥有的实验数据 x y f x 中但后来我有一些疑问当涉及求和时如何定义拟合函数一旦定义了函数即def func re
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
任何人都知道 JQuery 插件可以生成类似于 geni.com 上的树形菜单

大家好我花了几个小时寻找一个 Jquery 插件来生成像 geni com 上那样的树形菜单模块如果有人知道 Jquery 中的这样的插件或脚本请让我知道或指导我如何使用 Jquery 开发这样的功能请检查我正在寻找什么http w
支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

在 Jupyter 笔记本上本地运行并使用 MNIST 数据集 28k 条目每个图像 28x28 像素以下内容为27秒 from sklearn neighbors import KNeighborsClassifier knn clf
将索引数组转换为 NumPy 中的 one-hot 编码数组

给定一个一维索引数组 a array 1 0 3 我想将其一次性编码为二维数组 b array 0 1 0 0 1 0 0 0 0 0 0 1 创建归零数组b有足够的列即a max 1 然后对于每一行i 设置a i 第列至1 gt
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
高维最近邻搜索的最佳数据结构

我实际上正在处理高维数据 50 000 100 000 个特征并且必须对其执行最近邻搜索我知道随着维度的增长 KD 树的性能很差而且我还了解到一般来说所有空间分区数据结构都倾向于对高维数据执行详尽的搜索此外还有两个重要事实需要
约束 3D 表面的 RBF 插值以保持曲率

我的任务是开发一种算法给定一组表示现有表面测量值的稀疏点我们就可以计算表面上任何点的 z 坐标面临的挑战是找到一种合适的插值方法该方法可以在仅给定几个点的情况下重新创建 3D 表面并推断出超出包含初始测量值的范围的值对于许多插值
求解超定系统最小二乘的最快方法

我有一个大小为 m n 的矩阵 A m 阶约为 100K n 阶约为 500 和向量 b 另外我的矩阵是病态的并且等级不足现在我想找出 Ax b 的最小二乘解为此我比较了一些方法 scipy linalg lstsq 时间剩余 14
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
Python 或 C 语言中的 Matlab / Octave bwdist()

有谁知道 Matlab Octave bwdist 函数的 Python 替代品此函数返回给定矩阵的每个单元格到最近的非零单元格的欧几里得距离我看到了一个 Octave C 实现一个纯 Matlab 实现我想知道是否有人必须用 AN
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
使用时间、日期、时间增量

我有一个问题我的工作时间和时差很多到目前为止我已经使用许多 if 语句解决了这个问题但这些语句很容易出错在寻找更好的解决方案并且无需重新发明轮子的过程中我遇到了时间日期和时间增量但这些对我来说似乎太不灵活了所以我正在寻找如
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m

随机推荐

如何使用 Shapeless 迭代联产品中的所有产品类型？

假设我有一个副产品密封特征例如 sealed trait Traity case object Foo extends Traity case class Bar extends Traity case class Baz extend
转义 utf-8 json 上的重音字符

下面的代码产生以下输出 x Art 120 Incapacit di intendere o di volere 我需要对此进行更改我想我必须更改编码上的某些内容但我不知道是什么 x Art 120 Incapacit u00e0 di
如何将带槽的 python 类转换为字典？

我使用带有插槽的类来减少实例占用的内存现在如何将插槽实例转换为字典插槽类如下所示 class Foo object slots x y z def init self self x 1 self y 2 self z 3 我期望这样的
将图像或视频添加到 iPhone 模拟器

我正在尝试使用UIImagePickerController with UIImagePickerControllerSourceTypePhotoLibrary 但它说没有照片模拟器从哪里获取图像我应该在哪里复制图像以便它们显示在模
g++ 大引号在控制台和“问题”列表中显示不正确

最近我从 Visual Studio 切换到 Eclipse CDT 我已经将其设置得很漂亮这样我的 Cygwin 安装中的 G 编译器就可以毫不费力地找到并编译我的代码不过还有一点小小的不满每次 G 报告警告或错误时弯单引号
如何在phonegap中的同一应用程序中显示PDF文件

如何在同一个phonegap应用程序中显示Pdf文件我尝试了 Inappbrowser Mupdf PDFJS 都使用其他 pdf 查看器显示 PDF 我想在同一个应用程序中打开 pdf 文件任何人都可以帮助我提前致谢对于科尔多瓦
jquery切换slideUp/slideDown

我有一个 div items 如果单击它则 div choices slipDown 如果再次单击则 div choices 应该 slipUp 我如何测试选择是否已经下降或上升我知道我可以存储在一个变量中并在单击 div item
连接 mongodb 时 connect 不是一个函数

尝试从以下位置运行该函数时发生错误mongodb将代码连接到数据库的网站 const MongoClient require mongodb const client new MongoClient uri useNewUrlParser
Microsoft Office Access 数据库引擎找不到对象

我正在尝试将数据从 Excel 复制到 SQL Server 但遇到以下错误 Microsoft Office Access 数据库引擎找不到对象 sheet1 确保该对象存在并且其名称和路径名称拼写正确我的代码是 protected v
git 如何在不提交更改的情况下切换分支

我在branchX 工作它有十几个我不想提交的配置文件所以我将所有配置文件标记为 skip worktree 现在我想换成branchY 我该怎么做 I tried git checkout branchY 它说 Please comm
知道什么可能导致 Visual Studio 2013 中“vshost32.exe 已停止工作”吗？

我正在处理的 C WPF 应用程序包含许多对非托管外部 DLL 的调用正常运行应用程序时即在 Visual Studio 调试器之外对 DLL 的所有调用都按预期工作但是在 Visual Studio 2013 中进行调试时调用
使用 firebase CLI 部署具有本地依赖项的 firebase 函数

Setup 我有一个具有以下文件结构的 monorepo 设置 functions src package json shared dist src package json frontend firebase json 方法1 失败 sh
PHP Composer Autoloader 类未找到异常

标题本身就说明了一切这是我的项目结构 src Database Core MySQL php Support start php vendor composer json index php MySQL php 文件 index php
如何配置 config.inc.php 以在 phpmyadmin 中拥有登录表单

我是否必须下载任何文件才能获得登录表单php 我已经问过这个问题一百万次了但我不确定你们是否明白这个问题我想要的只是一个登录表单phpmyadmin 您将在其中输入您的用户名和密码我必须创建任何php登录表单还是安装时已包含wamps
如何将子节点添加到派生自 System.Web.UI.Control 的自定义 asp.net 用户控件

我想知道如何向派生自 System Web UI Control 的自定义用户控件类添加一些额外的子节点例如目前我有一个不包含子节点的控件在设计表面上如下所示
如何更改 pyscripter 使用的 python 版本

我是一个Python新手刚刚学习如何做我正在使用 pyscripter 并且已经学习了一段时间了我现在正在学习 2 6 版本的在线课程但我的 pyscripter 使用的是最新版本我需要知道如何更改它以使用旧版本我已经看到有关更
如何编写依赖于其他向量化表达式的向量化表达式？

例如如果我有三个表达式 A B and C如下 A i 1 A i C i k B i 1 B i A i h C i 1 A i B i where k and h是一些常数和m and n是所需的大小C i是之前获得的值 i 1是下一
是否可以使用 Android build.xml 简单地编译 Emma 检测的 APK，而不运行任何测试

我知道 ant coverage 然而它做了一些事情它使用 emma Instrumentation 进行编译安装并运行测试 apk 我不希望它通过 ant 覆盖运行测试套件因为我需要使用一些额外的钩子来运行它并且我不想运行大型测
Kissfft缩放

我希望使用 FFT 和 Kissfft 库计算快速相关性并且缩放需要精确哪些缩放是必要的向前和向后以及我使用什么值来缩放数据 3 个最常见的 FFT 缩放因子是 1 0 正向 FFT 1 0 N 反向 FFT 1 0 N 正向 FF
理解 scipy.spatial.KDTree 中的 `leafsize`

问题陈述我在 3D 空间中有 150k 个点它们的坐标存储在尺寸为 150k 3 以毫米为单位的矩阵中我想找到给定点的所有邻居p在半径范围内r 我想以最准确的方式做到这一点我应该如何选择我的leafsize范围 from scip

理解 scipy.spatial.KDTree 中的 `leafsize`

理解 scipy.spatial.KDTree 中的 `leafsize` 的相关文章

随机推荐

热门标签