为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

2024-05-11

在 Jupyter 笔记本上本地运行并使用 MNIST 数据集（28k 条目，每个图像 28x28 像素，以下内容为27秒.

from sklearn.neighbors import KNeighborsClassifier

knn_clf = KNeighborsClassifier(n_jobs=1)
knn_clf.fit(pixels, labels)

然而，以下需要1722 秒，换句话说长约 64 倍:

from sklearn.model_selection import cross_val_predict
y_train_pred = cross_val_predict(knn_clf, pixels, labels, cv = 3, n_jobs=1)

我天真的理解是cross_val_predict with cv=3正在进行 3 倍交叉验证，因此我希望它能够拟合模型 3 次，因此至少需要大约 3 倍的时间，但我不明白为什么需要 64 倍！

为了检查它是否特定于我的环境，我在Colab笔记本 https://colab.research.google.com/drive/1QsY4vbHfyb7mBcFGHjeUdnVQZetNT3g-- 差异没有那么极端（15x），但仍远高于我预期的 3 倍：

我缺少什么？为什么 cross_val_predict 比拟合模型慢得多？

如果重要的话，我正在运行 scikit-learn 0.20.2。

KNN也称为惰性算法，因为在拟合过程中它什么都不做，只是保存输入数据，特别是根本没有学习。

在预测期间，每个测试数据点都会进行实际距离计算。因此，您可以理解，当使用cross_val_predict, KNN必须对验证数据点进行预测，这使得计算时间更长！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

machinelearning

scikitlearn

crossvalidation

为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？的相关文章

在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
LEFT JOIN 比 INNER JOIN 快得多

我有一张桌子 MainTable 有超过 600 000 条记录它通过第二个表连接到自身 JoinTable 在父子类型关系中 SELECT Child ID Parent ID FROM MainTable AS Child JOIN
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
在Python上获取字典的前x个元素

我是Python的新手所以我尝试用Python获取字典的前50个元素我有一本字典它按值降序排列 k 0 l 0 for k in len dict d l 1 if l lt 51 print dict 举个小例子 dict d m
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
索引在 NOT IN 或 <> 子句中起作用吗？

我读过至少 Oracle 数据库中的普通索引基本上是 B 树结构因此存储处理适当根节点的记录小于根的记录被迭代地存储在树的左侧部分而大于根的记录被存储在右侧部分正是这种存储方法有助于通过树遍历实现更快的扫描因为深度和广度都
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
记录类名、方法名和行号的性能影响

我正在我的 java 应用程序中实现日志记录以便我可以调试应用程序投入生产后可能出现的潜在问题考虑到在这种情况下人们不会奢侈地使用 IDE 开发工具以调试模式运行事物或单步执行完整代码因此在每条消息中记录类名方法名和行号将非常有
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

.NET 3.5 中的实体框架延迟加载

由于服务器限制我仅限于 Net 3 5 我使用 Linq to SQL 进行延迟加载但后来切换到实体框架 L2E 在 3 5 中没有延迟加载而 L2S 有有没有办法以某种方式重新生成模板来实现这一目标您必须在 EF 1 NET 3
全局 git 配置数据存储在哪里？

使用时git config global要进行设置它将写入哪个文件 Example git config global core editor blah 我在这些地方找不到它 C Program Files Git etc gitconf
Django：如何判断 post_save 信号是否在新对象上触发？

我需要对 Django 中新创建的对象进行一些后台后处理此后处理只能在新对象上运行而不是在刚刚更新的对象上运行我知道在 pre save 中我可以检查该对象是否有 id 如果没有则它是一个新对象但问题是在后处理中我需要访问id 以便
如何确定 SQLite 索引是否唯一？（使用 SQL）

我想通过 SQL 查询找出索引是否是唯一的我正在使用 SQLite 3 我尝试了两种方法 SELECT FROM sqlite master WHERE name sqlite autoindex user 1 这将返回有关索引的信息 t
在 Go 中生成随机、固定长度的字节数组

我有一个字节数组固定长度为4 token make byte 4 我需要将每个字节设置为随机字节我怎样才能以最有效的方式做到这一点这math rand就我而言方法不提供随机字节函数也许有一种内置的方法或者我应该生成一个随机字符串
失败 INSTALL_FAILED_MEDIA_UNAVAILABLE

我已经为 Visual Studio 2010 安装了 JDK Android SDK 和 Mono Android 我创建了一个空的解决方案并且使用 Android 2 3 3 启动并运行了模拟器到目前为止一切顺利当我尝试将应用程序
C# 计算元音

我正在学习 C 编程并且正在尝试计算元音我让程序循环遍历句子但它不返回元音计数而是仅返回字符串的长度任何帮助将不胜感激 static void Main int total 0 Console WriteLine Enter a
保护 JSF 应用程序的安全

我的一位自由职业者朋友邀请我加入他的 JSF 2 0 项目我正在慢慢加快速度并将各个部分整合在一起来自 Windows Forms NET 世界至少可以说我还有很多东西需要学习我主要担心的是对于如何保护 JSF 应用程序缺乏明显的
聚合物嵌套应用程序路由未正确映射

我正在努力找到一些正确的基本路线我正在使用 Polymer 1 5 0 但在使用嵌套路由时遇到问题我正在使用应用程序路由0 9 2 As 这篇文章建议 https www polymer project org 1 0 blog rou
如何在正则表达式之后打印单词但不打印相似的单词？

我想要一个 awk 或 sed 命令来打印正则表达式之后的单词我想找到一个单词后面的单词但不是看起来相似的单词该文件如下所示 somethingsomething X Windows Icon xournal somethingsom
“npm”不被识别为内部或外部命令、可操作程序或批处理文件

我对 Nodejs 完全陌生我正在尝试让 nodejs 在我的 Windows 2008 机器上工作以便安装 Karma 我将使用它来 TDDing 我的 AngularJs 代码到目前为止我已经完成了以下步骤使用 Chocolat
是否有用于 AES 的纯 Perl 模块？

是否有用于 AES 的纯 Perl 模块地穴 Rijndael PP http search cpan org dist Crypt Rijndael PP Rijndael 是底层算法AES https secure wikimedia
如何在 Scala 中编写 Pig UDF

我正在尝试在 Scala 中编写 Pig UDF 使用 Eclipse 我已将 pig jar 添加为 java 构建路径中的库这似乎解决了以下 2 个导入问题导入 org apache pig EvalFunc 导入 org apac
Docker：通过 CLI 使用 --password 是不安全的。使用--密码-stdin

当我在持续集成 CI 过程中登录注册表时出现以下警告 WARNING Using password via the CLI is insecure Use password stdin 我应该更换吗 password with passw
在布局中添加空格

我正在尝试在 android 中创建空行这就是我一直在做的事情 android layout width fill parent android layout height wrap content android text n n 我想
从 exe 文件中获取汇编级代码？

我当时正在做linux汇编编程在过去的几天里我已经转而学习windows汇编编程我在用ml作为我的汇编器和golink作为我的链接器我有我的汇编代码并已获得我的exe从中现在我需要取回它的十六进制 xff xab x55等等在li
删除 Swift 3 中 Core Data 实体中的所有数据

有没有办法批量删除核心数据中所有实体中存储的所有数据我在某处读到在 iOS 9 或 10 中苹果引入了一种批量删除的方法但我似乎找不到任何关于它的好信息最终我只需要一个遍历实体并删除其中所有数据的函数看起来它应该很简单但事实
如何在 Debian 上编译 DOS 程序？

在我的汇编语言课程中我们使用 DPMI 编写 DOS 程序不幸的是我无法一直使用 32 位 Windows 机器我在我使用的几乎每台计算机上都安装了 Debian 虚拟机我已经安装了 DOSBox 和 DOSEMU 有什么办法可以
如何使用python正则表达式查找并替换句子中第n次出现的单词？

仅使用python正则表达式如何查找并替换句子中第n次出现的单词例如 str cat goose mouse horse pig cat cow new str re sub r cat r Bull str new str re su
为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

在 Jupyter 笔记本上本地运行并使用 MNIST 数据集 28k 条目每个图像 28x28 像素以下内容为27秒 from sklearn neighbors import KNeighborsClassifier knn clf

为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？

为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？ 的相关文章

随机推荐

热门标签

为什么 cross_val_predict 比 KNeighborsClassifier 的拟合慢得多？的相关文章