如何加速sklearn SVR？

2024-04-15

我正在实施SVR http://en.wikipedia.org/wiki/Support_vector_machine#Regression using sklearn http://scikit-learn.org/stable/python 中的 svr 包。我的稀疏矩阵的大小为 146860 x 10202。我将其划分为大小为 2500 x 10202 的各个子矩阵。对于每个子矩阵，SVR 拟合大约需要 10 分钟。有哪些方法可以加快这一过程？请建议任何不同的方法或不同的 python 包。谢谢！

您可以对 SVR 子模型预测进行平均。

或者，您可以尝试在核扩展的输出上拟合线性回归模型尼斯特罗姆法 http://scikit-learn.org/dev/modules/kernel_approximation.html.

或者您可以尝试其他非线性回归模型，例如随机树集成或梯度增强回归树。

Edit：我忘了说：内核 SVR 模型本身不可扩展，因为它的复杂性超过二次方，因此无法“加速”。

Edit 2：实际上，经常将输入变量缩放为[0, 1] or [-1, 1]或使用单位方差StandardScaler可以大大加快收敛速度。

此外，默认参数不太可能产生良好的结果：您必须网格搜索最佳值gamma也许还有epsilon在拟合大型模型之前，先对尺寸不断增加的子样本进行分析（以检查最佳参数的稳定性）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

SVM

sparsematrix

scikitlearn

如何加速sklearn SVR？的相关文章

Python 切片对象和 __getitem__

python 中是否有内部的东西来处理传递给的参数 getitem 不同并自动转换start stop step构造成切片这是我的意思的演示 class ExampleClass object def getitem self args
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的

随机推荐

如何让用户能够使用我的应用程序播放视频？

昨晚刚刚花了几个小时为 Honeycomb 开发了一个非常漂亮的视频播放器现在我当然希望人们能够使用它如何让我的应用程序监听接收视频播放广播我猜这与manifest xml文件但我无法在 Android 开发者网站上找到任何有关
然后 Groupby 检查行匹配并计算该值的并发实例数

我有这个数据框 car color years max years 0 audi black 1 7 1 audi blue 2 7 2 audi purple 4 7 3 audi black 6 7 4 bmw blue 1 5 5 b
为什么 CAS（原子）操作比同步或易失性操作更快

据我了解 synchronized关键字将本地线程缓存与主内存同步 volatile 关键字基本上总是在每次访问时从主内存中读取变量当然访问主内存比本地线程缓存要昂贵得多因此这些操作的成本很高然而 CAS 操作使用低级硬件操作但仍
有条件的 Mercurial 忽略文件

我在 Mercurial 中有一个文件我希望开发机器提取该文件但我希望部署服务器不提取该文件它具有开发机器没有的特殊模块这是可能的还是我应该有一个自定义的推送到服务器解决方案而不是仅仅进行 hg pull 执行此操作的典型方法是
H2O R api：从网格搜索中检索最佳模型

我正在使用h2oR 中的包 v 3 6 0 并且我构建了一个网格搜索模型现在我正在尝试访问最小化验证集上的 MSE 的模型在Python中sklearn 这在使用时很容易实现RandomizedSearchCV Pseudo code
如何将 Windows 桌面应用程序转换为 Mac 桌面应用程序？

我需要将 C NET Windows 桌面应用程序转换为 Mac 我读过有关 Qt REAL Studio LiveCode RunRev wxWidgets 和 Mono 的跨平台方面的内容 www mono project com 和h
如何使用 Maven 在构建时正确增强类？ OpenJPA

我在尝试着enhance 实体类所以我不会得到这个异常 Exception in thread main
CGImageRelease：[不是类型发布]：发送到已释放实例的消息

我在代码 CGImageRelease imageToSave 的最后一行收到此错误不是类型发布消息发送到已释放的实例请解释原因以及我需要使用什么来修复它我正在使用 ARC 但我认为这不适用于 CG 对象在测试代码是否有效后我
地理编码器可使用两个地址

带有 Geocoder gem 的 Rails 4 1 3 应用程序在模型上具有以下属性 t decimal origin lon precision gt 15 scale gt 10 t decimal origin lat preci
C# Ghostscript 包装器

有没有人遇到过 C 中 GhostScript 的一个很好的包装器我的具体用途是把postscript转成pdf Matthew Ephraim 创建了一个非常简单的 C 包装器名为 GhostScriptSharp 它使用 P Inv
支持异步操作并遵守超时的.NET TcpClient/NetworkStream 实现

根据问题数量论坛帖子等 BCL 中的 TcpClient NetworkStream 实现似乎缺乏对取消 IO 操作的适当支持随着 NET 4 5 中添加异步方法这种取消或适当的超时支持的缺乏使事情变得更加令人沮丧因为在执行 I
如何使用Python 2.7.8 |Anaconda 2.1.0（32位）加载png图像？

我使用 Anaconda 下载 Python 2 7 我使用的是Windows 7 我尝试了以下操作 from Tkinter import Tk Frame Canvas import ImageTk t Tk t title Trans
在 F# 列表中键入扩展名

假设我有一个类型 let MyType some info 但是它通常用于列表 MyType list 所以我可以定义 let MyTypeList MyType list 有没有办法在 MyTypeList 上定义类型增强我的实际情况
在添加较少支持期间无法在下一个 js 中设置未定义的属性“样式”

我正在尝试使用 antd 设计向我的下一个 js 项目添加对 less 文件的支持但无法设置未定义的属性样式我想自定义 antd 主题但该错误对我来说是一个障碍任何人有任何想法请帮助我解决这个问题 error screenshot
Xcode 本地化更新

因此我使用 Use Base Internationalization 在 Xcode 中本地化了故事板我进去翻译了字符串文件中的所有字符串耶那花了很长时间现在我在故事板的基本文件中添加了一个新元素它有一个标签其中有一个我需
将其他参数添加到来自 youtube 的 yt.player 对象

我正在使用 yt player 启动 YouTube 视频如下所示 function onYouTubeIframeAPIReady player new YT Player player height 720 width 1280 ht
将光标数据放入数组中

作为 Android 新手我在处理以下问题时遇到困难 public String getContacts Cursor cursor getReadableDatabase rawQuery SELECT name FROM contac
是否存在可以生成所有可能排列的交换序列？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 给你一个数字列表1 2 n 是否有一
mysql查询获取多个日期范围

我似乎在提出查询来实现我想要的目标时遇到了一些麻烦我有一张如下表 Date TIMESTAMP Count 2016 02 01 01 00 00 52 2016 01 05 11 30 00 14 2016 02 01 04 20 00
如何加速sklearn SVR？

我正在实施SVR http en wikipedia org wiki Support vector machine Regression using sklearn http scikit learn org stable python

如何加速sklearn SVR？

如何加速sklearn SVR？ 的相关文章

随机推荐

热门标签

如何加速sklearn SVR？的相关文章