scikit-learn：SVC 和 SGD 有什么区别？

2024-04-30

SVM: http://scikit-learn.org/stable/modules/svm.html#classification http://scikit-learn.org/stable/modules/svm.html#classification

SGD: http://scikit-learn.org/stable/modules/sgd.html#classification http://scikit-learn.org/stable/modules/sgd.html#classification

在我看来，他们写的“SGD 实现了线性模型”几乎是一样的。有人可以解释它们之间的区别吗？

SVM is a 支持向量机 https://en.wikipedia.org/wiki/Support_vector_machine which 是一个特殊的线性模型。从理论上来说这是一个凸优化问题我们可以在多项式时间内得到全局最优值。有许多不同的优化方法.

过去人们常用二次规划 https://en.wikipedia.org/wiki/Quadratic_programming求解器。如今专门的方法如SMO https://en.wikipedia.org/wiki/Sequential_minimal_optimization和其他被使用。

sklearn 的专门 SVM 优化器基于线性库 https://www.csie.ntu.edu.tw/~cjlin/liblinear/ and libsvm https://www.csie.ntu.edu.tw/~cjlin/libsvm/。如果您对算法感兴趣，有很多文档和研究论文。

请记住，SVC (libsvm) 和 LinearSVC (lib Linear) 对优化问题做出不同的假设，这会导致同一任务上的不同性能（线性内核：LinearSVC 通常比 SVC 高效得多；但有些LinearSVC 无法处理的任务）。

新元是一个随机梯度下降 https://en.wikipedia.org/wiki/Stochastic_gradient_descent基于（这是通用优化方法！）的优化器，可以优化许多不同的凸优化问题（实际上：这或多或少与所有深度学习方法中使用的方法相同；所以人们也在非凸设置中使用它；抛弃理论保证).

sklearn 说：随机梯度下降（SGD）是一种简单但非常有效的凸损失函数下线性分类器判别学习方法。现在它实际上更加通用，但在这里只要注意到它包含（一些）SVM、逻辑回归等就足够了。

现在基于 SGD 的优化与 QP 和其他优化有很大不同。如果以 QP 为例，没有需要调整的超参数。这有点简化，因为可以进行调整，但不需要保证收敛和性能！（QP 求解器的理论，例如内点法 https://en.wikipedia.org/wiki/Interior_point_method更加稳健）

基于 SGD 的优化器（或通用优化器）一阶方法）非常非常难以调整！他们需要调整！一般来说，学习率或学习计划是需要考虑的参数，因为收敛取决于这些（理论和实践）！

这是一个非常复杂的话题，但有些简化规则:

专门的 SVM 方法
- 随着样本数量的增加，规模变得更糟
- 不需要超参数调整
基于 SGD 的方法
- 一般来说，海量数据可以更好地扩展
- 需要超参数调整
- 仅解决上述任务的一部分（无内核方法！）

我的观点：只要你的时间预算允许，就使用（更容易使用的）LinearSVC！

只是为了说清楚：我强烈建议获取一些数据集（例如来自 sklearn 内部）并在这些候选数据之间进行一些比较。参数调整的需要不是一个理论问题！您将看到非最佳（目标/损失) 很容易得出 SGD 情况！

并永远记住：随机梯度下降对特征缩放敏感 docs http://scikit-learn.org/stable/modules/sgd.html#tips-on-practical-use。这或多或少是一阶方法的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scikit-learn：SVC 和 SGD 有什么区别？的相关文章

2d 图像点和 3d 网格之间的交点

Given 网格源相机我有内在和外在参数图像坐标 2d Output 3D 点是从相机中心发出的光线穿过图像平面上的 2d 点与网格的交点我试图找到网格上的 3d 点 This is the process From Multip
Tkinter 菜单删除项

如何删除任何菜单项例如我想删除播放 self menubar Menu self root self root config menu self menubar self filemenu2 Menu self menubar self
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
如何调整 matplotlib 单选按钮的大小和纵横比？

我已经尝试了几个小时来使简单的单选按钮列表的大小和纵横比正确但没有成功首先导入模块 import matplotlib pyplot as plt from matplotlib widgets import RadioButtons
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
如何从列表类别中对 pandas 数据框进行排序？

所以我在下面有这个数据集我想根据我的列表从名称列进行排序以及按 A 升序和按 B 降序排序 import pandas as pd import numpy as np df1 pd DataFrame from items A 1
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
Jupyter Notebook：带有小部件的交互式绘图

我正在尝试生成一个依赖于小部件的交互式绘图我遇到的问题是当我使用滑块更改参数时会在前一个绘图之后完成一个新绘图而我预计只有一个绘图会根据参数发生变化 Example from ipywidgets import interact i
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

CTAD 可以在模板类的成员内部使用吗？

C 有一个有用的功能即模板参数隐含在模板类内的代码中A 然而对于建筑来说这似乎与 CTAD 发生冲突如何让 CTAD 优先例如这里有一个错误f会员因为A被解释为A
如何使用Netbeans的不确定进度条样式？

我正在使用 Nimbus 外观和感觉编写 Java 应用程序不幸的是 Nimbus 外观和感觉的不确定 JProgressBars 的外观是AWFUL 见下文另一方面我注意到 Netbeans 与 Nimbus 的外观和感觉有不同的不
std::线程构造和执行

我在中找不到任何信息文档 http en cppreference com w cpp thread thread thread是否能保证线程对象构造完成后线程实际上正在运行换句话说是否可以保证线程构造函数完成后线程函数已经被执行一
Node.js 流“结束”事件未触发

以下数据流不会触发结束事件数据事件被触发我可以看到记录到控制台的每个数据行 var AWS require aws sdk var ogr2ogr require ogr2ogr var JSONStream require JS
正确处理麦克风音频的 React Hooks

我正在尝试编写一个 React Hook 来处理流音频到 AudioContext 并使用 Meyda 进行分析 https meyda js org https meyda js org 我已经设法使流正常工作并能够提取我想要的数据但是
使用 Python API 2.0.0.1 运行 Ansible Playbook

安塞布尔版本 2 0 0 1 我现在已经四处寻找了很多我发现的大多数文档要么不完整要么已弃用这篇文章适用于1 8 4版本即 https stackoverflow com questions 27590039 running ans
当方法重新运行时，在方法中循环dispatch_after会导致许多同时调度

我正在创建一个简单的游戏我有以下代码 void doStuff double delayInSeconds NSNumber randomFloatBetweenLowerBound 0 8f upperBound 2 6f Own ca
使用 gdb 调试反汇编库

在Linux和Mac OS X中可以使用strapi和next来调试应用程序而无需调试信息在 Mac OS X 上 gdb 显示在库内部调用的函数尽管有时会在每个 stepi 指令中推进多个汇编程序指令在 Linux 上当我进入动态
字符串初始化的 gcc 诊断不一致

我正在使用 gcc 4 9 1 Mingw 并使用以下命令编译代码 gcc test c otest exe std c11 迂腐错误 Wall Wextra 此代码给出诊断 int main void char a 5 h e l l o
DataImportHandler 未在 solr admin 中索引 mysql 表

我正在尝试使用 DataImportHandler 在 solr 中索引 mysql 表但它似乎没有索引数据配置 xml
在不存储整个数组的情况下单遍查找第 K 大数

我想到的算法是保持大小为 K 的最大堆插入每个元素如果堆已满则丢弃较小的值最后第K个max是MaxHeap中较小的一个这将给我 O NlogK 有更好的算法吗我无法进行快速选择因为数组无法存储在内存中根据您的内存限制您
从 Dotnet Google API 获取用户电子邮件信息

我正在为 gData 和 Drive C API 开发两个独立的 Oauth2 实现分别将令牌信息存储在 OAuth2Parameters 和 AuthorizationState 中我可以刷新令牌并将其用于必要的 API 调用我正在
当我的活动结束时，如何停止 GPS/位置跟踪？

我有一个非常简单的 Android 应用程序它显示 Google 地图视图并使用 GPS 跟踪位置基本上像这样 public void onCreate Bundle savedInstanceState mLocationManage
使用 Cloud Endpoints for Google App Engine 对 Android 应用程序进行本地测试

我正在开发一个 Android 应用程序它使用 Google App Engine Python 中上的 Google Cloud Endpoints 作为后端 Android 应用程序授权用户在 Android 设备上使用 Googl
Highcharts - 触发 legendItemClick 事件

我想触发与当您选择项目图例但从外部 html 按钮时触发的事件相同的事件是否可以我创建了一个 jsfiddle 来展示它 http jsfiddle net YcJF8 1 http jsfiddle net YcJF8 1 conta
使用 Apache Benchmark 测试 PHP 项目的性能？

如何使用 Apache Benchmark 测试 PHP 应用程序的性能我的环境是 Ubuntu Linux 有我可以安装的软件包吗如果您安装了 Apache 2 则已经安装了 Apache Benchmark 看man ab关于如何使
无法从 Windows Phone 8.1 访问 .NET 4.5 PCL 中的本地化资源

我在访问针对 NET 4 5 的可移植类库中的本地化字符串资源时遇到问题我允许用户在第一页上选择语言并在其他页面上获得本地化体验我试图通过代码获取资源来实现这一点 MyTextBloxk Text PasswordResetMetho
将字符串化数组转换回数组

我使用 hstore 与 Postgres 9 2 和 Rails 3 2 来存储我的对象如下所示 class User user hstore user id gt 123 user courses gt 1 2 3 end 现在当我
在eclipse中的另一个项目中使用一个项目的包

如何在定义包的主项目之外使用包的类例如假设 people 包中有一个属于 ProjectOne 的 Employee 类假设另一个具有相同功能的项目 ProjectTwo 需要 Employee 我应该在那里做什么在 Package
scikit-learn：SVC 和 SGD 有什么区别？

SVM http scikit learn org stable modules svm html classification http scikit learn org stable modules svm html classific

scikit-learn：SVC 和 SGD 有什么区别？

scikit-learn：SVC 和 SGD 有什么区别？ 的相关文章

随机推荐

热门标签

scikit-learn：SVC 和 SGD 有什么区别？的相关文章