scikit SGDClassifierpartial_fit 不会增量学习。返回“类应包含所有有效标签”

2024-01-04

我将两个数据流传递给 sgd_clf 分类器，如下面的代码所示。第一个partial_fit 正在获取第一个数据流x1,y1。第二个partial_fit 正在获取第二个数据流x2,y2。

下面的代码在第二个partial_fit步骤中给了我错误，即之前要包含的类标签。当我将 x2 y2 中的所有数据包含在 x1, y1 中时，此错误消失了。（在现在调用第二个partial_fit之前包含我的班级标签）

但是，我无法事先给出 x2 y2 数据。如果我在第一个partial_fit()之前给出了所有数据，为什么我需要使用第二个partial_fit()？事实上，如果我之前知道所有数据，我不需要使用partial_fit()，我可以只做fit()。

from sklearn import neighbors, linear_model
import numpy as np

def train_new_data():

    sgd_clf = linear_model.SGDClassifier()

    x1 = [[8, 9], [20, 22]]
    y1 = [5, 6]

    classes = np.unique(y1)

    #print(classes)

    sgd_clf.partial_fit(x1,y1,classes=classes)

    x2 = [10, 12]
    y2 = 8


    sgd_clf.partial_fit([x2], [y2],classes=classes)#Error here!!

    return sgd_clf

if __name__ == "__main__":

    print(train_new_data().predict([[20,22]]))

Q1：我对sklearn分类器的partial_fit()的理解是否错误，它按照此处指定的方式动态获取数据：渐进学习 http://scikit-learn.org/stable/modules/scaling_strategies.html

Q2：我想用新数据重新训练模型/更新模型。我不想从头开始训练。 partial_fit 会帮我解决这个问题吗？

Q3：我不仅仅针对 SGDClassifier。我可以使用任何支持在线/批量学习的算法。我的主要目的是第三季度。我有一个经过数千张图像训练的模型。我不想仅仅因为我有一个/两个新的图像样本就从头开始重新训练这个模型。两者都没有兴趣为每个新条目创建一个新模型，然后将它们混合在一起。这降低了我在所有训练模型中进行搜索的预测性能。我只想借助partial_fit 将这个新数据实例添加到经过训练的模型中。这可行吗？

Q4：如果我无法使用 scikit 分类器实现 Q2，请指导我如何实现这一目标

非常感谢任何建议、想法或参考。

您需要事先知道您需要多少课程。第一次调用部分拟合后，算法假设您不会有任何新的classes稍后添加。

在您的示例中，您被添加到一个以前从未见过的新类 (y2 = 8) 中，并且在您对部分拟合的初始调用中未指示为存在（仅包含标签“5”和“6”）。您需要在第一次调用时将其添加到类对象中。

为了保持一致性，我还建议您从 0 开始对课程进行编号。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scikit SGDClassifierpartial_fit 不会增量学习。返回“类应包含所有有效标签” 的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

如何使 React HOC - 高阶组件协同工作？

我有一个像这样的小演示组件 function MyList data uppercaseMe lowercaseMe return ul data map item gt li item li ul
javafx canvas 几秒钟后停止显示（我正在尝试百万个椭圆）

我试图每秒在画布上动态显示一百万个椭圆形我使用线程作为渲染线程但我的问题是几秒钟后画布冻结并停止显示我猜缓冲区已满无法再显示但是如何清除缓冲区呢测试源码如下 public class Main extends Applica
Cucumber：填写带双引号的字段

我有一些 Rails 应用程序一个带有字段的视图可以说它叫做 some field 我想填写 SOME STRING WITH QUOTES 字段我怎样才能在黄瓜中做到这一点 When I fill in some field wit
如何使用 Yii2 kartik gridview 可编辑列与多个模型关系

问题我有 2 个模型用户模型和用户配置文件模型两者都与主键和外键 user id 相关用户表有字段 id 用户名密码电子邮件等 user profile表包含id user id 公司电话等我在用户视图中创建了gridvie
没有html的innerHTML，只有文本[重复]

这个问题在这里已经有答案了我创建了一个电子邮件链接它会自动填充正文中的必要信息但是当我执行 innerHTML 时我得到的比我预想的要多一些我想要 2012 年 3 月 12 16 我得到什么 b March 2012 b fo
有没有办法更改谷歌一键提示的语言？

目前谷歌一键提示仅以英文呈现有没有一种方法可以将区域设置传递给 javascript api 以便以该特定语言呈现提示抱歉这么晚才回复但是我最近遇到了同样的问题官方文档没有提供处理提示本地化的直接方法我发现的最接近的想法是 li
如何获取hive UDF中的taskID或mapperID（类似于Spark中的partitionID）？

作为问题如何在 hive UDF 中获取任务 ID 或映射器 ID 类似于 Spark 中的分区 ID 您可以使用 TaskContext 访问任务信息 import org apache spark TaskContext sc par
Facebook oauth 授权 URL 和参数选项

Facebook 提供了一些关于参数的文档oauth login 登录对话框 OAuth 2 https developers facebook com docs reference dialogs oauth 参数为 client id
Java 6 中 IdentityHashMap 的实际使用[重复]

这个问题在这里已经有答案了可能的重复 IdentityHashMap 的用例 https stackoverflow com questions 838528 use cases for identityhashmap Java 5 中引
Android ActionBarSherlock 顶部图标返回

我正在尝试制作顶部操作栏图标以允许用户返回到上一个屏幕我试图实现这些代码但没有一个起作用任何人都可以指导我吗我知道这看起来很简单我是 android 新手下面是我的代码问题当我点击图标按钮时它只是清除了我的屏幕而没有转到
com.android.build.gradle.api.BaseVariant.getOutputs()Ljava/util/List;'

错误无法找到方法 com android build gradle api BaseVariant getOutputs Ljava util List 导致此意外错误的可能原因包括 Gradle 的依赖项缓存可能已损坏这有时会在网络连
如何确定 ColdFusion 应用程序使用哪些文件？

我正在开始对现有的 ColdFusion 应用程序进行一些工作该应用程序没有版本控制并且看起来像是未使用的 cfm 文件 test cfm test2 cfm 等我想了解哪些文件实际上是应用程序的一部分这样我就可以将其以可管理的状态
VBScript 环境变量

我有一个关于应该如何修复运行脚本时看到的错误的问题我很确定这与我使用 COMPUTERNAME 环境变量的方式有关我的脚本的作用是在本地压缩一些文件然后使用 robocopy 将它们复制到已安装或共享的驱动器然后检查文件大小是否相同
将新记录添加到 GridView 但不应更新数据库

我有一个绑定到数据视图的网格视图 OnPageLoad 我正在填充网格视图记录我有一个文本框和一个按钮所以现在我想向 GridView 添加更多记录但这些记录不应添加到数据库中它们只是添加到页面中当然来自数据库的默认记录也会保留
Python 中的就地函数

Python中有一个就地函数的概念例如shuffle就位因为它返回None 如何确定函数是否就位 from random import shuffle print type shuffle
Javascript 中的函数是对象还是类型？

In his 雄辩的 JavaScript Haverbeke 声称第 16 页在 JavaScript 系统中大部分数据被整齐地分成称为值的东西每个值都有一个类型它决定了它可以扮演的角色值有六种基本类型数字字符串布尔值
Herkou Redis - 证书验证失败（证书链中的自签名证书）

我在我的一个业余项目中使用 heroku redis 一段时间了我目前用它来做三件事它是我存储 firebase 证书的地方它用于缓存站点上的数据它用于 Rails sidekiq 作业最近我的 heroku 使用量增加了我不
自动释放池中的快速闭包访问没有 self 的方法

这是示例代码 func anyMethod Nothing here var myVariable autoreleasepool anyMethod This should show error print myVariable This
异步网络接口状态检查

在 Mac OS X 上有没有办法在网络接口 en0 en1 状态发生变化例如网络接口处于活动状态非活动状态等时获取异步通知我想知道是否有一种方法可以获取异步通知而不是轮询状态以便每当有更改时都会触发通知并且应用程序可以处理
scikit SGDClassifierpartial_fit 不会增量学习。返回“类应包含所有有效标签”

我将两个数据流传递给 sgd clf 分类器如下面的代码所示第一个partial fit 正在获取第一个数据流x1 y1 第二个partial fit 正在获取第二个数据流x2 y2 下面的代码在第二个partial fit步骤中给了我

scikit SGDClassifierpartial_fit 不会增量学习。返回“类应包含所有有效标签”

scikit SGDClassifierpartial_fit 不会增量学习。返回“类应包含所有有效标签” 的相关文章

随机推荐

热门标签