svm scikit learn 中的类权重 = none 和 auto 之间有什么区别

2023-12-10

在 scikit learn svm 分类器中，class_weight = None 和 class_weight = Auto 之间有什么区别？

从文档中它给出为

将类 i 的参数 C 设置为 SVC 的 class_weight[i]*C。如果没有给出，则所有类别的权重都应该为一。 “自动”模式使用 y 的值来自动调整与类别频率成反比的权重。

class sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma=0.0, coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_iter=-1, random_state=None)

但使用自动模式有什么好处呢？我无法理解它的实现。

这发生在class_weight.py 文件:

elif class_weight == 'auto':
    # Find the weight of each class as present in y.
    le = LabelEncoder()
    y_ind = le.fit_transform(y)
    if not all(np.in1d(classes, le.classes_)):
        raise ValueError("classes should have valid labels that are in y")

    # inversely proportional to the number of samples in the class
    recip_freq = 1. / bincount(y_ind)
    weight = recip_freq[le.transform(classes)] / np.mean(recip_freq)

这意味着您的每个班级（在classes) 得到的权重等于1除以该类别在数据中出现的次数（y），因此出现频率较高的类的权重会较低。然后将其进一步除以所有逆类别频率的平均值。

优点是您不再需要担心自己设置类权重：这对于大多数应用程序来说应该已经很好了。

如果你查看上面的源代码，对于None, weight充满了，因此每个类别的权重相等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scikitlearn

svm scikit learn 中的类权重 = none 和 auto 之间有什么区别的相关文章

sklearn DeprecationWarning 数组的真值

从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
如何修复 Apache mod_wsgi 的 Python 版本不匹配问题？

我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时在
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Python grpc protobuf 存根生成问题：--grpc_out: protoc-gen-grpc: 插件失败，状态代码 1

正如问题所说我从源代码编译了 grpc 并且也做了sudo pip install grpcio 但是那which grpc python plugin不返回任何内容这是一个问题因为route guide的grpc python示例
我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

使用 PHP 和 JSON 将图像数据从 XCode 插入 MySQL 数据库

如何使用 JSON 通过 PHP 从 XCode 在 MySQL 数据库中插入存储图像从 xcode 中您可以 void uploadImage UIImage image NSData imageData UIImageJPEGRe
如何使用 ionic 将 URL 中的图像保存到设备照片库中？

我是 ionic 的新手我正在应用程序中使用 ionic 开发应用程序当用户单击下载按钮时我需要将图像下载到用户设备我进行了很多搜索但找不到任何合适的解决方案您可以使用Transfer plugin from ionic nat
如何在 Mongoose 中检索嵌入文档中数组的最后一个对象？

我在编写查询来检索 Story 文档中嵌入的 Comments 数组的最后一个对象时遇到问题当我执行 db stories find 时我的集合当前看起来像这样 id ObjectId 55d3a39565698bbc68079e31
XMPP 聊天应用程序因使用 VoIP 服务作为后台模式而被拒绝

我已经完成了一个 XMPP 聊天应用程序其中我使用 Voip 服务来获取 Voip 密钥以便在我在后台时接收聊天消息功能一切正常但应用程序商店拒绝该应用程序响应如下 2 16 多任务应用程序只能将后台服务用于其预期目的 VoIP
iPad 上模态视图上显示不需要的 SplitView

在 iPad 上测试我的第一个 SwiftUI 应用程序时我发现从 ContentView 显示的模态视图在 iPad 上显示为拆分视图主侧的 UI 被截断详细信息侧为空我确实在这里检查了两篇文章不需要的分割视图 and UISp
读取csv文件c#

有没有办法将 csv 文件读入矩阵这样文件中的每个方块都将是矩阵中的一个单元格有许多开源 CSV 阅读器而且编写自己的代码也很容易首先请访问 codeplex com http kbcsv codeplex com 或者Codepr
使用 D3.js 对折线图中的线条进行动画处理

我有我的折线图有 2 条线绘制折线图的数据是从 csv 文件中提取的谁能解释一下我如何从一个空图表开始当我单击一个按钮时我的线条在图表上有动画效果吗提前致谢 var Button d3 select button var mar
我无法在 R 中安装软件包

当我尝试在 Rstudio 中安装任何软件包时我收到以下错误消息 Error in install packages path 1 C Users javad Documents Rhistory win library 3 2 The
处理来自 api 调用的文件下载

在反应中我正在根据 John Culviner 中提到的解决方案测试我的文件下载这个帖子 axios post api downloadMyFile data then response gt const url window URL c
jQuery.datepicker.formatDate 和时区偏移

为了处理日期我使用 jQuery UIpublic我的应用程序中的方法 jQuery datepicker formatDate 请参阅此处的参数和来源 https github com jquery jquery ui blob mas
在 ASP.NET MVC 5 中将整个对象从视图传递到控制器

有没有办法将整个对象从 ASP NET MVC 5 视图传递到控制器这是我的情况我有一个显示数据库表中所有行的视图视图的模型是 IEnumerable 每行数据后面都有一个链接可通往支架式 UPDATE 视图有没有办法将整个对象传
C#/IRS ACA - 使用 WCF 4.5 发送带有 MTOM 附件和 GZip 编码的 Web 服务请求

我们正在尝试通过公开的 Web 服务将数据发送到 IRS 以进行 ACA 数据传输但由于安全标头中时间戳和签名元素的顺序我们无法使 WSE 3 0 方法发挥作用当 TimeStamp 元素出现在 Signature 元素之前时 IRS
Windows 上的 Pyusb - 没有可用的后端

我正在尝试通过 USB 将我的 Python 应用程序接口与 NFC 设备连接最好的选择似乎是PyUSB 但我无法让它连接到 libusb 后端我不断得到 ValueError 没有可用的后端我查看了堆栈跟踪发现usb backen
具有多次重复的 scikit-learn GridSearchCV

我正在尝试为 SVR 模型获取最佳参数集我想使用GridSearchCV超过不同的值C 然而从之前的测试中我注意到训练测试集的划分极大地影响了整体性能在本例中为 r2 为了解决这个问题我想实现重复的 5 倍交叉验证 10 x 5
C# 中的 CS0649 错误

代码中存在一个我找不到的错误某些变量根本无法工作我收到的警告 CS0649 字段 Calculations A 从未分配并且始终具有默认值 0 ABC Formule path Calculations cs CS0649 字段 Ca
Ruby 哈希值总和

我有一个哈希数组 players id gt 1 name gt Alda dice count gt 5 hand gt 6 5 2 4 3 id gt 2 name gt Gonzalo dice count gt 5 hand gt
Directdraw：旋转视频流

Problem Windows Mobile Directdraw 旋转视频流视频预览正在工作我现在需要的只是旋转图像的方法我认为处理这个问题的唯一方法是编写一个基于的自定义过滤器CTransformFilter这将为您旋转相机图像
Linux 找不到动态链接的应用程序

我有一个运行 Linux Kernel 3 10 和 Busybox 的嵌入式系统如果我交叉编译由 bu ildroot 构建工具链因此使用 uclibc 一个没有 static 标志的程序它不会运行 bin sh hellowor
频繁登录和退出后 Google 登录失败

我最初可以多次使用 Google 帐户登录我的应用程序一切安好但如果我在一两分钟内签入和签出大约 20 次 Google 登录失败并重新登录onActivityResult函数返回错误代码12501 resultCode 0 我使用的
svm scikit learn 中的类权重 = none 和 auto 之间有什么区别

在 scikit learn svm 分类器中 class weight None 和 class weight Auto 之间有什么区别从文档中它给出为将类 i 的参数 C 设置为 SVC 的 class weight i C 如果没

svm scikit learn 中的类权重 = none 和 auto 之间有什么区别

svm scikit learn 中的类权重 = none 和 auto 之间有什么区别 的相关文章

随机推荐

热门标签

svm scikit learn 中的类权重 = none 和 auto 之间有什么区别的相关文章