多类分类中负例的经验法则

2023-11-29

在多类分类任务中，对于表示“其他所有内容”的标签，样本数量应该有多大，是否有一个经验法则？

示例：我想将我的输入分类为以下之一X类。这X + 1当输入为“以上都不是”时，类将激活。假设我的数据集包含 10 个“正”类别中每个类别的 5,000 个样本。对于代表“未知”类的示例，我将使用可能在生产中找到的多个实际示例，但这些示例并非来自其他类。

相对于其他分布，这些负面例子的数量应该有多大？

这可能有点偏离主题，但无论如何，我认为没有通用的经验法则，这取决于您的问题和方法。

我会考虑以下因素：

数据的性质。这有点抽象，但您可以问问自己是否希望“其他所有”类中的示例很容易与实际类混淆。例如，如果您想在动物的一般图像中检测狗或猫，可能还有许多其他动物（例如狐狸）可能会混淆系统，但如果您的输入只有狗、猫或家具的图像，则可能不是这样很多。然而，这只是一种直觉，在其他问题中可能并不那么清楚。
你的模特。例如，在这是我对相关问题的回答我提到了一种在其余类的函数中对“其他所有内容”进行建模的方法，因此您可能会认为，如果输入不太相似（上一点），即使没有“其他所有内容”的示例，它也可能会起作用，因为没有其他类被触发。其他技巧，例如为每个类别赋予不同的训练“权重”（例如，根据每个类别的实例数量进行计算），可以补偿不平衡的数据集。
你的目标。显然，您希望您的系统是完美的，但您可能会考虑是否愿意出现误报或漏报（例如，错过狗的图像或在没有狗的情况下说有狗是否更糟糕）。如果您预计您的输入主要由“其他所有内容”的实例组成，那么您的模型偏向于该类可能是有道理的，或者可能正是因为这个原因，您希望确保不会丢弃任何可能有趣的样本。

不幸的是，判断你是否做得好的唯一好方法是在代表性测试数据集上进行实验并获得良好的指标（混淆矩阵、每类精度/召回率等）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

machinelearning

Dataset

多类分类中负例的经验法则的相关文章

为什么应该或不应该将数据集、数据表等存储为 ASP.NET 页面中的会话变量？

我正在开发一个使用 Web 服务返回的数据集的 Web 应用程序当应用程序运行时我将该数据集存储为会话变量以便在用户导航到将编辑数据集中的表的不同页面时反复使用这个想法是当应用程序加载时用户只需要等待一次数据然后应用程序将使用
为什么分割任务使用 Dice Coefficient 而不是 IOU？

我见过人们使用IOU作为衡量标准detection任务和Dice Coeff for segmentation任务这两个指标在方程方面看起来非常相似只是骰子给予相交部分的权重是两倍如果我是对的那么 Dice 2 x A B A B
PyInstaller 是否包含 CUDA

我正在开发一个Python脚本我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
如何理解SpatialDropout1D以及何时使用它？

偶尔我会看到一些模型正在使用SpatialDropout1D代替Dropout 例如在词性标记神经网络中他们使用 model Sequential model add Embedding s vocabsize EMBED SIZE i
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
XGBoost 产生预测结果和概率

我可能正在文档中查看它但我想知道 XGBoost 是否有办法生成结果的预测和概率就我而言我正在尝试预测多类分类器如果我能返回Medium 88 那就太好了分类器中预测概率 88 参数 params max depth 3 ob
如何对URL进行分类？ URL 的特点是什么？如何从 URL 中选择和提取特征

我刚刚开始研究分类问题这是一个两类问题我的训练模型机器学习必须决定预测是允许 URL 还是阻止它我的问题非常具体如何对 URL 进行分类我应该使用普通的文本分析方法吗 URL 的特点是什么如何从URL中选择和提取特征我假
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
如何在arm64主机上运行amd64 docker镜像

警告请求的映像平台 linux amd64 与检测到的主机平台 linux arm64 v8 不匹配并且未请求特定平台 2021 07 28 22 25 06 349222 F tensorflow core platform cpu
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
Mobilenet 与 SSD [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
使用张量流导出神经网络的权重

我使用张量流工具编写了神经网络一切正常现在我想导出神经网络的最终权重以制定单一的预测方法我怎样才能做到这一点您需要在训练结束时使用以下命令保存模型tf train Saver https www tensorflow org ver
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
Keras 可以处理不同尺寸的输入图像吗？

Keras 可以处理不同尺寸的输入图像吗例如在全卷积神经网络中输入图像可以具有任意大小然而我们在用Keras创建网络时需要指定输入形状因此我们如何使用 Keras 来处理不同的输入尺寸而不将输入图像调整为相同的尺寸谢谢你的帮
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
使用神经网络包进行多项分类

这个问题应该很简单但文档没有帮助我正在使用 R 我必须使用neuralnet多项式分类问题的包所有示例均针对二项式或线性输出我可以使用二项式输出进行一些一对一的实现但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点其中

随机推荐

使用 RVM 安装后，Ruby 1.9.2 不断恢复到 1.8.7

我安装了 Ruby 1 9 2 我用了rvm use 1 9 2然后当我输入时ruby v它说1 9 2 然后当我退出终端并重新打开它时它再次显示 1 8 7 我究竟做错了什么您的默认 ruby 很可能未设置为 ruby 1 9 2
如何进行货物保存分析？

我怎样才能把货物运到save analysis 我知道我可以这样做rustc通过致电 rustc Zsave snalysis
Matlab，如何调整图形上的轴值（科学记数法-精度不够）[重复]

这个问题在这里已经有答案了可能的重复抑制数字刻度中的指数格式对于我的图中的每个刻度线 Matlab 将我的轴标记输出为 5 777 x10 6 是否有可能让 matlab 输出实际的十进制数字而不是科学记数法以便刻度线实际上是不同的
读取文本文件并显示在表 vbscript 中

我有一个具有以下结构的文本文件 C Users abc Desktop New Folder sample txt AccountName gt AbcPos AccountName gt dblLayer queryAccount gt
在更新插入时跳过空值

我正在使用 pg promise 来处理我的 Postgres 查询但在找到以下查询的解决方案时遇到了麻烦我正在尝试创建一种方法来一次批量插入多行这是我的代码 massUpsert orgId entities gt db tx t
如何在不重新启动的情况下关闭DEP（数据执行保护）？

我正在编写一个测试网页它调用 DLL 文件中的函数但是每次我使用IE或FF打开它之前我必须禁用DEP 数据执行保护否则脚本无法执行当前禁用 DEP 的方法需要重新启动但我不想重新启动基本上我正在寻找一种无需重新启动即可关闭 D
Google Cardboard Unity 5 没有立体视觉

我的 Cardboard 应用程序在设备上没有立体效果但它在编辑器中有效这就是它在编辑器中的样子 https i stack imgur com sN14x png 这是它在设备上的样子https i stack imgur com 7
Pod 在 Kubernetes 中启动但不工作

创建了具有 3 个 Pod 的 Kubernetes 集群部署并且全部运行良好但是当尝试运行它们时无法做到这一点尝试在描述部分中执行卷曲 Pod 的 Ip 内部我可以看到此错误 MountVolume SetUp failed fo
自动执行eclipse插件

我尝试创建一个 Eclipse 插件当 Eclipse 工作台关闭时它会删除一些文件我从Hello World command插件项目并添加了IWorkbenchListener就像本主题中提到的Eclipse 关闭钩子能够停止终止
django 对 MongoDB 的内置支持

我正在尝试查找官方 django 是否支持任何 noSQL DBMS 尤其是 MongoDB 的信息我找到了一个Django 1 3 的分支 the Django nonrel 官方 django 的一个分支和其他一些不太可靠的项目根
填充xaml矩形倍数solidcolorbrush

xaml中这种类型的填充矩形可以吗我不想使用渐变来填充矩形因为每个部分的图像使用不同的纯色画笔 Thanks 尝试这个
std::string 构造函数中的内存分配/堆损坏

我在内存分配方面再次遇到了一些麻烦但我不明白为什么当我在调试模式下运行程序时我收到以下错误消息我尝试尽可能准确地翻译它 Windows 已触发 LogoColorDetector exe 中的断点这可能是由堆损坏引起的这表明 L
代理验证失败错误

我正在尝试通过 FTP 站点代理访问 FTP 服务器以绕过防火墙it sauronsoftware ftp4j FTPClient我知道我的用户名密码是正确的因为我可以使用 FileZilla 进行连接我尝试使用Authenticat
如何编写多线程函数来同时处理不同的任务？

我想定义一个do in parallelpython 中的函数将接受带参数的函数为每个函数创建一个线程并并行执行它们该函数应该像这样工作 do in parallel sleep 3 sleep 8 sleep 3 然而我很难定义do
WPF 数字 UpDown 控件在哪里？

进入第一个严肃的 WPF 项目似乎有很多基本的控件都缺失了具体来说我正在寻找 Numeric UpDown 控件我是否错过了乐队外的发行真的不想写自己的控件我不想使用 WindowsFormHost 并在其上放置 WinForm
“mvn clean install”与“mvn install”有何不同？

有什么区别mvn clean install and mvn install clean是 Maven 中自己的构建生命周期阶段可以将其视为操作或任务 mvn clean install告诉 Maven 做clean运行之前每个模块中的阶
如何使用 JsonFormat 将 Jackson Json NULL 字符串反序列化为日期

我已经看了很多但到目前为止仍然无法得到答案非常感谢任何帮助我有一个简单的String to Date字段映射并尝试将 JSON 字符串读取到 Java 对象 JsonInclude value Include NON EMPTY Js
谷歌电子表格“查询”功能可以在谷歌应用程序脚本中使用吗？

我正在寻找一种以编程方式填充电子表格的方法该电子表格根据登录用户过滤另一个电子表格中的数据我可以使用电子表格中的查询功能来完成此操作但是无法找到从应用程序脚本调用查询函数的方法这可以做到吗将不胜感激示例代码谢谢不知道有没有限
返回之前的 JPanel

我继承了代码并且由于需要长时间解释的原因我需要使用空布局我一直在尝试利用他们在 JPanels 之间导航的内容我一直不知道怎么做这就是我现在所拥有的它被编译成下面的 SSCCE 我试图做的是将 JPanel 添加到 ArrayL
多类分类中负例的经验法则

在多类分类任务中对于表示其他所有内容的标签样本数量应该有多大是否有一个经验法则示例我想将我的输入分类为以下之一X类这X 1当输入为以上都不是时类将激活假设我的数据集包含 10 个正类别中每个类别的 5 000 个

多类分类中负例的经验法则

多类分类中负例的经验法则 的相关文章

随机推荐

热门标签

多类分类中负例的经验法则的相关文章