分类：如果一个类的数据量是另一类的 4 倍，会发生什么？

2024-01-12

我正在尝试调试我的分类器的问题。问题在于，尽管准确率接近 80%，但它总是针对给定输入预测相同的类别。

我训练 CNN 来检测两个类别之间的差异。 A 类有 2575 个 jpeg，B 类有 665 个 jpeg。

这是否会导致我的 CNN 始终预测同一类别的问题？每个类别中的项目数量是否太不平衡？一般来说，如果我使两个类的大小相同（665 jpeg？），我的性能会提高吗？

这个问题似乎是类不平衡的情况，有不同的方法来处理它：

加权损失：您可以通过计算a来惩罚多数损失函数的奖励加权交叉熵 https://stackoverflow.com/questions/35155655/loss-function-for-class-imbalanced-binary-classifier-in-tensor-flow.
重新采样数据：正如您所提到的，您还可以对多数类别进行下采样，以平衡类别。您还可以对少数类别进行上采样以使其均匀。
生成增强数据：由于您正在处理图像，因此您可以对少数类进行上采样，然后使用data augmentation在这些图像上，这解决了类不平衡问题，并解决了过度拟合问题并提高了泛化能力。
以及以上所有内容的组合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

machinelearning

tensorflow

Keras

分类：如果一个类的数据量是另一类的 4 倍，会发生什么？的相关文章

如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
Python getstatusoutput 替换不返回完整输出

我发现了这个很棒的替代品getstatusoutput Python 2 中的函数在 Unix 和 Windows 上同样有效不过我觉得这个方法有问题output被构建它只返回输出的最后一行但我不明白为什么任何帮助都是极好的 def
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
Docker 中的 Python 日志记录

我正在 Ubuntu Web 服务器上的 Docker 容器中测试运行 python 脚本我正在尝试查找由 Python Logger 模块生成的日志文件下面是我的Python脚本 import time import logging
在 Sphinx 文档中*仅*显示文档字符串？

Sphinx有一个功能叫做automethod从方法的文档字符串中提取文档并将其嵌入到文档中但它不仅嵌入了文档字符串还嵌入了方法签名名称参数我如何嵌入only文档字符串不包括方法签名 ref http www sphinx do
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

访问列表视图中的自定义对象

我目前正在构建一个应用程序该应用程序将请求发送到网络然后解析结果并将其放入对象的 ArrayList 中然后该列表将填充 ListView 我想创建一个onClickListener这将使我知道单击了哪个对象但我找不到实现此目的的
如何访问 Sharepoint 2007/2010/2013 _layouts 文件夹

我正在尝试在该位置插入一些数据 mysiteurl layouts 因为我必须使用第三方软件该软件使用该文件夹中存储的数据我是机器的管理员 Windows Server 2008R2 上的 Sharepoint 2010 但 Share
ActiveMQ - 通过命令行删除/清除所有队列

有没有办法通过命令行 win linux 删除清除ActiveMQ中的所有队列我只能找到特定队列的命令或者也许有办法通过 activeMQ 管理员来做到这一点同样我只找到了如何一一删除清除队列这可能非常乏味 Thanks 你可
gitlab.com SSH 连接超时

我尝试让 Gitlab 与 SSH 一起工作但不行我已完成以下步骤 1 生成ssh密钥 ssh keygen t rsa C email protected cdn cgi l email protection b 4096 2 在文件
WPF DataGrid 虚拟化无法正常工作？

我有一个 DataGrid 其中有一个 DataTable 设置为其 ItemsSource DataTable 包含 24 列和约 1600 行实际上我稍后必须加载更多行但目前这已经够麻烦的了尽管将列和行的虚拟化设置为活动状态 Da
使用 libwebsockets 编译 libuv

我正在尝试运行与 LWS 库一起安装的 libwebsockets test server 但它不会运行因为 lwsts 31616 libuv support not generated in 我检查过 libuv 已安装 1 8 0
可以在 Try/Except 中重试/循环吗？

我试图了解是否可以在 Try Except 调用内部设置循环或者是否需要重构以使用函数长话短说在花了几个小时学习 Python 和 BeautifulSoup 后我设法将一些代码组合在一起来抓取 URL 列表将数据提取到 CSV
向元组添加元素的有效方法

我想向元组添加元素我找到了两种方法 This https stackoverflow com a 16730367 3337089 and this https stackoverflow com a 1380875 3337089答案说
在 Numpy 中生成对称矩阵

我正在尝试在 numpy 中生成对称矩阵具体来说这些矩阵具有随机位置的条目并且每个条目中的内容可以是随机的沿着主对角线我们不关心其中有哪些条目因此我也将它们随机化我采取的方法是首先生成一个 nxn 全零矩阵然后简单地循环矩阵
正则表达式在引号外的特定字符上分割字符串

如何在保留带引号的字符串的同时分割这一行 gt div a more style ui url in tray value 分割的字符在哪里 gt 产生 gt div a more style ui url in tray value 目前
识别哪个文件包含某些特定的头文件

有时对于复杂的标头结构可能会包含一些标头但很难分辨出来自哪里是否有某种工具依赖项查看器或一种方法如何查找包含堆栈哪个源哪个标头哪个标头包含一个特定的头文件如果头文件被多次包含找到第一个包含就足够了找到所有包含是一
我可以在嵌入式交互式 Python 控制台中使用 IPython 吗？

我使用以下代码片段将其放入 Python shell 程序中这工作正常但我只得到标准控制台有没有办法做同样的事情但使用IPython http ipython scipy org shell import code class Emb
虚拟Qt信号？

在查看一些 Qt C 代码时我遇到了这个 class Foo Q OBJECT signals virtual void someSignal const QString str int n Q UNUSED str Q UNUSED n
HTTP 基本身份验证和 Atlassian JIRA、Confluence 和 Bitbucket

我在 Apache 反向代理后面的服务器上部署了 JIRA Confluence 和 Bitbucket 他们中的每一个都通过应用程序链接与其他人连接现在我想通过在此之前实现 HTTP 基本身份验证来添加额外的保护层当我这样做时我会
如何将任意数量的值绑定到 mysqli 中的准备好的语句？ [复制]

这个问题在这里已经有答案了我真的希望有人花一点时间来检查我的代码我正在解析一些新闻内容我可以将初始解析插入到我的数据库中其中包含新闻 URL 和标题我想进一步扩展它传递每个文章链接并解析文章的内容并将其包含在我的数据库中最初的
MongoDB嵌套数组交集查询

并提前感谢您的帮助我有一个 mongoDB 数据库其结构如下 id objectID userID id movies movieID movieID rating rating 我的问题是我想搜索具有 userID 3 的特定用户
此应用暂时禁用使用 Google 登录的功能

当我们尝试向 Google 进行身份验证时我们会看到以下屏幕我们尝试验证的应用程序用于内部开发我们没有将其发布给我们的用户知道为什么会发生这种情况吗我们之前遇到过未经验证的应用程序屏幕如下所示但现在身份验证被禁用 OAut
NodeJS 无法读取 ubuntu 中的默认 CA

在我们的测试环境中我们使用我们公司签名的 SSL 连接到另一台服务器每次建立连接时 nodejs 都会抛出异常UNABLE TO VERIFY LEAF SIGNATURE 我通过设置找到了解决方法拒绝未经授权 false 但这不适用于
当没有更多引用时，如何从缓存中删除智能指针？

我一直在尝试使用智能指针来升级现有的应用程序并且我正在尝试克服一个难题在我的应用程序中我有一个对象缓存例如我们称它们为书籍现在书籍的缓存是通过 ID 请求的如果它们在缓存中则返回它们如果不在缓存中则从外部系统请求对象
分类：如果一个类的数据量是另一类的 4 倍，会发生什么？

我正在尝试调试我的分类器的问题问题在于尽管准确率接近 80 但它总是针对给定输入预测相同的类别我训练 CNN 来检测两个类别之间的差异 A 类有 2575 个 jpeg B 类有 665 个 jpeg 这是否会导致我的 CNN 始终预

分类：如果一个类的数据量是另一类的 4 倍，会发生什么？

分类：如果一个类的数据量是另一类的 4 倍，会发生什么？ 的相关文章

随机推荐

热门标签

分类：如果一个类的数据量是另一类的 4 倍，会发生什么？的相关文章