为什么不使用均方误差来解决分类问题？

2024-05-15

我正在尝试使用 LSTM 解决一个简单的二元分类问题。我正在尝试找出网络的正确损失函数。问题是，当我使用二元交叉熵作为损失函数时，与使用均方误差（MSE）函数相比，训练和测试的损失值相对较高。

经过研究，我发现二元交叉熵应该用于分类问题，MSE 应该用于回归问题。然而，就我而言，通过 MSE 进行二元分类，我获得了更好的精度和更小的损失值。

我不确定如何证明这些结果的合理性。为什么不使用均方误差来解决分类问题？

我想用一个例子来展示它。假设有一个 6 类分类问题。

认为，真实概率 = [1, 0, 0, 0, 0, 0]

Case 1:预测概率 = [0.2, 0.16, 0.16, 0.16, 0.16, 0.16]

Case 2:预测概率 = [0.4, 0.5, 0.1, 0, 0, 0]

案例 1 和案例 2 中的 MSE 为0.128 and 0.1033分别。

尽管情况 1 正确预测了实例的类别 1，但情况 1 中的损失高于情况 2 中的损失。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Keras

LSTM

crossentropy

meansquareerror

为什么不使用均方误差来解决分类问题？的相关文章

Python 中的字节数组

如何在 Python 中表示字节数组如 Java 中的 byte 我需要用 gevent 通过网络发送它 byte key 0x13 0x00 0x00 0x00 0x08 0x00 在Python 3中我们使用bytes对象也称为s
如何将base64字符串直接解码为二进制音频格式

音频文件通过 API 发送给我们该文件是 Base64 编码的 PCM 格式我需要将其转换为 PCM 然后再转换为 WAV 进行处理我能够使用以下代码解码 gt 保存到 pcm gt 从 pcm 读取 gt 保存为 wav decod
xlrd.biffh.XLRDError：Excel xlsx 文件；不支持[重复]

这个问题在这里已经有答案了我正在尝试使用读取启用宏的 Excel 工作表pandas read excel与 xlrd 库它在本地运行良好但是当我尝试将其推送到 PCF 时我收到此错误 2020 12 11T21 09 53 441
Flask+Nginx+uWSGI：导入错误：没有名为站点的模块

我安装为http www reinbach com uwsgi nginx flask virtualenv mac os x html http www reinbach com uwsgi nginx flask virtualenv
切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
JavaScript 相当于 Python 的参数化 string.format() 函数

这是 Python 示例 gt gt gt Coordinates latitude longitude format latitude 37 24N longitude 115 81W Coordinates 37 24N 115 81W
从Python中的字符串中提取货币金额

我正在制作一个程序从字符串中获取货币并将其转换为其他货币例如如果字符串是 the car cost me 13 250 我需要得到 and 13250 我已经有了这个正则表达式 1 确实如此但是该字符串很有可能有多个价格并且全部使
Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
了解 Python 中的酸洗

我最近接到一项作业需要以腌制形式放置一本字典其中每个键引用一个列表唯一的问题是我不知道腌制形式是什么谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法用于序列化和反序列化 Pyth
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如

随机推荐

如何在Matlab中绘制网络？

我有一个矩阵AMatlab中的维数mx2每行包含两个节点的标签显示网络中的直接链接例如如果网络有4矩阵的节点A可能A 1 2 1 3 2 1 2 4 3 2 4 1 4 2 其中第一行表示有一个链接来自1 to 2 第二行表示有一个链
控制 argparse 帮助参数列表的格式？

import argparse parser argparse ArgumentParser prog tool args u upf ref upf dict required True s skew ref skew m model r
如何在 dynamodb 上获得十亿个对象的不同计数？

获取我的 dynamodb 中存储的不同对象数量的最有效方法是什么例如我的对象有 10 个属性我想根据 3 个属性获得不同的计数如果您需要计数器最好使用 AtomicCounters http docs aws amazon com
绝对定位的表头 (th) - 哪个浏览器是错误的？

这个带有一个绝对定位列的简单表格在 Firefox 和 IE 中的呈现方式与在 Chrome 和其他基于 Webkit 的浏览器中的呈现方式不同 http jsfiddle net WZ6x8 http jsfiddle net WZ6x
skView.ignoreSiblingOrder 在 swift 中的重要性/效率？

这样做有多重要高效skView ignoreSiblingOrder true初始化场景时现在我将其设置为 true 但由于某种原因当我从 MainMenu 场景启动 GameScene 时它会在我的角色之前加载背景即使背景的
pip.main 安装失败，“模块”对象没有属性“main”

我正在尝试从 python 脚本中安装一些 python 包并且我正在使用pip main install 为了那个原因下面是代码片段 try import requests except import pip pip main ins
如何使网页中出现的图标闪烁/闪烁

几天前我开始研究高级java 我知道太晚了我被困在使图标出现在任务栏上闪烁的特定任务上这种闪烁应该根据特定条件发生这意味着可以使用以下方法来实现javascript 我已经搜索了一段时间了但是有没有办法让图标每隔 1 秒左右出现
任何插件安装失败 - 无法复制文件错误

每次我安装一个新的 WordPress 插件时它都会说无法复制文件和文件地址有谁知道为什么会这样我遇到了同样的问题但就我而言我是使用 FTP 进行更新我通过将主机名设置为 localhost 而不是使用 IP 来修复此问题这是
Docker：处理 tar 文件时出错（退出状态 1）：设置枢轴目录时出错：不是目录

我是 Docker 新手不知道是什么原因导致此错误或如何诊断它任何有关此问题的具体帮助或有关首先检查何处以诊断此类问题的提示将不胜感激我的 Dockerfile FROM java 8 Install maven RUN apt ge
C# 如何暂停程序并等待 WinForm 中的键盘输入

我有一个 C 2008 Winform 应用程序我正处于循环之中我正在向用户显示一个日期我希望他们告诉我这个日期是星期几例如显示6 22 2010 用户需要按t 我所困惑的是如何暂停我的应用程序并等待键盘输入我只想回复 Esc m
实体框架 4 - 在持久性未知上下文中使用 CTP5（代码优先）映射非公共属性

我知道这个问题已经有了解决方案例如这个问题 https stackoverflow com questions 3577891 entity framework ctp4 code first mapping protected prop
CSS 中的边框图像开头

MDN 是这样定义的边框图像开始 https developer mozilla org en docs Web CSS border image outset border image outset 属性描述了边框的数量图像区域超出边框
presentRenderbuffer ：GL_RENDERBUFFER_OES 需要很长时间

我在游戏中添加了一个分析器并隔离了此功能有时它会导致 FPS 下降这是我的结果 Present buffer time 22 Present buffer time 1 Present buffer time 9 Present bu
使用 Angularjs 中的指令创建 ajax 加载微调器

我正在尝试创建一个简单的加载程序以下是我到目前为止所做的事情有人可以看一下并让我知道我哪里出错了吗出现CSS样式loading style 2没有被添加我的 DOM 只显示 span class span 我的指令 angular
Java 8：并行 FOR 循环

我听说 Java 8 提供了很多关于并发计算的实用程序因此我想知道并行给定 for 循环的最简单方法是什么 public static void main String args Set
gitlab 中的自动发行说明[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案任何人都可以帮助我在 git lab 中自动生成发行说明有什么方法可以执行此操作请告诉我谢谢您可以使用 API 列出里程碑中的
ActionBarActivity 和 ActivityUnitTest - NameNotFoundException

好吧这更有可能是我的错当我做 public class XmlLifecycleTests extends ActivityUnitTestCase
这个奇怪的泽西警告是什么意思？

这个警告在 Jersey 1 4 中意味着什么 WARNING A sub resource method public final java lang String com XXX render with URI template is
将数据集导出到一个 Excel 文件的多个 Excel 工作表中

我需要在同一工作簿的两个 Excel 工作表中导出两个数据集的值我的查询是这样的数据集一 DataSet ds1 new DataSet SqlCommand commandOpen new SqlCommand storedproc1
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS

为什么不使用均方误差来解决分类问题？

为什么不使用均方误差来解决分类问题？ 的相关文章

随机推荐

热门标签

为什么不使用均方误差来解决分类问题？的相关文章