Caffe Sigmoid交叉熵损失层损失函数

2023-12-19

我正在查看Caffe的代码Sigmoid 交叉熵损失层 https://github.com/BVLC/caffe/blob/master/src/caffe/layers/sigmoid_cross_entropy_loss_layer.cpp和docs http://caffe.berkeleyvision.org/doxygen/classcaffe_1_1SigmoidCrossEntropyLossLayer.html#details我有点困惑。文档将损失函数列为 logit 损失（我会在这里复制它，但如果没有 Latex，该公式将很难阅读。查看文档链接，它位于最顶部）。

然而，代码本身（Forward_cpu(...)) 显示了不同的公式

Dtype loss = 0;
for (int i = 0; i < count; ++i) {
    loss -= input_data[i] * (target[i] - (input_data[i] >= 0)) -
        log(1 + exp(input_data[i] - 2 * input_data[i] * (input_data[i] >= 0)));
}
top[0]->mutable_cpu_data()[0] = loss / num;

是因为这考虑了 sigmoid 函数已经应用于输入吗？

然而，即便如此，(input_data[i] >= 0)片段也让我感到困惑。这些似乎代替了文档中损失公式中的 p_hat，它应该是由 sigmoid 函数压缩的预测。那么为什么他们只采用二进制阈值呢？由于此损失预测 [0,1] 输出，因此变得更加混乱，因此(input_data[i] >= 0)将是一个1除非 100% 确定不是。

有人可以向我解释一下吗？

The SigmoidCrossEntropycaffe 中的层结合了 2 个步骤（Sigmoid + CrossEntropy）将执行input_data到一段代码中：

Dtype loss = 0;
for (int i = 0; i < count; ++i) {
    loss -= input_data[i] * (target[i] - (input_data[i] >= 0)) -
        log(1 + exp(input_data[i] - 2 * input_data[i] * (input_data[i] >= 0)));
}
top[0]->mutable_cpu_data()[0] = loss / num;

事实上，无论是否input_data >= 0无论是否，上面的代码在数学上总是等价于下面的代码：

Dtype loss = 0;
for (int i = 0; i < count; ++i) {
    loss -= input_data[i] * (target[i] - 1) -
        log(1 + exp(-input_data[i]);
}
top[0]->mutable_cpu_data()[0] = loss / num;

，此代码基于应用后的简单数学公式Sigmoid and CrossEntropy on input_data并进行一些数学组合。

但是第一段代码（caffe使用）具有更高的数值稳定性，并且溢出的风险更小，因为它避免了计算大的exp(input_data)(or exp(-input_data)）当绝对值input_data太大了。这就是您在 caffe 中看到该代码的原因。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Caffe Sigmoid交叉熵损失层损失函数的相关文章

将 C++ 代码（本机客户端）移植到浏览器（Web 应用程序）

我有一个使用 Qt creator SDK 编写的 C 模块我想将此代码移植到任何网页上运行而不会对最终用户损害源代码用户应该能够在任何浏览器 Chrome Firefox Safari Explorer 上看到此模块的输出而无需安
C++，多语言/本地化支持

向 C 程序添加多语言支持的最佳方法是什么如果可能应该从包含键值对 WelcomeMessage Hello s 之类的纯文本文件中读取语言我想到了添加一个 localizedString key 函数来返回加载的语言文件的字符串有
氧图。如何将轴旁边的值格式从 1000 更改为 1k

我正在尝试更改轴旁边的值的格式例如从 1000 更改为 1k 或 1000000 更改为 1M 这在 LinearAxis 中可能吗这是我的代码 m Axes Add new LinearAxis Position AxisPositi
OpenGL，如何独立旋转对象？

到目前为止我的代码 void display void glClear GL COLOR BUFFER BIT GL DEPTH BUFFER BIT Clear Screen And Depth Buffer glLoadIdentity
找不到 HttpContextBase 命名空间

public string GetCartId HttpContextBase context if context Session CartSessionKey null if string IsNullOrWhiteSpace cont
stl 集的 C# 等效项是什么？

我想使用 C 将一些值存储在平衡二叉搜索树中我查看了泛型命名空间中的集合但没有找到与 stl 集合等效的集合我可以使用什么通用集合我不想存储键值对只是值你可以使用HashSet http msdn microsoft com
.NET Core 2 - 从启动中调用存储库方法[重复]

这个问题在这里已经有答案了我有以下存储库和类 public interface IValueService GetAll public class ValueService IValueService private DataContex
泛型类上的 DebuggerDisplay

我在应用时遇到问题DebuggerDisplay泛型类的属性 DebuggerDisplay foo class Foo DebuggerDisplay Bar t class Bar
如何在C中递归地找到另一个字符串中的字符串位置？

我们有一个任务来创建带有两个字符串参数的递归函数原型应该是这样的 int instring char word char sentence 如果我们愿意调用函数 instring Word Another Word 它应该具有以下返回值
模板“内联”函数的静态局部变量[重复]

这个问题在这里已经有答案了 static的局部变量inline如果我的理解是正确的 C 中的函数保证像单个全局变量一样存在如果inline函数是一个模板编译器可以在哪里生成该函数的多个版本下面这篇文章应该很好地回答你的问题 http
具有多重继承的不明确基数

我正在尝试在一个大库中编写一些类的子类我收到基础不明确错误这是该问题的一个可编译示例 include
Bool类型返回规则

我使用 dapper ORM 所以我使用两个规则Query
访问结构向量

我有一个结构 struct OutputStore int myINT string mySTRING 如果我创建一个 OutputStore 类型的数组如下所示 OutputStore OutputFileData new Output
为什么 C++ 元组如此奇怪？

我通常创建自定义structs将不同类型的值分组在一起时这通常很好而且我个人发现命名成员访问更容易阅读但我想创建一个更通用的 API 在其他语言中广泛使用元组后我想返回类型的值std tuple但发现它们在 C 中使用比在其他语言中
如何将此 Boost ASIO 示例应用到我的应用程序中

我已经阅读了很多 ASIO 示例但我仍然对如何在我的应用程序中使用它们感到困惑基本上我的服务器端需要接受超过100个连接客户端这部分是通过使用线程池通常每个CPU核心2 4个线程来完成的为简单起见我们假设只有一个连接为了
仅最后一个用户控件显示内容控件

我有一个奇怪的问题我创建了一个带有标签和画布的用户控件画布引用资源但画布仅显示在我的堆栈面板中的最后一个控件上这是我的窗户
在 C++17 中编译具有非固定基础类型的 constexpr 从 int 静态转换为作用域枚举的未定义行为

我想知道以下内容是否应该在 C 17 中编译 enum class E A B constexpr E x static cast
定义一个断言，即使定义了 NDEBUG，该断言也有效

我想定义一个assert与标准相同的宏assert 3 http man7 org linux man pages man3 assert 3 html调用但它不会被预处理器删除NDEBUG被定义为这样的呼唤让我们称之为assert2
在运行时将项目添加到 ToolStrip

您好我有一个带有收藏夹菜单的 ToolStripMenu 我想在运行时在 WinForms 应用程序中添加子项目我有一个 datagridview 右键单击它会显示一个包含添加到收藏夹选项的上下文菜单当该事件被触发时我想使用
在 Visual Studio C++ 资源编辑器中导入 png 文件

我希望能够在 Visual Studio 资源编辑器中导入 png 文件以便能够在不同的其他项目中使用嵌入的资源有解决办法吗我知道它适用于位图但我对 png 感兴趣因为即使在较低格式 16x16 或 32x32 上也可以使用透明

随机推荐

如何正确并行化嵌套 for 循环

我正在使用 OpenMP 并行化标量嵌套 for 循环 double P N N double x 0 0 y 0 0 for int i 0 i
检索手机号码和IMEI

我想找回自己的手机号码和IMEI 如何从 Android 手机获取此信息 use TelephonyManager tm TelephonyManager getSystemService Context TELEPHONY SERVICE
Spring MVC 中的模拟服务

我在 Spring MVC 中模拟服务时遇到问题 Controller public class CompanyController Autowired private CompanyService companyService Autow
如何禁用 Opera 中的登录/密码突出显示？

当用户确认保存密码提示时 Opera 始终以橙色突出显示登录密码输入它不适合我的设计有什么 CSS 方法可以改变禁用它吗 Edit如果不通过CSS 还有其他解决方案吗无法使用 CSS 禁用此功能这是浏览器功能尝试不同的边框
Google 云平台 - 计算引擎/App 引擎 - SSL/HTTPS

目标使我的谷歌云应用程序 SSL 使用预构建的解决方案在谷歌的计算引擎上启动一个实例我需要上传 ssl 证书才能接受信用卡并且或多或少可以做任何事情我找不到用户界面或任何使用计算引擎对我的应用程序域进行 ssl 的方法谷歌的应用
Eclipse 使用 EGit，很难看到 git-blame 信息

使用 Eclipse Indigo Service Release 2 EGit 插件和 JDK 1 7 我已经看到它应该支持责备注释但我无法让它像我看到的那样显示在 Eclipse Wiki 上 http wiki eclipse or
在 ngFor Angular 2 中设置输入类型复选框的选中状态

我有一个 Angular 2 应用程序我使用 ngFor 来处理一堆复选框当我初始化这个组件时我需要根据天气设置复选框的状态 id 存在于数组中 div class col md 12 div class col lg 12 opti
延迟加载DLL

为简单起见我将 DLL TUTORIAL dll 和头文件 MathFuncsDll h 放在根文件夹 C 中然后创建空项目设置配置属性 gt 链接器 gt 输入 gt 延迟加载Dll s to C DLL TUTORIAL dl
pace.js“隐藏除 PACE 之外的所有内容，直到页面完全加载”本地副本

我能够隐藏除速度之外的所有内容直到安装时加载页面pace js 与 eager io https eager io app kYKTiQjoVjQk install 但是当使用 Bower 安装插件并下载 css 主题时我无法弄清楚如
Bash 脚本根据另一个文件中指定的日期从日志文件中提取条目？

我有一个相当大的逗号分隔 CSV 日志文件 gt 50000 行我们称之为 file1 csv 看起来像这样 field1 field2 MM DD YY HH MM SS field4 field5 field1 field2 07 2
将字节数组作为 char* 从 C# 传递到 C++ DLL

我正在通过一个byte 从 C 到 C DLL 在 C DLL 中我需要调用一个接受和读取的函数istream对象我打算收到byte 从 C 为char 并将其转换为istream C DLL extern C declspec dll
和 ${param} 之间有什么区别

在 struts 中我注意到有两种不同的方式来访问变量我很好奇它们之间有什么区别以及何时正确使用它们例如假设我们像这样设置变量高度
如何将按钮的文本左对齐？

现在我想用代码将按钮的文本左对齐该怎么做我编码如下 button titleLabel textAlignment UITextAlignmentLeft 但它不起作用你必须使用contentVerticalAlignment and
.gitattributes：text=auto 是否仍然使用 core.autocrlf 来检测 EOL

With a gitattributes entry text auto 签出文本文件时使用什么行分隔符这文档 https git scm com docs gitattributes gitattributes Settostringv
Eclipse 高亮显示出现次数，右列标记颜色

类似但又不同这个问题 https stackoverflow com questions 671219 eclipse coloring what is the pref item for background color of all
未找到内部存储上的 Android 文件

我正在尝试在我的应用程序的 Android 内部存储空间中写入一个文件经过多次尝试终于用这个方法成功了在 Android 手机的内存中写入读取文件 https stackoverflow com questions 9306155 w
我是否需要关闭和/或处置通过OperationContext.Current.GetCallbackChannel 获取的回调通道？

我正在使用 OperationContext Current GetCallbackChannel 获取调用 WCF 服务操作的客户端的通道我是否需要担心关闭处置这些回调通道或者这是由框架处理的好吧我自己尝试了一下结果发现如果
JavaFx：使用列名称将 TableView 导出到 Excel

我正在尝试导出tableView擅长使用阿帕奇兴趣点 http poi apache org 一切都很好但我需要导出所有表而不仅仅是项目我的意思是当我使用此代码时使用列名称 HSSFWorkbook workbook new HSSFW
使用 vuejs 中的方法进行条件 @click

这是我的 for 循环 li a href crumb name a li click methodName 不应在最后一次迭代中可用我可以使用 index breadcrumbs length 1 检查最后一次迭代使用 apply v
Caffe Sigmoid交叉熵损失层损失函数

我正在查看Caffe的代码Sigmoid 交叉熵损失层 https github com BVLC caffe blob master src caffe layers sigmoid cross entropy loss layer cp

Caffe Sigmoid交叉熵损失层损失函数

Caffe Sigmoid交叉熵损失层损失函数 的相关文章

随机推荐

热门标签

Caffe Sigmoid交叉熵损失层损失函数的相关文章