三元组损失的softmax版本的梯度计算

2023-12-11

我一直在尝试在Caffe中实现softmax版本的三元组损失，描述于
霍弗和艾隆，使用三元组网络进行深度度量学习, ICLR 2015.

我已经尝试过这个，但我发现很难计算梯度，因为指数中的 L2 不是平方的。

有人可以帮我吗？

使用现有的 caffe 层实现 L2 规范可以节省您的所有精力。

这是一种计算方法||x1-x2||_2在咖啡厅中的“底部”x1 and x2（假设x1 and x2 are B-by-C斑点、计算B规范C尺寸差异）

layer {
  name: "x1-x2"
  type: "Eltwise"
  bottom: "x1"
  bottom: "x1"
  top: "x1-x2"
  eltwise_param { 
    operation: SUM
    coeff: 1 coeff: -1
  }
}
layer {
  name: "sqr_norm"
  type: "Reduction"
  bottom: "x1-x2"
  top: "sqr_norm"
  reduction_param { operation: SUMSQ axis: 1 }
}
layer {
  name: "sqrt"
  type: "Power"
  bottom: "sqr_norm"
  top: "sqrt"
  power_param { power: 0.5 }
}

对于论文中定义的三元组损失，您需要计算 L2 范数x-x+并为x-x-，连接这两个 blob 并将连接的 blob 提供给"Softmax" layer.
不需要肮脏的梯度计算。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

deeplearning

caffe

gradientdescent

Softmax

三元组损失的softmax版本的梯度计算的相关文章

Google Inceptionism：按类别获取图像

在著名的 Google Inceptionism 文章中 http googleresearch blogspot jp 2015 06 inceptionism going deeper into neural html http goo
现代 CNN（卷积神经网络）作为 DetectNet 旋转不变吗？

众所周知用于目标检测的 nVidia DetectNet CNN 卷积神经网络基于 Yolo DenseBox 的方法 https devblogs nvidia com parallelforall deep learning obj
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
R 神经网络在时间序列的最大步长内不收敛

我正在编写一个神经网络来预测时间序列中的元素x sin x 2 在 R 中使用neuralnet包裹这就是训练数据的生成方式假设窗口有 4 个元素最后一个元素是必须预测的元素 nntr0 lt 1 25 sin 1 25 2 nnt
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
结合两个 CNN

我想在 Keras 中将两个 CNN 合并为一个我的意思是我希望神经网络拍摄两张图像并在单独的 CNN 中处理每一张图像然后将它们连接在一起进入扁平化层并使用全连接层来做最后的工作我做了什么 Start With First Bran
帮助我在 Python 中实现反向传播

EDIT2 新的训练集 Inputs 0 0 0 0 0 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 1 0 0 0 1 0 1 0 1 0 2 0 1 0 3 0 1 0 4 0 2 0 0 0 2 0 1 0 2 0 2
如何以 HDF5 格式提供 caffe 多标签数据？

我想将 caffe 与矢量标签一起使用而不是整数我检查了一些答案似乎 HDF5 是更好的方法但后来我陷入了这样的错误 precision layer cpp 34 检查失败 outer num inner num bottom 1
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
我可以在反向传播期间（有选择地）反转 Theano 梯度吗？

我热衷于利用最近论文中提出的架构通过反向传播进行无监督域适应 http arxiv org pdf 1409 7495 pdf 在 Lasagne Theano 框架中这篇论文的有点不同寻常之处在于它包含了一个梯度反转层 invert
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
如何在 Caffe 中从头开始训练 ResNet101 模型？

我正在使用深度实验室 v2 https bitbucket org aquariusjay deeplab public ver2Caffe 版本以便进行语义分割我可以使用 imagenet 模型微调 ResNet101 但无法使用自定
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从

随机推荐

MySQL 到 PostgreSQL：如何修改此 SQL 查询？

我有这个 MySQL 查询它利用MONTH and YEAR SELECT MONTH created at AS month YEAR created at AS year FROM users GROUP BY MONTH creat
SwiftyJSON - 'inout JSON' 无法转换为 'JSON'

我面临 JSON 解析问题我不知道如何解决我需要这部分 JSON 数据 columns created at DESC id DESC 要存储在 String String 可选字典所以这是我正在使用的代码 self columns
使用python win32向excel添加注释

我正在尝试使用 win32 使用 python 添加新注释到 excel import win32com client as win32 excel win32 gencache EnsureDispatch Excel Applicati
在 JavaScript 中制作反向数组的独立副本

这是我的小提琴 http jsfiddle net sepoto Zgu9J 1 我从一个反向函数开始 function reverseArr input var ret new Array for var i input length 1
如何在IE6和7中设置CSS最大宽度？

我在我的网站中使用这个CSS代码 img max height 800px max width 600px 不幸的是它不适用于 IE 6 和 7 我该如何解决提前致谢 IE7 支持 max height 属性 http www w3sc
仅当设置了变量时才将键值对添加到数组

我将键值对添加到我的数组中如下所示 array key1 gt value1 key2 gt value2 我想添加另一个键foo 仅当变量 bar is set array key1 gt value1 key2 gt value2 f
如何在r中包含分段geom_smooth的标签？

我想标记我的geom smooth在 r 中但标签更接近实际点而不是线 Data df lt structure list t c 45 45 45 45 45 46 46 46 46 46 47 47 47 47 47 48 48 4
.net开源和运行平台选择[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我们被要求为一个大项目寻找一个完全开源的解决方案他们希望该项目尽可能接近 100 开源主要是因为它是一个社区项目未来可能没有什么可用的资金除
如何使用 C# 将 CSV 文件转换为 Parquet

我是 C 新手我想将 CSV 文件转换为 Parquet 格式我搜索了一些网站但没有得到预期的结果无论如何 C 有什么办法吗 With 辛乔 ETL 一个开源库可以将 CSV 文件转换为 Parquet 容易地安装Nuget包
powershell中定义字符串的单引号和双引号有什么区别

一直困扰我的简单问题在 powershell 中我可以像这样定义字符串 s1 Boogety boo or s2 net rocks 翻译有区别吗双引号允许变量扩展而单引号则不允许 PS C Users Administrator
文本装饰：换行在 IE 上不起作用？

我有这个 strike text decoration line through 每次我的disable 被调用它将禁用
在 Java Server Faces 中将托管属性与 CommandButton 一起使用

除了我的问题使用 Facelets 在 Java Server Faces 中创建编辑我的项目页面我想谈谈这提供的一个问题当我按下命令按钮时 ID 100 被删除并刷新页面这是Before它甚至运行该方法对吧所以这意味着当我
conda 在激活环境之外寻找库

我正在 Windows 上工作我发现 conda 创建的环境的导入行为存在差异我无法理解这里是详细信息案例一成功 base C gt conda activate
获得 C 中模 n 的最小非负留数的有效方法是什么？

有没有一种有效的方法来获得 C 中模 n 的最小非负留数其中 n 为正如果数字是非负数那么这很容易那么它只是一个 n 其中 a 是非负整数然而当 a 为负数时在 C89 中该行为似乎是实现定义的感谢 kennyTM IE
MediaWiki 会话和 cookie 无法在 CloudFlare 背后的多服务器上运行

我有一个 MediaWiki 在多个 AWS 实例上运行但登录和注册已损坏 session save path 设置为 tmp 任何人都可以写入和读取我使用 Apache2 和 PHP5 以及 MEMCACHED 每当您尝试登录时您要
使用 Linq 查询和过滤对象数组

我想这是我的一系列问题中的另一个条目但我再次陷入困境这次我在使用 JObjects 的 JArray 并确定 JArray 中每个元素的 Property Value 类型时遇到了麻烦我的代码在这里 https dotnetfidd
route('home') vs.redirect()->home()？' aria-label='何时使用：redirect('/') vs.redirect()->route('home') vs.redirect()->home()？'> 何时使用：redirect('/') vs.redirect()->route('home') vs.redirect()->home()？

当我有这个命名路线时 Route get IndexController index gt name home 然后在任意Controller的任意action方法中当我需要重定向到指定路由时home 这些语句中的任何一个都会正确重定向到
JavaScript 中的 str_shuffle() 等效项？

像str shuffle PHP中的函数是否有类似的函数在javascript中打乱字符串请帮忙不存在这样的函数你自己写一个这是一个例子 function shuffle string var parts string split
无线直连 Android

我想通过 Wi Fi Direct 在两台设备之间传输文件我想做与 WifiDirectDemo 中相同的操作但我无法将数据从组所有者传输到其他设备所以我尝试了以下操作每次其中一个设备单击连接时另一个设备就会设置为组所有者因
三元组损失的softmax版本的梯度计算

我一直在尝试在Caffe中实现softmax版本的三元组损失描述于霍弗和艾隆使用三元组网络进行深度度量学习 ICLR 2015 我已经尝试过这个但我发现很难计算梯度因为指数中的 L2 不是平方的有人可以帮我吗使用现有的 caf

三元组损失的softmax版本的梯度计算

三元组损失的softmax版本的梯度计算 的相关文章

随机推荐

热门标签

三元组损失的softmax版本的梯度计算的相关文章