在 Tensorflow 中实现对比损失和三元组损失

2024-06-25

我两天前开始玩 TensorFlow，我想知道是否有三元组和对比损失的实现。

我一直在看文档 https://www.tensorflow.org/versions/r0.9/api_docs/python/nn.html#losses，但我还没有找到关于这些事情的任何示例或描述。

更新（2018/03/19）：我写了一个博客文章 https://omoindrot.github.io/triplet-loss详细介绍了如何在 TensorFlow 中实现三元组损失。

您需要自己实现对比损失或三元组损失，但是一旦您知道对或三元组，这就很容易了。

对比损失

假设您有数据对及其标签（正或负，即同一类或不同类）作为输入。例如，您有大小为 28x28x1 的图像作为输入：

left = tf.placeholder(tf.float32, [None, 28, 28, 1])
right = tf.placeholder(tf.float32, [None, 28, 28, 1])
label = tf.placeholder(tf.int32, [None, 1]). # 0 if same, 1 if different
margin = 0.2

left_output = model(left)  # shape [None, 128]
right_output = model(right)  # shape [None, 128]

d = tf.reduce_sum(tf.square(left_output - right_output), 1)
d_sqrt = tf.sqrt(d)

loss = label * tf.square(tf.maximum(0., margin - d_sqrt)) + (1 - label) * d

loss = 0.5 * tf.reduce_mean(loss)

三重态损失

与对比损失相同，但具有三元组（锚定、正、负）。这里不需要标签。

anchor_output = ...  # shape [None, 128]
positive_output = ...  # shape [None, 128]
negative_output = ...  # shape [None, 128]

d_pos = tf.reduce_sum(tf.square(anchor_output - positive_output), 1)
d_neg = tf.reduce_sum(tf.square(anchor_output - negative_output), 1)

loss = tf.maximum(0., margin + d_pos - d_neg)
loss = tf.reduce_mean(loss)

在 TensorFlow 中实现三元组损失或对比损失时真正的麻烦是如何对三元组或对进行采样。我将专注于生成三元组，因为它比生成对更难。

最简单的方法是在 Tensorflow 图之外（即在 Python 中）生成它们，并通过占位符将它们提供给网络。基本上，您一次选择 3 个图像，前两个来自同一类别，第三个来自另一个类别。然后，我们对这些三元组执行前馈，并计算三元组损失。

这里的问题是生成三元组很复杂。我们希望他们成为有效的三元组，具有正损失的三元组（否则损失为 0 并且网络不会学习）。
要知道一个三元组是否好，您需要计算它的损失，因此您已经通过网络进行了一个前馈......

显然，在 Tensorflow 中实现三元组损失很困难，并且有一些方法可以使其比在 Python 中采样更有效，但解释它们需要整篇博客文章！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

deeplearning

在 Tensorflow 中实现对比损失和三元组损失的相关文章

如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
GPU 上的张量流：尽管 cuda 的 deviceQuery 返回“PASS”结果，但没有已知设备

注这个问题最初是在github上问的 https github com tensorflow tensorflow issues 7648 issuecomment 280866214 但被要求改为在这里我在 GPU 上运行 Tenso
无法使用 tf.data.Dataset 对组件 0 中具有不同形状的张量进行批处理

我的输入管道中出现以下错误 tensorflow python framework errors impl InvalidArgumentError 不能分量 0 中具有不同形状的批量张量第一个元素有形状为 2 48 48 3 元素
辍学训练

如何对由 dropout 产生的许多薄层进行平均在测试阶段要使用哪些重量我对这个问题真的很困惑因为每个细化层都会学习一组不同的权重那么反向传播是为每个稀疏网络单独完成的吗这些细化网络之间的权重究竟是如何共享的因为在测试时仅使用一
Tensorflow Eager Execution 不适用于学习率衰减

在这里尝试让一个热切的执行模型与 LR 衰减一起工作但没有成功这似乎是一个错误因为学习率衰减张量似乎没有更新如果我遗漏了什么你可以帮我一下吗谢谢下面的代码正在学习一些词嵌入但是那学习率衰减部分根本不起作用 class Wo
Tensorflow：ValueError：形状必须具有相同的等级，但为 0 和 2

我在乘以 x1 Wo1 时遇到形状错误但我找不到原因错误 ValueError 形状必须具有相同的等级但为 0 和 2将形状 0 与其他形状合并对于 add 2 x 操作 Pack 输入形状 20 1 import tensorfl
如何在对象检测 API 中同时训练和评估？

我想同时在我自己的数据集上训练评估 ssd mobilenet v1 cocoObject Detection API 然而当我尝试这样做时我面临着 GPU 内存几乎已满因此评估脚本无法启动以下是我用于训练和评估的命令在一个终端
Tensorflow 检查点模型被删除

我使用以下代码每 10 个时期后使用张量流检查点 checkpoint dir os path abspath os path join out dir checkpoints checkpoint prefix os path join
tensorflow ValueError：特征应该是“张量”的字典。给定类型：

这是我的代码我的tensorflow版本是1 6 0 python版本是3 6 4 如果我直接使用数据集读取csv文件我可以训练并且没有错误但我将 csv 文件转换为 tfrecords 文件这是错误的我在互联网上谷歌了一下几乎
如何使用 keras/tensorflow 构建无监督 CNN 模型？

我正在尝试为图像到图像转换应用程序构建 CNN 模型的输入是图像输出是置信图训练期间没有标记的置信度作为基本事实但设计了损失函数来引导模型获得正确的输出我在用 keras 构建神经网络时遇到困难因为 model fit 函数需要训
Tensorflow RNN-LSTM - 重置隐藏状态

我正在构建一个用于语言识别的有状态 LSTM 有了状态我可以用较小的文件来训练网络而新批次将就像讨论中的下一句话一样然而为了使网络得到正确的训练我需要在一些批次之间重置 LSTM 的隐藏状态我使用一个变量来存储 LSTM 的隐藏
Keras 均方误差损失层

我目前正在实现一个自定义损失层在此过程中我偶然发现了 Objectives py 文件 1 中均方误差的实现我知道我对这种损失计算的理解遗漏了一些东西因为我一直认为平均值是在每个小批量张量的轴 0 中的每个输出的样本之间单独完成的
如何使用自定义数据生成器进行 keras 图像增强？

我正在使用 Keras 自定义生成器我想对从自定义数据生成器返回的数据应用图像增强技术我想要这些图像增强技术 ImageDataGenerator rotation range 40 width shift range 0 2 heig
Keras 多输入 AttributeError：“NoneType”对象没有属性“inbound_nodes”

我正在尝试构建一个模型如下图所示这个想法是采用多个分类特征 one hot 向量并分别嵌入它们然后将这些嵌入向量与 LSTM 的 3D 张量组合起来在以下代码中Keras2 0 2 当创建Model 具有多个输入的对象它会引发A
无法保存自定义子类模型

灵感来自tf keras Model 子类化 https www tensorflow org guide keras model subclassing我创建了自定义模型我可以训练它并获得成功的结果但是我无法保存它我使用 pytho
张量流错误utf-8 OS X Sierra

我已经在 OS X Sierra 上安装了 TensorFlow 和 Anaconda 我在安装过程中没有遇到任何问题写出典型的例子 import tensorflow as tf a tf constant 5 name input a
如何将 py_func 与返回 dict 的函数一起使用

我正在使用编写输入管道tf data Dataset 我想使用 python 代码来加载和转换我的样本代码返回张量字典不幸的是我不知道如何将其定义为传递给的输出类型tf py func 我有一个解决方法我的函数返回张量列表而不是字典
TensorFlow：如何使用 TensorHub 模块导出估计器？

我有一个使用 TensorHub text embedding 列的估计器如下所示 my dataframe pandas DataFrame columns title populate data labels populate lab
Mac 无法安装 Tensorflow

我检查了我的 pip3 和 python3 版本 tensorflow MacBook Pro de Hector 2 tensorflow hectoresteban pip3 V pip 10 0 1 from Users hector

随机推荐

getActivity() 与 FragmentActivity: android

我正在使用这个类 A 它扩展了另一个抽象类并且这个抽象类扩展了 FragmentActivity 并且在 A 类中的一个函数中我想为我当前的活动 A 获取 getActivity 但是每当我使用 getActivity 时它都会给出我
在Service中使用Looper和使用单独的线程是一样的吗？

在此示例中来自文档 https developer android com guide components services html ExtendingService https developer android com guide
Angular 4 Subscribe方法多次调用

我正在创建一个全局模态组件我的问题是当我调用 subscribe 方法时它会根据调用的模态数量多次调用如何防止对可观察订阅方法的多次调用请检查下面我的代码提前致谢模态 model ts export class Modal t
将 nvarchar 值转换为数据类型 int 时转换失败

我创建了下面列出的过程 CREATE procedure getdata ID int frm varchar 250 to varchar 250 AS BEGIN DECLARE SQL nvarchar 500 set SQL sel
如何在 Perl 中获取用户输入而不等待输入？

我正在尝试用 Perl 制作一个交互式 shell 脚本我能找到的唯一用户输入如下 name
如何将动态链接的应用程序转换为静态链接的应用程序？

我有一个应用程序例如 gedit 它是动态链接的但我没有源代码所以我不能按我喜欢的方式编译它我想要做的是将其静态链接并将其移动到没有运行该应用程序所需的库的系统那么是否可以做到以及如何做到呢理论上是可能的您基本上必须执行与动态
VS2005：程序集“<程序集>”被错误地指定为文件。

我已将对 log4net 程序集 dll 的引用添加到我的项目中当我构建时我收到一条警告警告程序集 Lib log4net dll 是错误地指定为文件我查了一下MSDN 上有关此错误的帮助 http msdn microsoft
为什么 `pandas.read_csv` 不是 `pandas.DataFrame.to_csv` 的倒数？

我觉得很奇怪pandas read csv不是直接倒数函数df to csv 在此图中请注意在使用所有默认设置时原始 DataFrame 和最终 DataFrame 之间的未命名列有何不同 In 1 import pandas as
根据连续行值差异拆分数据框

我有一个这样的数据框 df col1 col2 col3 1 2 3 2 5 6 7 8 9 10 11 12 11 12 13 13 14 15 14 15 16 现在我想当两个连续行的 col1 差异大于 1 时从上面创建多个数据框所
为什么日元 (U+00A5) 符号的 Android Shift-JIS 编码会产生 -4,-4 ？

运行以下代码似乎会生成错误的值 byte data u00a5 getBytes Shift JIS 它产生 4 4 但我期望 0x5c 我尝试了各种替代名称 Shift JIS shift jis cp932 并且都产生相同的结果当我将
通过.NET/C#发送传真

如何在 NET 中发送传真我们有一个传真服务器我们需要通过它将文件传真给客户由于我们有传真服务器我不认为我必须在我的机器上配置传真调制解调器对吧它只会通过传真服务器吗有没有好的免费或便宜传真 API 在我的研究中我遇到过
为什么上传文件时出现错误[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 error True apiversion 35 errorCode api error job upload invalid messag
使用 JLabel 修复 JScrollPane

为了添加背景图像我使用 JLabels 而不是 JPanel JFrame frame new JFrame frame setDefaultCloseOperation JFrame EXIT ON CLOSE JLabel label
如何从动态查询中插入具有多列的表？

如同上一个问题 https stackoverflow com questions 34194889 how to insert into table from dynamic query对于一对一映射我需要一个针对源和目标中的多个列的解
Java - Jena API - 输出文件

我正在使用 Java 和 Jena API 我有课Person与数据类型属性hasFirstName hasLastName hasDateOfBirth hasGender 以下是我的 RDF 文件中一个人的表示方式
应用程序网关前面的 Azure 前门

我已在应用程序网关的前面部署了 Azure Front Door 现在我想通过 Front Door 路由所有流量并限制对应用程序网关的公共 IP 地址的直接访问怎么做这就是我想做的 https i stack imgur com
为每个轮询获取特定的记录集，而不在骆驼中设置标志

我需要从数据库中选取所有消息并将其发送以进行重新处理我的主要要求是我应该为每个轮询只获取一定数量的记录而不是所有记录下一次民意调查应该让我得到下一组记录并将其设置为进行处理我不应该在表中使用processedFlag 列这是不允
为什么 calc 在用于 font-size 时不重新计算？

我尝试将 VW 和 calc 一起使用并且有效但只计算一次加载时间 http codepen io anon pen mJOGbr http codepen io anon pen mJOGbr html font size calc
在引导下拉元素上使用 intro.js

我不知道如何在下拉元素上使用 intro js 我发现了一个类似的问题但没有答案 IntroJS Bootstrap 菜单不起作用 https stackoverflow com questions 20071122 introjs bo
在 Tensorflow 中实现对比损失和三元组损失

我两天前开始玩 TensorFlow 我想知道是否有三元组和对比损失的实现我一直在看文档 https www tensorflow org versions r0 9 api docs python nn html losses 但我还没

热门标签