计算网络两个输出之间的 cosine_proximity 损失

2024-02-04

我正在使用 Keras 2.0.2 功能 API (Tensorflow 1.0.1) 来实现一个接受多个输入并产生两个输出的网络a and b。我需要使用 cosine_proximity 损失来训练网络，这样b是标签a。我该怎么做呢？

在这里分享我的代码。最后一行model.fit(..)是有问题的部分，因为我本身没有标记数据。标签是由模型本身生成的。

from keras.models import Model
from keras.layers import Input, LSTM
from keras import losses

shared_lstm = LSTM(dim)

q1 = Input(shape=(..,.. ), name='q1')
q2 = Input(shape=(..,.. ), name='q2')
a = shared_lstm(q1)
b = shared_lstm(q2)
model = Model(inputs=[q1,q2], outputs=[a, b])
model.compile(optimizer='adam', loss=losses.cosine_proximity)

model.fit([testq1, testq2], [?????])

你可以先定义一个假的真实标签。例如，将其定义为输入数据大小的一维数组。

现在是损失函数。你可以这样写。

def my_cosine_proximity(y_true, y_pred):
    a = y_pred[0]
    b = y_pred[1]
    # depends on whether you want to normalize
    a = K.l2_normalize(a, axis=-1)
    b = K.l2_normalize(b, axis=-1)        
    return -K.mean(a * b, axis=-1) + 0 * y_true

我已经成倍增加y_true零并添加它只是为了让 Theano 不会给出丢失输入的警告/错误。

你应该打电话给你的fit正常运行，即包含您的虚假真实标签。

model.compile('adam', my_cosine_proximity) # 'adam' used as an example optimizer 
model.fit([testq1, testq2], fake_y_true)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

deeplearning

Keras

loss

计算网络两个输出之间的 cosine_proximity 损失的相关文章

批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc
将 Dropout 与 Keras 和 LSTM/GRU 单元结合使用

在 Keras 中您可以像这样指定 dropout 层 model add Dropout 0 5 但对于 GRU 单元您可以将 dropout 指定为构造函数中的参数 model add GRU units 512 return se
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
访问 GCP 深度学习平台映像的 dockerfiles

我正在使用源自的图像深度学习容器 https cloud google com ai platform deep learning containers docs 在 AI Platform Notebooks 产品中运行多个任务为了对我
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
Pytorch RuntimeError：“host_softmax”未针对“torch.cuda.LongTensor”实现

我正在使用 pytorch 来训练模型但是在计算交叉熵损失时我遇到了运行时错误 Traceback most recent call last File deparser py line 402 in
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
卷积 ImageNet 网络对于翻转图像具有不变性

我正在使用深度学习 caffe 框架进行图像分类我有一些有头像的硬币有些是左向的有些是右向的为了对它们进行分类我使用常见的方法从预训练的 ImageNet 网络中获取权重和结构该网络已经捕获了大量图像模式并主要训练最后一层以
具有多个输入的kerasvalidation_data

我尝试使用validation data方法但是有问题 model fit X macd train X rsi train X ema train Y train sample weight sample weight validati
不确定我的自动编码器神经网络从 Keras 预测中给出的结果

我正在尝试构建一个自动编码器神经网络用于在单列文本列表中查找异常值我的输入有 138 行它们看起来像这样 amaze header 2 png amaze header png circle shape xml disableable
如何理解SpatialDropout1D以及何时使用它？

偶尔我会看到一些模型正在使用SpatialDropout1D代替Dropout 例如在词性标记神经网络中他们使用 model Sequential model add Embedding s vocabsize EMBED SIZE i
Keras：嵌入/向量的附加层？

我有 3 个词嵌入嵌入 1 w11 w12 w13 w14 嵌入 2 w21 w22 w23 w24 嵌入 3 w31 w32 w33 w34 有没有办法通过添加所有三个向量来获得第四个嵌入并使用所有向量的可训练权重例如嵌入 4 w
获取每个训练实例的损失值 - Keras

我想获得每个实例的损失值作为模型训练 history model fit 例如上面的代码返回每个时期的损失值而不是小批量或实例做这个的最好方式是什么有什么建议么在这个 keras 官方文档页面的末尾正是您要寻找的内容https

随机推荐

输出到 csv 文件将数据转储到浏览器，但不转储到文件

我尝试在 golang beego 框架中将一些数据输出到 csv 文件这是我的代码 records make string len devicesData for k v range devicesData records k stri
卸载 Microsoft ASP.NET 和 Web 工具

我认为此扩展导致我的 Visual Studio 2015 Update 2 出现问题但我无法卸载它在扩展下它已列出但删除禁用按钮呈灰色我在删除程序功能下也找不到它我到底如何卸载这个扩展通过其安装程序卸载下载
VSCode 自动导入不适用于干净的角度项目

使用 Typescript 3 9 7 拥有一个干净的 Angular 10 项目一些自动导入和建议不起作用例如我开始输入 FormsM 它应该出现 FormsModule 来自动完成并从 angular forms 自动导入但此选
数据表和并行计算

继这篇文章之后 R 中的多核和 data table https stackoverflow com questions 14697670 multicore and data table in r 我想知道在使用 data table 时
使用 Mongo ObjectId 类型作为 Meteor 用户 ID

我正在使用 Meteor 并且有一个关于覆盖 Meteor 用于用户 ID 的类型的默认行为的问题我希望用户能够由唯一标识 idObjectId 类型的字段而不是 Meteor 默认的任何类型字符串为了实现这种情况我可以在某个地方
Android ListView多项选择在点击后不显示突出显示

我有一个处于多选模式的ListView 我不想要复选框我只是希望当我单击项目时它们可以突出显示以显示选中状态再次单击时突出显示将消失并取消选中所以现在我的问题是我的项目根本没有被检查和突出显示我不知道为什么这是代码 mFrie
嵌套文件夹中的 web.config

我正在尝试在另一个网络应用程序中安装一个应用程序我有我的 aspx 页面和一些代码我将其放入主应用程序的 app code 文件夹中我已经为连接字符串等添加了自己的 web config 文件但我认为存在冲突所以我的问题是两个人
如何为 opencart 多商店使用单独的语言文件？

我使用的是 opencart 版本 1 5 5 1 我们有一个使用 opencart 框架编码的网站该网站还使用 opencart 多商店功能所有商店均使用英语现在的问题是是否可以针对不同的商店使用不同的语言标签例如一家商店与运
如何在日语语言环境中显示反斜杠

在我的应用程序中我使用反斜杠作为基于文本的活动指示器的一部分典型的序列我删除了因为它具有不同的宽度一切都很顺利直到我看到我的应用程序在日本计算机上运行反斜杠被替换为日语字符我怎样才能避免这种情况您可以使用 oOo 作为序
Cassandra：向表中添加新列

您好我刚刚在我的表 my table 中添加了一个新列 Business sys ALTER TABLE my table ALTER business sys TYPE set
有没有办法在界面生成器中制作渐变背景色？

对于我的应用程序我使用 TableView 并使用自定义的 UITableViewCells 我通过界面生成器而不是以编程方式自定义了我的单元格有没有办法在界面生成器中将自定义单元格的背景颜色设置为渐变 Thanks 这适用于 Swif
上传多个文件显示错误代码：3

这个问题和问的一样here https stackoverflow com questions 19275268 phonegap file transfer of picture fails on every other picture
NSTimer 一段时间后在后台停止

当应用程序进入后台时我使用 NSTimer 在 1 秒后调用一个方法并在近 17 分钟后计时器停止工作当它返回前台时它再次开始工作所以请告诉我为什么会发生这种情况以及如何解决该问题我还尝试使用延迟递归的执行选择器来达到相同的目的
调用 QtGui.QFileDialog.getExistingDirectory 时出错

在 pyqt 代码中我试图向用户提升一个对话框并让用户选择一个文件夹看来 QtGui QFileDialog getExistingDirectory 方法应该能够做到这一点问题是代码运行后有一些错误消息 D Lib debug pr
removeObject 是否释放 NSMutableArray 对象中的对象？

我想知道当您在数组中使用removeObject 删除对象时是否正确处理了删除的对象被移除的对象会被释放吗 NSMutableArray 将释放它如果这是最后一次保留它将被释放从文档中与 NSArray 一样 NSMutable
我的部分视图中的 Jquery 或 Javascript 问题

我可以在部分视图中使用 jQuery 或 JavaScript 代码吗我的部分视图中有一个网格我试图在该部分视图中使用 jQuery 隐藏一个网格元素我做不到但如果我在没有部分视图的情况下使用它相同的代码就可以工作有人可以帮我吗
委托不在单例中工作[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 为了在多个
Databricks - 无法从 DataFrame 写入 Delta 位置

我想更改 Databricks Delta 表的列名称所以我做了以下事情 Read old table data val old data DF spark read format delta load dbfs mnt main sal
如何重建开发 Pod 变更？

我有一个开发容器我使用它在本地连接到我的应用程序 path gt Projects Swift pod 当我在该开发容器中的应用程序代码中进行更改时构建后不会包含此更改这就像我正在构建缓存代码而不是更改我的代码为了将代码更改包含到
计算网络两个输出之间的 cosine_proximity 损失

我正在使用 Keras 2 0 2 功能 API Tensorflow 1 0 1 来实现一个接受多个输入并产生两个输出的网络a and b 我需要使用 cosine proximity 损失来训练网络这样b是标签a 我该怎么做呢在这里

计算网络两个输出之间的 cosine_proximity 损失

计算网络两个输出之间的 cosine_proximity 损失 的相关文章

随机推荐

热门标签

计算网络两个输出之间的 cosine_proximity 损失的相关文章