使用三元组损失连体神经网络模型进行评估（model.evaluate）-tensorflow

2024-01-01

我训练了一个使用三重态损失的连体神经网络。这很痛苦，但我想我做到了。然而，我很难理解如何用这个模型进行评估。

The SNN:

def triplet_loss(y_true, y_pred):
    margin = K.constant(1)
    return K.mean(K.maximum(K.constant(0), K.square(y_pred[:,0]) - 0.5*(K.square(y_pred[:,1])+K.square(y_pred[:,2])) + margin))

def euclidean_distance(vects):
    x, y = vects
    return K.sqrt(K.maximum(K.sum(K.square(x - y), axis=1, keepdims=True), K.epsilon()))

anchor_input = Input((max_len, ), name='anchor_input')
positive_input = Input((max_len, ), name='positive_input')
negative_input = Input((max_len, ), name='negative_input')

Shared_DNN = create_base_network(embedding_dim = EMBEDDING_DIM, max_len=MAX_LEN, embed_matrix=embed_matrix)

encoded_anchor = Shared_DNN(anchor_input)
encoded_positive = Shared_DNN(positive_input)
encoded_negative = Shared_DNN(negative_input)

positive_dist = Lambda(euclidean_distance, name='pos_dist')([encoded_anchor, encoded_positive])
negative_dist = Lambda(euclidean_distance, name='neg_dist')([encoded_anchor, encoded_negative])
tertiary_dist = Lambda(euclidean_distance, name='ter_dist')([encoded_positive, encoded_negative])

stacked_dists = Lambda(lambda vects: K.stack(vects, axis=1), name='stacked_dists')([positive_dist, negative_dist, tertiary_dist])

model = Model([anchor_input, positive_input, negative_input], stacked_dists, name='triple_siamese')

model.compile(loss=triplet_loss, optimizer=adam_optim, metrics=[accuracy])

history = model.fit([Anchor,Positive,Negative],y=Y_dummy,validation_data=([Anchor_test,Positive_test,Negative_test],Y_dummy2), batch_size=128, epochs=25)

我知道，一旦使用三元组训练模型，评估实际上不应该要求使用三元组。然而，我该如何进行这种重塑呢？

因为这是一个 SNN，所以我想将两个输入输入model.evaluate，以及表示两个输入是否相似的分类变量(1 = similar, 0 = not similar).

所以基本上，我想要model.evaluate(input1, input2, y_label)。但我不确定如何用我训练的模型得到这个。如上所示，我使用三个输入进行训练：model.fit([Anchor,Positive,Negative],y=Y_dummy ... ) .

我知道我应该保存训练模型的权重，但我只是不知道将权重加载到哪个模型上。

非常感谢您的帮助！

EDIT：我知道以下预测方法，但我不是在寻找预测，我希望使用model.evaluate因为我想获得模型损失/准确性的一些最终衡量标准。此外，这种方法仅将锚点输入到模型中（而我对文本相似性感兴趣，因此想要输入 2 个输入）

eval_model = Model(inputs=anchor_input, outputs=encoded_anchor)
eval_model.load_weights('weights.hdf5')

考虑到eval_model被训练来生成嵌入，我认为应该很好地使用以下方法来评估两个嵌入之间的相似性余弦相似度 https://www.tensorflow.org/api_docs/python/tf/keras/losses/cosine_similarity.

根据TF文档，余弦相似度是-1到1之间的数字。当它是接近-1的负数时，表示相似度更大。当它是接近1的正数时，表明差异较大。

我们可以简单地计算所有可用样本的正输入和负输入之间的余弦相似度。当余弦相似度 (1 = similar, 0 = not similar)。最后，可以计算二进制精度作为最终指标。

我们可以使用 TF 进行所有计算，而无需使用model.evaluate.

eval_model = Model(inputs=anchor_input, outputs=encoded_anchor)
eval_model.load_weights('weights.hdf5')

cos_sim = tf.keras.losses.cosine_similarity(
    eval_model(X1), eval_model(X2)
).numpy().reshape(-1,1)

accuracy = tf.reduce_mean(tf.keras.metrics.binary_accuracy(Y, -cos_sim, threshold=0))

另一种方法 https://keras.io/examples/vision/siamese_network/包括计算锚点和正图像之间的余弦相似度，并将其与锚点和负图像之间的相似度进行比较。

eval_model = Model(inputs=anchor_input, outputs=encoded_anchor)
eval_model.load_weights('weights.hdf5')

positive_similarity = tf.keras.losses.cosine_similarity(
    eval_model(X_anchor), eval_model(X_positive)
).numpy().mean()

negative_similarity = tf.keras.losses.cosine_similarity(
    eval_model(X_anchor), eval_model(X_negative)
).numpy().mean()

我们应该期望锚点和正图像之间的相似度大于锚点和负图像之间的相似度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用三元组损失连体神经网络模型进行评估（model.evaluate）-tensorflow 的相关文章

TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc
将 Dropout 与 Keras 和 LSTM/GRU 单元结合使用

在 Keras 中您可以像这样指定 dropout 层 model add Dropout 0 5 但对于 GRU 单元您可以将 dropout 指定为构造函数中的参数 model add GRU units 512 return se
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
如何在 keras 中添加可训练的 hadamard 产品层？

我试图在训练样本中引入稀疏性我的数据矩阵的大小为比如说 NxP 我想将其传递到一个层 keras 层该层的权重大小与输入大小相同即可训练权重矩阵W的形状为NxP 我想对这一层的输入矩阵进行哈达玛乘积逐元素乘法 W 按元素与输入相乘
访问 GCP 深度学习平台映像的 dockerfiles

我正在使用源自的图像深度学习容器 https cloud google com ai platform deep learning containers docs 在 AI Platform Notebooks 产品中运行多个任务为了对我
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
使用预训练的 word2vec 初始化 Seq2seq 嵌入

我对使用预训练的 word2vec 初始化tensorflow seq2seq 实现感兴趣我已经看过代码了嵌入似乎已初始化 with tf variable scope scope or embedding attention deco
使用大数据集在 Google Colab TPU 上训练 seq2seq 模型 - Keras

我正在尝试使用 Google Colab TPU 上的 Keras 训练用于机器翻译的序列到序列模型我有一个可以加载到内存中的数据集但我必须对其进行预处理才能将其提供给模型特别是我需要将目标单词转换为一个热向量并且在许多示例中我
TensorFlow 无法编译

尝试从源代码编译 TensorFlow 时出现以下错误任何想法都会有帮助 bazel out host bin solib local U S Stensorflow Spython Cgen Unn Uops Upy Uwrappers
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo

随机推荐

从指针到成员的映射

Note in case this feels like an X Y problem scroll below the separator for how I arrived at this question 我正在寻找一种方法来存储指向
如何在 QML 中创建矩形滚动条

就像网页一样当内容超出矩形时就会出现滚动条还有其他人可以帮助我吗我尝试过使用列表视图但无法在矩形中使用它文档中有一个例子如何使用ScrollBar https doc qt io qt 5 qml qtquick contro
如何使用 Intellij 插件创建自定义实时模板

我想创建一个可与我的插件一起使用的自定义实时模板我知道如何使用设置对话框创建自定义实时模板但我希望能够将实时模板作为我的插件的一部分分发怎么样实时模板在插件中定义在应用程序中注册它的入口点在哪里 Thanks 使用12 1 5
SASS：获取现有背景字符串的值并添加到其中？

我想在 SASS Compass 中额外构建背景而不考虑现有的背景字符串我可以通过写入全局变量来完成但看起来很草率 Pseudo mixin add icon add a background icon mixin add gradi
引入先前证明的定理作为假设

假设我已经在coq中证明了某个定理稍后我想将其作为假设引入到另一个定理的证明中有没有一种简洁的方法来做到这一点当我想做一些诸如案例证明之类的事情时我通常会出现这种需要我发现做到这一点的一种方法是assert陈述定理然后立即证明它
如何使用 Zeromq 的 inproc 和 ipc 传输？

我是 ZERMQ 的新手 ZeroMQ 具有 TCP INPROC 和 IPC 传输我正在寻找在 Winx64 和 python 2 7 中使用 python 和 inproc 的示例这些示例也可以用于 Linux 另外我一直在寻找
无法加载 Boost.Python 模块 - 未定义的符号

我有一个用 C 编写的库需要从 Python 访问所以我使用 Boost Python 包装它我可以毫无问题地将我的库编译成 Boost so 文件但是当我尝试将其加载到 Python 中时使用import tropmodboos
改造 404 未找到 Web api

我有一个网络 API 和一个应用程序所以我想要一个注册应用程序但我有一个问题我用的是天蓝色的有我的registerapi 界面 FormUrlEncoded POST application json public void ins
如何在 Yocto 构建中将第三方库添加为包

我有一个不知名的库并且没有适用于该库的包https github com dailab libsml https github com dailab libsml通常我通过以下方式在我的设备上安装这个库make install如何将此库作
获取数学函数作为用户的输入

我需要知道如何将字符串输入传输到可执行函数例如用户编写字符串 x Sin x 2 然后程序将其作为函数可以计算给定 x 的值可以绘制该函数的推导图等我读到有一个名为scitools stringfunction 但据我所知该模块在
返回时如何跳过浏览器历史记录中的页面？

我有一个带有路由器的 Angular 2 应用程序假设用户位于应用程序中的页面 A 然后导航到页面 B 然后导航到页面 C 此时当他单击浏览器上的后退按钮时我希望他返回到页面 A 跳过 B 我怎样才能实现它当从 B 导航到 C
如何将环境变量传递给使用自定义容器创建的 gcloud beta ai 自定义作业 (Vertex AI)

我正在谷歌的 Vertex AI 中运行自定义训练作业一个简单的gcloud执行自定义作业的命令将使用类似以下语法的内容可以查看该命令的完整文档here https cloud google com sdk gcloud referen
停止 VS 2010 在 else 关键字后自动创建大括号

我正在使用 VS 2010 当我输入 else 然后它自动返回行并添加大括号时我总是感到恼火就像是 else 我无法想象我是唯一一个经常在其他内容后面加上俏皮话并且不喜欢大括号的人我该如何阻止这种情况发生我也发现这种行为非常烦人我
URL编码iOS NSURL错误

在桌面上的 Firefox Chrome 浏览器中打开的 URL 在 iPhone 上的 WebView 中无法打开该 URL 据称正在访问 GET 请求创建 NSURL 时不进行百分号转义则不会生成 url 使用percentesc
php：将整个 $_POST 变量保存在会话中

这是否有效 SESSION pictures rateAlbum POST POST 我想一次性保存会话中的所有 POST 数据编辑哦反过来呢 POST SESSION pictures rateAlbum POST 是的你可以如果
使用 chrome 暂停下载无法按预期工作

我试图暂停下载但不起作用文件已下载这是我的代码在我的后台脚本中 chrome downloads onCreated addListener function e chrome downloads pause e id Here c
使用 Response.End(false) 与 ApplicationInstance.CompleteRequest() 之间/用例之间有什么区别

我遇到了一个讨论使用的问题ApplicationInstance CompleteRequest 以避免ThreadAbortException被抛出时Response End 叫做过去为了避免我上面提到的异常错误我使用了这个重载 R
使用 .next() 或 .nextLine() 的 java 字符串变量

以下是我的源代码 package functiontest import java io BufferedWriter import java io File import java io FileWriter import java io
使用自定义名称创建工作簿而不将其保存到磁盘

是否可以创建具有自定义名称的工作簿而不将其保存到磁盘我想避免使用默认的工作簿 x 名称但我不想要求用户保存工作簿如果我自动将其保存在某个临时文件中则用户单击保存时将不会出现另存为对话框这可能会令人困惑只需创建工作簿而不
使用三元组损失连体神经网络模型进行评估（model.evaluate）-tensorflow

我训练了一个使用三重态损失的连体神经网络这很痛苦但我想我做到了然而我很难理解如何用这个模型进行评估 The SNN def triplet loss y true y pred margin K constant 1 return

使用三元组损失连体神经网络模型进行评估（model.evaluate）-tensorflow

使用三元组损失连体神经网络模型进行评估（model.evaluate）-tensorflow 的相关文章

随机推荐

热门标签