如何实现标记嵌入的中心损失和其他运行平均值

2024-02-27

最近的一篇论文（here http://ydwen.github.io/papers/WenECCV16.pdf）引入了一种称为中心损失的二次损失函数。它基于批次中嵌入之间的距离以及每个相应类的运行平均嵌入。 TF Google 群组中有一些讨论（here https://groups.google.com/a/tensorflow.org/forum/#!topic/discuss/0Am9FCdFAxg）关于如何计算和更新此类嵌入中心。我在下面的答案中整理了一些代码来生成类平均嵌入。

这是最好的方法吗？

对于像中心损失这样的情况来说，之前发布的方法过于简单，随着模型变得更加精细，嵌入的预期值会随着时间的推移而变化。这是因为之前的中心查找例程对自启动以来的所有实例进行平均，因此跟踪预期值的变化非常缓慢。相反，移动窗口平均值是首选。指数移动窗口变体如下：

def get_embed_centers(embed_batch, label_batch):
    ''' Exponential moving window average. Increase decay for longer windows [0.0 1.0]
    '''
    decay = 0.95
    with tf.variable_scope('embed', reuse=True):
        embed_ctrs = tf.get_variable("ctrs")

    label_batch = tf.reshape(label_batch, [-1])
    old_embed_ctrs_batch = tf.gather(embed_ctrs, label_batch)
    dif = (1 - decay) * (old_embed_ctrs_batch - embed_batch)
    embed_ctrs = tf.scatter_sub(embed_ctrs, label_batch, dif)
    embed_ctrs_batch = tf.gather(embed_ctrs, label_batch)
    return embed_ctrs_batch


with tf.Session() as sess:
    with tf.variable_scope('embed'):
        embed_ctrs = tf.get_variable("ctrs", [nclass, ndims], dtype=tf.float32,
                        initializer=tf.constant_initializer(0), trainable=False)
    label_batch_ph = tf.placeholder(tf.int32)
    embed_batch_ph = tf.placeholder(tf.float32)
    embed_ctrs_batch = get_embed_centers(embed_batch_ph, label_batch_ph)
    sess.run(tf.initialize_all_variables())
    tf.get_default_graph().finalize()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

如何实现标记嵌入的中心损失和其他运行平均值的相关文章

Tensorflow“feed_dict”：对键值对使用相同的符号得到“TypeError：无法将 feed_dict 键解释为张量”

我正在使用构建线性回归的 Tensorflow 示例我的代码如下 import numpy as np import tensorflow as tf train X np asarray 3 3 4 4 5 5 6 71 6 93 4
如何在张量流中使用索引数组？

如果给定一个矩阵a有形状 5 3 和索引数组b有形状 5 我们很容易得到对应的向量c通过 c a np arange 5 b 但是我不能用张量流做同样的事情 a tf placeholder tf float32 shape 5 3 b
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
在 Tensorflow2 中将图冻结为 pb

我们通过图形冻结保存来自 TF1 的许多模型 tf train write graph self session graph def some path get graph definitions with weights output g
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
了解 TensorFlow 检查点加载？

TF 检查点包含什么例如估算器存储一个单独的文件其中包含GraphDef原型你基本上可以做一个tf import graph def 然后创建一个tf train Saver 并将检查点恢复到图中现在如果你还有另一个GraphDe
为什么 tf.matmul() 给出看似不一致的结果？

sess tf InteractiveSession num elements 10 output 0 76158798 num elements softmax w 0 1 0 1 0 1 0 1 0 1 0 1 0 1 num elem
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
如何在 Tensorflow 对象检测 api 中评估预训练模型

尝试使用最近发布的 Tensorflow 对象检测 API 并且想知道如何评估他们在模型动物园中提供的预训练模型之一前任如何获取该预训练模型的 mAP 值自从script https github com tensorflow mod
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe
Tensorflow：加权交叉熵中权重的解释

张量流函数tf nn weighted cross entropy with logits 接受论证pos weight The 文档 https www tensorflow org versions r0 11 api docs pyt
如何保存 Tensorflow.js 模型？

我想制作一个创建保存和训练 tensorflow js 模型的用户界面但我无法在创建模型后保存模型我什至从tensorflow js文档复制了这段代码但它不起作用 const model tf sequential layers t
TensorFlow CUDA_ERROR_OUT_OF_MEMORY

我正在尝试在 TensorFlow 中构建一个大型 CNN 并打算在多 GPU 系统上运行它我采用了塔式系统并为两个 GPU 拆分批次同时将变量和其他计算保留在 CPU 上我的系统有 32GB 内存但是当我运行代码时出现错误
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这

随机推荐

Realm Studio：无法打开领域...顶部数组无效（参考：34280，大小：11）

Realm 正在我的反应本机应用程序中运行在 iPad 模拟器上运行我找到了 default realm 文件但在尝试使用 Realm Studio 打开它时收到错误无效的顶部数组 Realm Studio 可以很好地打开下载的演示
重新抛出 InvocableTargetException 目标异常

如何重新抛出 IncationTargetException 的目标异常我有一种方法它使用反射来调用我的一个类中的 invoke 方法但是如果我的代码中抛出异常我不关心 InvocableTargetException 只需要目标
D3：如何显示大数据集

我有一个包含 10 5 个数据点的大型数据集现在我正在考虑以下与大数据集相关的问题有没有有效的方法来可视化非常大的数据集就我而言我有一个用户集每个用户有 10 3 个项目总共有 10 5 项我想一次显示每个用户的所有项目以便
如何用cookie记住显示和隐藏div

我有这样的 HTML div content is visible div div Button Expand div 我使用 Jquery 显示隐藏 div 如下所示 document ready function expand hid
如何获取mysql中最后一条之前的最后一条记录？

如果最后一条记录是记录 35 如何获取表的记录 34 最简单的方法 SELECT FROM tab ORDER BY col DESC LIMIT 1 1 这将从第二个 LIMIT 1 1 开始选择一个记录意味着跳过第一个并选择下一个必
SignalR 中消息的最大限制

我正在尝试通过 SignalR 发送通知它工作完美但是我们可以通过 SignalR 发送的消息的最大大小是多少官方有这样的限制吗 https github com SignalR SignalR issues 1205 https g
Spring Security SAML 断言过期和应用程序会话过期

我对 SAML 断言到期与应用程序会话到期感到困惑简而言之当我们将应用程序部署在容器中时就会创建一个会话可以使用 web xml 中的以下条目控制此会话过期
上周浏览次数最多的使用印象派宝石的物品

我有邮政模型它是impressionable using 印象派 https github com charlotte ruby impressionist宝石我想显示上个月访问量最高的 10 个帖子这是我想出的方法 Post all
FlatMap 返回 List
而不是 List
后 Java Stream 收集
我使用 Java 8 流尝试了以下代码 Arrays asList A B stream flatMap s gt Arrays asList X Y stream map s1 gt s s1 collect Collectors toL

如何找出 Mac OSX 中的 R 库位置？

在linux上通常是 HOME R 它在 Mac 上的哪里我尝试过类似的东西locate Rcpp 但没有得到任何有用的信息 R是通过homebrew安装的 OSX版本是10 9 mavericks With Library您将获得默认的

使用 googletest 时，Visual Studio 2017 针对 INSTANTIATE_TEST_SUITE_P 发出警告

我有一个用于可变参数化测试的 gtest 测试装置并且我实例化了测试套件如下所示 INSTANTIATE TEST SUITE P Instantiation Fixture testing Range 1 100 当我执行测试时事情

如何向带引号的正则 (qr) 表达式添加修饰符

有没有一种简单的方法可以将正则表达式修饰符例如 i 添加到带引号的正则表达式中例如 pat qr F o B a r newpat pat i This doesn t work 我能想到的唯一办法就是print pat n 然后回来

这SwingWorker不是重用ThreadPoolExecutor中的线程吗？

作为我的毕业项目的一部分我开发了一个桌面应用程序如果存在的话它属于图形 IDE 类别我已经实现了一小部分Jessy James Garrett 信息架构和交互设计视觉词汇 http www jjg net ia visvocab

如何确定从序列中删除子序列的所有可能方式？

给定两个序列 A and B 我怎样才能生成所有可能的方式的列表B可以从中删除A 例如在 JavaScript 中如果我有一个函数removeSubSeq采用两个满足我要求的数组参数它将按如下方式工作 removeSubSeq 1 2

线程被阻塞 JAXB

即使每次创建解组器的新对象后线程也会被阻塞请帮忙 http 80 3 daemon prio 10 tid 0x000000004fabe800 nid 0x7147 waiting for monitor entry 0x000000

使用 NavGraph 从另一个 Fragment 切换回来时，包含 ViewPager 的 Fragment 会重新加载 - Jetpack Navigation

下面提供了 TLDR 我有一个复杂的活动片段结构之前是 3 个活动现在转换为三个片段因为它复杂繁重并且需要交换大量数据所以我将其更改为基于新的导航 UI 的结构查看 Google 的向日葵它现在更干净工作速度更快更好 My

超集地图框工具提示的个性化

根据超集拉取请求可以使用一些 JavaScript 来个性化地理数据的工具提示我尝试了很多方法来将点数据获取到工具提示但没有一个起作用 Superset 在哪里存储额外的 JS 参数 The object props OwnData此

将 d3.layout.force v3 更新为 d3.forceSimulation v7

我正在尝试将使用 d3js 版本 3 编写的力导向图更新为 d3js 版本 7 以下代码片段是使用 d3js v3 的工作实现 var svg d3 select svg width svg attr width height svg at

正确的 XPath 查询以获取 div 内部文本

我正在使用 XPath 查询 HTML 文档其中以下 div 包含文本 div class h1 2008 Honda Accord Coupe div

如何实现标记嵌入的中心损失和其他运行平均值

最近的一篇论文 here http ydwen github io papers WenECCV16 pdf 引入了一种称为中心损失的二次损失函数它基于批次中嵌入之间的距离以及每个相应类的运行平均嵌入 TF Google 群组中有一些讨论

热门标签

遇到的问题及技巧

汇编程序入门实践

报错修改

自定义实现

数据被分开

一条指令只能

ReadAll32

源码新大陆

音视频编码格式认知

极客江南

选择题一百道

深度感知使用

驱动介绍与

服务器搭建与使用

went

E0283

数传方案

互斥与同步

主窗口和事件处理

中断学习结尾篇

4412

Exynos

报错总结

某某科技实习日志

文件夹右键新建没有

波形实现呼吸灯

显示屏与

DHT20

Powered by Hwhale

如何实现标记嵌入的中心损失和其他运行平均值

如何实现标记嵌入的中心损失和其他运行平均值 的相关文章

随机推荐

热门标签

如何实现标记嵌入的中心损失和其他运行平均值的相关文章