如何在 Keras 中实现自适应损失？

2023-12-26

我正在尝试使用 Keras 来实现中完成的工作通用的自适应鲁棒损失函数 https://arxiv.org/abs/1701.03077。作者提供了处理困难细节的张量流代码。我只是想在 Keras 中使用他的预构建函数。

他的自定义损失函数正在学习控制损失函数形状的参数“alpha”。除了训练期间的损失之外，我还想跟踪“alpha”。

我对 Keras 自定义损失函数和使用包装器有些熟悉，但我不完全确定如何使用回调来跟踪“alpha”。下面是我选择如何在 Keras 中简单地构建损失函数。但是我不确定如何访问“alpha”进行跟踪。

从提供的张量流代码 https://github.com/google-research/google-research/blob/master/robust_loss/adaptive.py，函数lossfun(x)返回一个元组。

def lossfun(x,
            alpha_lo=0.001,
            alpha_hi=1.999,
            alpha_init=None,
            scale_lo=1e-5,
            scale_init=1.,
            **kwargs):
    """
    Returns:
        A tuple of the form (`loss`, `alpha`, `scale`).
    """

def customAdaptiveLoss(): 
    def wrappedloss(y_true,y_pred):
        loss, alpha, scale = lossfun((y_true-y_pred))  #Author's function
        return loss
    return wrappedloss

Model.compile(optimizer = optimizers.Adam(0.001),
                        loss = customAdaptiveLoss,)

同样，我希望做的是在训练期间跟踪变量“alpha”。

以下示例将 alpha 显示为指标。在 Colab 中测试。

%%
!git clone https://github.com/google-research/google-research.git

%%
import sys
sys.path.append('google-research')
from robust_loss.adaptive import lossfun

# the robust_loss impl depends on the current workdir to load a data file.
import os
os.chdir('google-research')

import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import *
from tensorflow.keras.models import Model
from tensorflow.keras import backend as K

class RobustAdaptativeLoss(object):
  def __init__(self):
    z = np.array([[0]])
    self.v_alpha = K.variable(z)

  def loss(self, y_true, y_pred, **kwargs):
    x = y_true - y_pred
    x = K.reshape(x, shape=(-1, 1))
    with tf.variable_scope("lossfun", reuse=True):
      loss, alpha, scale = lossfun(x)
    op = K.update(self.v_alpha, alpha)
    # The alpha update must be part of the graph but it should
    # not influence the result.
    return loss + 0 * op

  def alpha(self, y_true, y_pred):
    return self.v_alpha

def make_model():
  inp = Input(shape=(3,))
  out = Dense(1, use_bias=False)(inp)
  model = Model(inp, out)
  loss = RobustAdaptativeLoss()
  model.compile('adam', loss.loss, metrics=[loss.alpha])
  return model

model = make_model()
model.summary()

init_op = tf.global_variables_initializer()
K.get_session().run(init_op)

import numpy as np

FACTORS = np.array([0.5, 2.0, 5.0])
def target_fn(x):
  return np.dot(x, FACTORS.T)

N_SAMPLES=100
X = np.random.rand(N_SAMPLES, 3)
Y = np.apply_along_axis(target_fn, 1, X)

history = model.fit(X, Y, epochs=2, verbose=True)
print('final loss:', history.history['loss'][-1])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Keras 中实现自适应损失？的相关文章

回形针回调还是简单的处理器？

我想运行回调after post process但它似乎无法在使用 Paperclip 2 3 8 的 Rails 3 0 1 中工作它给出了一个错误 undefined method post process callbacks for
Keras-批次内每个样本的损失

如何在训练时获得样本损失而不是总损失损失历史记录可提供总批次损失但不提供单个样品的损失如果可能的话我想要这样的东西 on batch end batch logs sample losses 是否有类似的东西可用如果没有您能否提供
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
错误 - AttributeError：“DirectoryIterator”对象在 keras 的自动编码器设计中没有属性“ndim”

我是 Python 3 5 的新手我正在尝试编写一个简单的自动编码器它将在 60 张苹果图像的数据集上进行训练并尝试重建根中给出的图像我使用了以下代码 from keras layers import Input Dense fro
批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
使用 Yew 回调作为 wasm_bindgen 闭包

这个问题是为 Yew v0 19 编写的异步外部 JavaScript 函数可以通过以下方式在 Rust 中使用Closures https rustwasm github io wasm bindgen api wasm bindgen
可选回调的 JavaScript 样式

我有一些函数偶尔并非总是会收到回调并运行它检查回调是否已定义函数是一种好的风格还是有更好的方法 Example function save callback do stuff if typeof callback undefined
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
.NET 远程处理回调

是否可以通过远程处理传输回调我想做一些类似的事情myRemoteObject PerformStuff x gt Console WriteLine x 如果没有我将如何实现等效的功能 Edit 我知道 Remoting 已被 WCF
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
如何在Delphi中将对象方法作为参数传递，然后调用它？

我担心这可能是一个有点愚蠢的问题但这让我很难过我正在寻找将对象的方法传递到过程中的最简单的方法以便过程可以调用对象的方法例如超时后或者可能在不同的线程中所以基本上我想捕获对对象方法的引用将该引用传递给过程使用该引用从过
检测 Google 验证码的挑战窗口何时关闭

我正在使用谷歌隐形验证码有没有办法检测挑战窗口何时关闭我所说的挑战窗口是指您必须选择一些图像进行验证的窗口目前我在按钮上放置了一个旋转器一旦单击按钮就会呈现验证码挑战无法向用户提示另一个质询窗口我以编程方式调用渲染函数 gr
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th

随机推荐

jaxb XmlAccessType: PROPERTY 示例

我正在尝试使用 jaxb 并希望使用 XmlAccessType PROPERTY 让 jaxb 使用 getters setters 而不是直接使用变量但是 get 不同的错误取决于我的尝试或变量根本没有像我想要的那样设置有什么好的
仅显示垂直线的表格

我需要一种方法来仅显示表格中的垂直线我尝试将 border left 和 border right 添加到表格和单独的 td 中两者都带有 1pxsolid red 但它不会添加边框颜色所以我正在寻找一种创建这些垂直线的简单方法 Us
如何在 SQL Server 中拆分字符串并将值插入到表中

我有一个像这样的字符串 72594206916 2 1 2 08 Tacoma WA 72594221856 5 5 7 13 San Francisco CA 72594221871 99 12 30 12 Dallas TX 这基本上是
用于创建应用程序注册的服务主体权限

我使用服务主体作为 azure cli 的登录项该服务主体的角色是所有者我正在尝试运行 az ad app list and az ad app create display name Test application 2 并出现错误
如何触及 HABTM 关系

如果您有 2 个模型视频和类别并且它们彼此之间具有 has and belongs to many 关系那么当其中一个模型发生更改时如何执行触摸以使缓存失效您不能像处理一对多关系那样触摸它们现在当我更改类别名称时属于该类
删除sql SELECT中的所有非数字字符

我想在 SQL 中调用查询时删除所有非数字字符我有一个函数在函数中我这样做 Declare KeepValues as varchar 50 Set KeepValues 0 9 While PatIndex KeepValues T
Android Retrofit导致Socket超时异常

我正在 Android Galaxy S3 Nexus 7 设备上使用改造库对运行 Struts2 的 tomcat 服务器进行 POST 调用 POST 调用失败 tomcat日志显示Socket超时异常使用通过curl 完成的完全相同
Core Data有回调方法吗？

我想知道当核心数据实体中发生某些情况时是否有任何特殊的方法可以采取行动这就是我在本案中的意思我有一个文件名作为属性存储在核心数据实体中当应用程序运行时可能会发生具有此文件名的项目从核心数据中删除的情况在这种情况下我想要发生的是将
嵌套的 std::transform 效率低吗？

如果我有一个std string std string s hello 以及一个就地修改它的循环如下所示 for auto c s c std toupper c 我可以用同等的东西替换它transform std transform s
使用反射查找具有自定义属性的方法

我有一个自定义属性 public class MenuItemAttribute Attribute 和一个包含一些方法的类 public class HelloWorld MenuItemAttribute public void Sho
蒙特卡洛模拟代码：在 R 中生成给定大小的样本

我首先使用以下代码生成 500 个 0 到 1 之间均匀分布的随机数的样本 set seed 1234 X lt runif 500 min 0 max 1 现在我需要编写一个伪代码为 MC 模拟生成 N 500 的 10000 个样本
PackageInstaller 完成（自我）更新后启动应用程序

PackageInstaller 成功自行更新应用程序后应用程序将关闭并且不会再次启动可能重复 Android PackageInstaller 更新后重新打开应用程序 https stackoverflow com questio
Erlang 节点的数量可能/实用吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 1 Erlang 网络中可以存在的最大理论节点数是多少理论可能意味着语言允许或不允许的任何内容 2 Erlang 网络中实际可以
用于从故事板实例化的 UIViewController 扩展

我正在尝试用 Swift 编写一个小扩展来处理 a 的实例化UIViewController来自故事板我的想法如下既然UIStoryboard的方法instantiateViewControllerWithIdentifier需要一个标
为什么我们需要主干js或任何JS MVC框架？

如果我们已经使用后端 MVC 框架例如 Django 或 ROR 为什么还需要使用 JS MVC 框架主干我无法理解两个 MVC 框架的概念以及它们如何组合在一起我认为所有前端相关文件或逻辑 html css js 都位于后端框架的
如何获取 docker 镜像的准确日期？

I run docker images并得到这样的东西 REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE docker io postgres latest a7d662bede59 2 weeks
如何使用列标题引用 Google Apps 脚本电子表格中的单元格

我有几个 Google 表格可以连接并更新它们之间的单元格现在我必须使用 R1C1 或 A1 类型引用来定义基于特定列的获取或设置单元格如果添加新列所有这些引用现在都会关闭每个工作表的第一行都将列标题作为这些单元格中的值我可以以
Solr 查询唯一整数字段

我在 schema xml 中定义了一个字段
Django Forms clean() 方法 - 需要客户端的 IP 地址

我正在重写 Django 表单上的 clean 方法我想要访问客户端的 IP 地址假设这是绑定表单如果我有对请求对象的引用我可以从 META REMOTE ADDR 轻松获取它但是我没有参考该请求关于如何做到这一点有什么想法吗
如何在 Keras 中实现自适应损失？

我正在尝试使用 Keras 来实现中完成的工作通用的自适应鲁棒损失函数 https arxiv org abs 1701 03077 作者提供了处理困难细节的张量流代码我只是想在 Keras 中使用他的预构建函数他的自定义损失函数正在学

如何在 Keras 中实现自适应损失？

如何在 Keras 中实现自适应损失？ 的相关文章

随机推荐

热门标签

如何在 Keras 中实现自适应损失？的相关文章