在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量

2024-03-01

我知道如何在 Keras 中使用附加输入（而不是标准输入）编写自定义损失函数y_true, y_pred配对，见下文。我的问题是输入损失函数可训练的变量（其中一些）是损失梯度的一部分，因此应该更新。

我的解决方法是：

输入网络的虚拟输入NXV大小在哪里N是观测值的数量，V附加变量的数量
Add a Dense() layer dummy_output这样 Keras 就会跟踪我的V“权重”
使用该层的V我的真实输出层的自定义损失函数中的权重
为此使用虚拟损失函数（仅返回 0.0 和/或权重 0.0）dummy_output层所以我的V“权重”仅通过我的自定义损失函数更新

我的问题是：有没有更自然的类似 Keras/TF 的方法来做到这一点？因为它感觉很做作，更不用说容易出现错误。

我的解决方法示例：

（是的，我知道这是一个非常愚蠢的自定义损失函数，实际上事情要复杂得多）

import numpy as np
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from tensorflow.keras.layers import Dense
from tensorflow.keras.callbacks import EarlyStopping
import tensorflow.keras.backend as K
from tensorflow.keras.layers import Input
from tensorflow.keras import Model

n_col = 10
n_row = 1000
X = np.random.normal(size=(n_row, n_col))
beta = np.arange(10)
y = X @ beta

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# my custom loss function accepting my dummy layer with 2 variables
def custom_loss_builder(dummy_layer):
    def custom_loss(y_true, y_pred):
        var1 = dummy_layer.trainable_weights[0][0]
        var2 = dummy_layer.trainable_weights[0][1]
        return var1 * K.mean(K.square(y_true-y_pred)) + var2 ** 2 # so var2 should get to zero, var1 should get to minus infinity?
    return custom_loss

# my dummy loss function
def dummy_loss(y_true, y_pred):
    return 0.0

# my dummy input, N X V, where V is 2 for 2 vars
dummy_x_train = np.random.normal(size=(X_train.shape[0], 2)) 

# model
inputs = Input(shape=(X_train.shape[1],))
dummy_input = Input(shape=(dummy_x_train.shape[1],))
hidden1 = Dense(10)(inputs) # here only 1 hidden layer in the "real" network, assume whatever network is built here
output = Dense(1)(hidden1)
dummy_output = Dense(1, use_bias=False)(dummy_input)
model = Model(inputs=[inputs, dummy_input], outputs=[output, dummy_output])

# compilation, notice zero loss for the dummy_output layer
model.compile(
  loss=[custom_loss_builder(model.layers[-1]), dummy_loss],
  loss_weights=[1.0, 0.0], optimizer= 'adam')

# run, notice y_train repeating for dummy_output layer, it will not be used, could have created dummy_y_train as well
history = model.fit([X_train, dummy_x_train], [y_train, y_train],
                    batch_size=32, epochs=100, validation_split=0.1, verbose=0,
                   callbacks=[EarlyStopping(monitor='val_loss', patience=5)])

似乎确实可以正常工作，无论起始值如何var1 and var2（初始化的dummy_output层）他们渴望负inf and 0分别：

（该图来自迭代运行模型并保存这两个权重，如下所示）

var1_list = []
var2_list = []
for i in range(100):
    if i % 10 == 0:
        print('step %d' % i)
    model.fit([X_train, dummy_x_train], [y_train, y_train],
              batch_size=32, epochs=1, validation_split=0.1, verbose=0)
    var1, var2 = model.layers[-1].get_weights()[0]
    var1_list.append(var1.item())
    var2_list.append(var2.item())

plt.plot(var1_list, label='var1')
plt.plot(var2_list, 'r', label='var2')
plt.legend()
plt.show()

在这里回答我自己的问题，经过几天的努力，我让它在没有虚拟输入的情况下工作，我认为这要好得多，并且应该是“规范”方式，直到 Keras/TF 简化过程。 Keras/TF 文档就是这样做的here https://tensorflow.google.cn/guide/keras/train_and_evaluate#handling_losses_and_metrics_that_dont_fit_the_standard_signature.

使用外部损失函数的关键可训练的变量是通过使用自定义损失/输出来实现的Layer其中有self.add_loss(...) in its call()实施，像这样：

class MyLoss(Layer):
    def __init__(self, var1, var2):
        super(MyLoss, self).__init__()
        self.var1 = K.variable(var1) # or tf.Variable(var1) etc.
        self.var2 = K.variable(var2)
    
    def get_vars(self):
        return self.var1, self.var2
    
    def custom_loss(self, y_true, y_pred):
        return self.var1 * K.mean(K.square(y_true-y_pred)) + self.var2 ** 2
    
    def call(self, y_true, y_pred):
        self.add_loss(self.custom_loss(y_true, y_pred))
        return y_pred

现在请注意MyLoss层需求two输入，实际y_true和预测的y直到那时：

inputs = Input(shape=(X_train.shape[1],))
y_input = Input(shape=(1,))
hidden1 = Dense(10)(inputs)
output = Dense(1)(hidden1)
my_loss = MyLoss(0.5, 0.5)(y_input, output) # here can also initialize those var1, var2
model = Model(inputs=[inputs, y_input], outputs=my_loss)

model.compile(optimizer= 'adam')

最后，正如 TF 文档提到的，在这种情况下，您不必指定loss or y in the fit()功能：

history = model.fit([X_train, y_train], None,
                    batch_size=32, epochs=100, validation_split=0.1, verbose=0,
                    callbacks=[EarlyStopping(monitor='val_loss', patience=5)])

再次请注意y_train进入fit()作为输入之一。

现在它可以工作了：

var1_list = []
var2_list = []
for i in range(100):
    if i % 10 == 0:
        print('step %d' % i)
    model.fit([X_train, y_train], None,
              batch_size=32, epochs=1, validation_split=0.1, verbose=0)
    var1, var2 = model.layers[-1].get_vars()
    var1_list.append(var1.numpy())
    var2_list.append(var2.numpy())

plt.plot(var1_list, label='var1')
plt.plot(var2_list, 'r', label='var2')
plt.legend()
plt.show()

（我还应该提到这个特定的模式var1, var2很大程度上取决于它们的初始值，如果var1的初始值大于 1，实际上不会减少，直到负数inf)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量的相关文章

静态文件配置不正确

我已经在 Heroku 上部署了简单的博客应用程序它运行在Django 1 8 4 我在静态文件方面遇到了一些问题当打开我的应用程序时我看到Application Error页面所以我尝试调试它并发现当我提交到 Heroku 时它无
使用信号时出现 django TransactionManagementError

我有一个与 django 的用户和 UserInfo 一对一的字段我想订阅用户模型上的 post save 回调函数以便我也可以保存 UserInfo receiver post save sender User def saveUse
创建一个打开文件并创建字典的函数

我有一个正在处理的文件我想创建一个读取文件并将内容放入字典中的函数然后该字典需要通过 main 函数传递这是主程序它无法改变我所做的一切都必须与主程序配合 def main sunspot dict file str raw in
如何在Python中的BeautifulSoup4中使用.next_sibling时忽略空行

由于我想删除 html 网站中重复的占位符因此我使用 BeautifulSoup 的 next sibling 运算符只要重复项位于同一行就可以正常工作参见数据但有时它们之间有一个空行所以我希望 next sibling 忽略它
在 Python 3 中动态导入模块的问题

我遇到的情况是在我的 Python 3 项目中在运行时必须包含某些模块我在用着importlib import module为了这第二次更新我确实找到了一种方法来做一些接近我想要的事情一些额外的代码可能会使我的一些链接稍微偏离一
通过鼻子测试检查某个函数是否发出警告

我正在使用编写单元测试nose http somethingaboutorange com mrl projects nose 0 11 2 我想检查函数是否引发警告该函数使用warnings warn 这是很容易就能做到的事情吗 def
使用字母而不是数字进行顺序计数[重复]

这个问题在这里已经有答案了我需要一种方法将字符串递增到 z 然后将 aa 递增到 az 然后将 ba 递增到 bz 依此类推就像 Excel 工作表中的列一样我将向该方法提供前一个字符串它应该增加到下一个字母 PSEUDO C
使用 Python 的文本中的词频但忽略停用词

这给了我文本中单词的频率 fullWords re findall r w allText d defaultdict int for word in fullWords d word 1 finalFreq sorted d iterit
Selenium：等到 WebElement 中的文本发生变化

我在用着selenium使用Python 2 7 从网页上的搜索框检索内容搜索框动态检索结果并在框本身中显示结果 from selenium import webdriver from selenium webdriver common
如何使用python读取最后一行的特定位置

我有一个太大的 txt 文件并且有几行类似的行如下所示字1 字2 字3 字4 553 75 我对位置 4 值感兴趣即最后一行 553 75 我的文件文本 word1 word2 word3 word4 553 20 word1 w
如何使用 msgpack 进行读写？

如何序列化反序列化字典data with msgpack http msgpack org The Python 文档 http msgpack python readthedocs io en latest badge latest似乎
在Python中计算结构体的CRC

我有以下结构来自 C 中的 NRPE 守护程序代码 typedef struct packet struct int16 t packet version int16 t packet type uint32 t crc32 value
如何在 Python 中执行相当于预处理器指令的操作？

有没有办法在 Python 中执行以下预处理器指令 if DEBUG lt do some code gt else lt do some other code gt endif There s debug 这是编译器预处理的特殊值 if
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
如何将 pytest 装置与 django TestCase 一起使用

我如何在TestCase方法类似问题的几个答案似乎暗示我的例子应该有效 import pytest from django test import TestCase from myapp models import Category py
从 csv 中读取 pandas 数据帧，以非固定标头开始

我有许多数据文件是由我的实验室中使用的一些相当黑客的脚本生成的该脚本非常有趣因为它在标头之前附加的行数因文件而异尽管它们具有相同的格式并具有相同的标头我正在编写一个批处理来将所有这些文件处理为数据帧如果我不知道位置如何让 pan
从 Python 中编译的正则表达式中提取命名组正则表达式模式

我有一个 Python 正则表达式其中包含多个命名组但是如果先前的组已匹配则可能会错过与一组匹配的模式因为似乎不允许重叠举个例子 import re myText sgasgAAAaoasgosaegnsBBBausgisego
Jupyter Notebook 中的多处理与线程

我试图测试这个例子here https ipywidgets readthedocs io en stable examples Widget 20Asynchronous html将其从线程更改为多处理在 jupyter Noteboo
在读/写二进制数据结构时访问位域

我正在为二进制格式编写一个解析器这种二进制格式涉及不同的表这些表同样采用二进制格式通常包含不同的字段大小其中 50 100 个之间大多数这些结构都有位域并且在 C 语言中表示时看起来像这样 struct myHeader uns
Shap - 颜色条不显示在摘要图中

显示summary plot时不显示颜色条 shap summary plot shap values X train 我尝试过改变plot size 当绘图较高时会出现颜色条但它非常小看起来不应该 shap summary plo

随机推荐

在 Python 中使用字节数组作为 AES 算法的密钥

我有一个字节数组它是 128 位 AES 密钥我想在 Python 脚本上使用该密钥以使用上述密钥对一些信息进行加密我将密钥存储为十六进制字符串例如 27821D90D240EA4F56D0E7612396C69E 显然这不是真正
在 Rails 中使用 check_box_tag 的自定义 id

在 Rails 中使用 check box tag 帮助器时如何设置自定义 id 我有一个循环它根据集合创建一堆复选框 subject syllabus references each do sr check box tag questi
Angular 4 无法绑定到，因为它不是的已知属性

我正在尝试在 Angular 4 中创建自己的指令但是在将类的属性绑定到组件模板中时出现此错误控制台错误 Unhandled Promise rejection Template parse errors Can t bind to
如何在单击按钮时更改矢量可绘制路径的颜色

随着新的 Android 支持更新矢量绘图获得了向后兼容性我有一个带有各种路径的矢量图像我希望路径的颜色在单击按钮时发生变化或者基于输入值以编程方式发生变化是否可以访问矢量路径的名称参数然后改变颜色可以使用 setTint 更
这是使用 jQuery 将 XML 解析为 JavaScript 对象的最快方法吗？

我有一个像这样的 XML 文件
如何从项目文档创建 GitHub 页面？

我在 GitHub 上有一个项目其中包含一些自动生成的 HTML 文档的目录我想在 GitHub 的项目页面工具中使用该文档所以我已经阅读了有关如何操作的说明创建项目的 gh pages 根分支 http pages github
以react-hook-form形式输入onChange

我正在使用 React 构建网络应用程序反应钩子形式 https react hook form com 图书馆我想创建表单其中某些字段的更改会触发某些事件所以我需要通过自定义onChange 但是从 v7 0 开始我无法使用onC
将数据库中的日期更新为 +1 个月

我的用户中有一个日期列我想使用 SQL 查询更新该列通过 SQL 查询我想在数据库中添加 1 个月至今的列我现在有 UPDATE users SET date 1 month 当我运行此查询时它不起作用所以我的问题是我怎样才能
“无法解析对程序集的依赖关系”错误的原因

什么时候会显示以下消息错误 1 未知构建错误无法解析对程序集 Infragistics2 Win v10 3 版本 10 3 20103 2015 Culture neutral PublicKeyToken 7dd5c3163f2cd
Telegram Bot API：getChatMember 为有效用户抛出 USER_ID_INVALID

我正在尝试找出是否有特定的User出现在一个超级组中以便跟踪那些离开的人为此我调用 Bot API 方法getChatMember对于每个User并检查他们的状态是否是Left or Kicked 然而我注意到最近我得到了USE
如何从 ruby 1.9.1 降级到 ruby 1.8.7

我刚刚升级到 Rails 3 但在升级之前运行的是 ruby 1 9 1 Rails 3 不支持 Ruby 1 9 1 如何降级到 ruby 1 8 7 这将从当前版本降级到 1 8 7 gem update system 1 8 7
TensorFlow：如何在训练期间多次评估验证数据队列？

tl dr 如何在每 K 次训练迭代之后评估验证集使用单独的队列进行训练和验证数据而不需要单独使用tf Sessions在多个进程中考虑到我的特定问题似乎没有一种干净的方法来实现这一目标而我当前的解决方法我认为可行给了我未定义
matlab和openCV中的hough变换错误？

我一直在使用 Matlab 和 OpenCV labview 的应用程序中使用霍夫变换发现对于某些图像霍夫变换给出了明显错误的线拟合一致 Here are the test and overlayed images The angle
Thymeleaf 中的标题和标题

我是百里香初学者我从一个通用的布局页面开始片段 layout html div class container Some text div 和内容页面页面 html
使用 Visual Studio 的 Python 工具在 Visual Studio 中使用 Matplotlib 进行绘图

我刚开始在 Python 代码中使用 PTVS 我之前使用过 Spyder 因为它是与 Anaconda 发行版一起提供的这是我遇到的问题我正在尝试创建两个图并同时在单独的窗口中显示它们一个简单的例子是 import matplot
无法获取用于 tmux 和 OSX 的删除键

在通过自制软件安装了 tmux 的 OSX 上我似乎无法让删除键起作用我正在使用 iterm2 并将删除映射到 H 如果没有 tmux 删除键可以正常工作修复 Apple M1 Pro OSX 12 4 tmux 3 3a 上的
从 DDS 中删除读取主题

我在订阅数据时遇到问题使用java平台当订阅者订阅某个主题时必须从 DDS 中删除该订阅的数据但就我而言每当我订阅数据时相同的数据就会被订阅多次数据不会从 DDS 中删除我尝试过 QoS 但不知道如何使用它请建议我如何从
将数组分为 2 个子数组并检查乘法是否相等

我正在为 Java 考试进行练习我今天面临的问题之一是给定一个包含 n 个数字的数组我需要检查是否有 2 个子数组不必相等它们的乘法相等如果有将返回 true 否则返回 false 例如如果数组是 2 15 3 4 2 5
NG-使用过滤器重复与当前日期进行比较？

好的我有一个包含日期列表的对象我像这样遍历它
在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量

我知道如何在 Keras 中使用附加输入而不是标准输入编写自定义损失函数y true y pred配对见下文我的问题是输入损失函数可训练的变量其中一些是损失梯度的一部分因此应该更新我的解决方法是输入网络的虚拟输入NXV大小

在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量

在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量 的相关文章

随机推荐

热门标签

在 Keras/Tensorflow 自定义损失函数中使用额外的“可训练”变量的相关文章