在自定义 keras 损失中使用 keras 模型

2024-02-27

我有一个名为的常规 keras 模型e我想比较两者的输出y_pred and y_true在我的自定义损失函数中。

from keras import backend as K
def custom_loss(y_true, y_pred):
    return K.mean(K.square(e.predict(y_pred)-e.predict(y_true)), axis=-1)

我收到错误：AttributeError: 'Tensor' object has no attribute 'ndim'这是因为y_true and y_pred都是张量对象并且keras.model.predict预计将通过numpy.array.

知道我如何成功地使用我的keras.model在我的自定义损失函数中？

如果需要的话，我愿意获取指定层的输出，或者转换我的keras.model to a tf.estimator对象（或其他任何东西）。

首先，让我们尝试理解您收到的错误消息：

AttributeError：“张量”对象没有属性“ndim”

我们看一下 Keras 文档，找到predict https://keras.io/models/sequential/#predictKeras模型的方法。我们可以看到函数参数的说明：

x：输入数据，作为 Numpy 数组。

因此，该模型试图获得ndims的财产numpy array，因为它需要一个数组作为输入。另一方面，Keras框架的自定义损失函数得到tensors作为输入。因此，不要在其中编写任何 python 代码 - 它在评估期间永远不会被执行。该函数只是被调用来构建计算图。

好的，现在我们已经了解了该错误消息背后的含义，那么我们如何在自定义损失函数中使用 Keras 模型呢？简单的！我们只需要得到模型的评估图即可。

Update

指某东西的用途global关键字是一种不好的编码习惯。另外，现在到了 2020 年，我们有更好的函数式API https://keras.io/getting-started/functional-api-guide/在 Keras 中，这使得层的 hack 变得不必要。最好使用这样的东西：

from keras import backend as K

def make_custom_loss(model):
    """Creates a loss function that uses `model` for evaluation
    """
    def custom_loss(y_true, y_pred):
        return K.mean(K.square(model(y_pred) - model(y_true)), axis=-1)
    return custom_loss

custom_loss = make_custom_loss(e)

已弃用

尝试这样的事情（仅适用于Sequential模型和非常旧的 API）：

def custom_loss(y_true, y_pred):
    # Your model exists in global scope
    global e

    # Get the layers of your model
    layers = [l for l in e.layers]

    # Construct a graph to evaluate your other model on y_pred
    eval_pred = y_pred
    for i in range(len(layers)):
        eval_pred = layers[i](eval_pred)

    # Construct a graph to evaluate your other model on y_true
    eval_true = y_true
    for i in range(len(layers)):
        eval_true = layers[i](eval_true)

    # Now do what you wanted to do with outputs.
    # Note that we are not returning the values, but a tensor.
    return K.mean(K.square(eval_pred - eval_true), axis=-1)

请注意，上面的代码未经测试。然而，无论实现如何，总体思路都将保持不变：您需要构建一个图，其中y_true and y_pred将流经它到最终的操作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在自定义 keras 损失中使用 keras 模型的相关文章

如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
错误 - AttributeError：“DirectoryIterator”对象在 keras 的自动编码器设计中没有属性“ndim”

我是 Python 3 5 的新手我正在尝试编写一个简单的自动编码器它将在 60 张苹果图像的数据集上进行训练并尝试重建根中给出的图像我使用了以下代码 from keras layers import Input Dense fro
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
如何在 keras 中添加可训练的 hadamard 产品层？

我试图在训练样本中引入稀疏性我的数据矩阵的大小为比如说 NxP 我想将其传递到一个层 keras 层该层的权重大小与输入大小相同即可训练权重矩阵W的形状为NxP 我想对这一层的输入矩阵进行哈达玛乘积逐元素乘法 W 按元素与输入相乘
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我

随机推荐

如何从java代码运行gradle任务？

我需要从 java 方法将 gradle eclipse 任务运行到外部 gradle 项目是否可以使用 Gradle Tooling API 来完成此操作 The 摇篮论坛 https discuss gradle org t exec
如何同时使用 Mercurial 和 svn

工作中的 SVN 存储库只能在内部访问至少对于作为承包商的我来说不工作的时候我想使用HG 然后第二天与SVN同步是否建议同时使用两者有什么问题应该注意吗 The 使用 Subversion https www mercurial
找不到记录器的处理程序

我是Python新手我正在尝试登录 python 我遇到了找不到记录器的处理程序尝试通过记录器实例打印一些警告时出错下面是我尝试过的代码 import logging logger logging getLogger logger lo
获取 UICollectionView 中 Scroll 的总高度？

我有一个UICollectionView我想在加载内容时调整大小高度这个想法是高度应该扩大以便所有 UICollectionView 单元格都可见我想知道是否可以获得内容大小或滚动高度 Thanks CGFloat height
Android Gradle 1.1 - 添加对另一个项目测试的测试依赖项

我有2个模块 A and B A是一个独立的模块它的测试本身运行得很好 B是一个依赖模块它的测试需要某个文件A的测试文件夹一个测试文件位于B延伸一英寸A 以下是我认为的相关部分B s build gradle android sour
抽象类的析构函数应该是纯虚拟的吗？

我认为单独虚拟通常就足够了除了强制派生类实现自己的析构函数之外是否还有另一个原因使其成为纯虚拟的我的意思是如果你在类的构造函数中分配了一些东西你应该实现你自己的析构函数无论你的类是否是派生的正如我已经知道的那样这不算是答案
如何导出架构并将其导入到 PL\SQL Developer 中的另一个架构

我正在使用 AllroundAutomations 的 PL SQL Developer 我的任务是将名为 EN 的模式导入到另一个名为 E9 的模式现在不存在我设法使用以下方法转储了一个方案Tools gt Export User O
使用 ASP.NET 模拟读取远程文件

我想阅读远程服务器上存储的 PDF 我已获得具有读取访问权限的用户名密码我正在使用此 url 中给出的 ASP NET 模拟https support microsoft com kb 306158 https support micr
Python - 使用 ffprobe 获取视频的持续时间

我是Python新手我正在尝试使用以下命令获取文件视频的持续时间以秒为单位 ffprobe 调用如下指令 ffprobe i video mp4 show entries format duration v quiet of csv p
NDB 查询以字符串开头的结果

使用 Google App Engine NDB 我希望查询以用户输入的字符串开头的所有项目例子 abc 123 abcdefg 123abc 查询 abc 应返回 abc 123 abcdefg 但是不是 123abc 因为它不以
在带有数字的文本框中自动添加逗号 (,)

我当前的编码在有 4 个或更多数字时添加逗号但不是 1101 1 101 我的代码正在这样做 1101 110 1 我希望它格式化并将逗号放在前面我的 JavaScript
无法在 Windows 7 / OSX 上安装 jasmine-core

我正在尝试安装karma jasmine在 Windows 7 Git Bash 上根据以下指南 http karma runner github io 0 13 intro installation html http karma ru
Bing Api 针对简单单词“游戏”返回 41 个结果

我正在尝试在我的网站中实施 bing 搜索我需要 JSON 格式的搜索结果这是我正在使用的网址我正在尝试搜索一个简单的文字游戏我应该得到数百万个结果但我总共得到 41 以下是我的结果的一部分 SearchResponse Vers
ASP.NET DropDownList 上的 FindByValue

我在自定义用户控件中有以下代码其中包含名为 ddlAggerationUnitId 的 DropDownList DropDownList 在 Page Load 事件上进行数据绑定值设置为 40 并且它确实存在如果我删除 set
线程安全枚举单例

枚举非常适合创建单例我知道枚举方法不是线程安全的所以我尝试使其成为线程安全的任何人都可以确认此实施是否正确这么多地方用static和volatile好不好可以优化吗由于内部类是私有的所以我必须在枚举中创建函数来访问内部类功能
如何检查 PostgreSQL 公共模式是否存在？

运行以下查询 SELECT exists SELECT schema name FROM information schema schemata WHERE schema name public AS schema exists 我总是越来
R中按距离聚类

我有一个整数向量我希望将其分成簇以便任何两个簇之间的距离大于下限并且在任何簇内两个元素之间的距离小于上限例如假设我们有以下向量 1 4 5 6 9 29 32 36 并将上述下界和上限分别设置为 19 和 9 下面的两个向量应该
Team Foundation Server 合并未合并

为什么 TFS 不想归还我的旧文件 Dev Branch Main Branch Merging Dev to Main Edit 鉴于下面的第一个答案和更多调查我相信我正在尝试完成整个分支覆盖这可能吗这是一件好事我认为最好的办法是
编译 SASS 时出现预期换行错误

我遇到的问题是我的 SASS 无法编译并且它向我显示相同的错误 Expected NewLine topper h3 text align center text decoration underline list group active
在自定义 keras 损失中使用 keras 模型

我有一个名为的常规 keras 模型e我想比较两者的输出y pred and y true在我的自定义损失函数中 from keras import backend as K def custom loss y true y pred re

在自定义 keras 损失中使用 keras 模型

Update

已弃用

在自定义 keras 损失中使用 keras 模型 的相关文章

随机推荐

热门标签

在自定义 keras 损失中使用 keras 模型的相关文章