在自定义 keras 损失中使用 keras 模型

2024-02-27

我有一个名为的常规 keras 模型e我想比较两者的输出y_pred and y_true在我的自定义损失函数中。

from keras import backend as K
def custom_loss(y_true, y_pred):
    return K.mean(K.square(e.predict(y_pred)-e.predict(y_true)), axis=-1)

我收到错误:AttributeError: 'Tensor' object has no attribute 'ndim'这是因为y_true and y_pred都是张量对象并且keras.model.predict预计将通过numpy.array.

知道我如何成功地使用我的keras.model在我的自定义损失函数中?

如果需要的话,我愿意获取指定层的输出,或者转换我的keras.model to a tf.estimator对象(或其他任何东西)。


首先,让我们尝试理解您收到的错误消息:

AttributeError:“张量”对象没有属性“ndim”

我们看一下 Keras 文档,找到predict https://keras.io/models/sequential/#predictKeras模型的方法。我们可以看到函数参数的说明:

x:输入数据,作为 Numpy 数组。

因此,该模型试图获得ndims的财产numpy array,因为它需要一个数组作为输入。另一方面,Keras框架的自定义损失函数得到tensors作为输入。因此,不要在其中编写任何 python 代码 - 它在评估期间永远不会被执行。该函数只是被调用来构建计算图。


好的,现在我们已经了解了该错误消息背后的含义,那么我们如何在自定义损失函数中使用 Keras 模型呢?简单的!我们只需要得到模型的评估图即可。

Update

指某东西的用途global关键字是一种不好的编码习惯。另外,现在到了 2020 年,我们有更好的函数式API https://keras.io/getting-started/functional-api-guide/在 Keras 中,这使得层的 hack 变得不必要。最好使用这样的东西:

from keras import backend as K

def make_custom_loss(model):
    """Creates a loss function that uses `model` for evaluation
    """
    def custom_loss(y_true, y_pred):
        return K.mean(K.square(model(y_pred) - model(y_true)), axis=-1)
    return custom_loss

custom_loss = make_custom_loss(e)

已弃用

尝试这样的事情(仅适用于Sequential模型和非常旧的 API):

def custom_loss(y_true, y_pred):
    # Your model exists in global scope
    global e

    # Get the layers of your model
    layers = [l for l in e.layers]

    # Construct a graph to evaluate your other model on y_pred
    eval_pred = y_pred
    for i in range(len(layers)):
        eval_pred = layers[i](eval_pred)

    # Construct a graph to evaluate your other model on y_true
    eval_true = y_true
    for i in range(len(layers)):
        eval_true = layers[i](eval_true)

    # Now do what you wanted to do with outputs.
    # Note that we are not returning the values, but a tensor.
    return K.mean(K.square(eval_pred - eval_true), axis=-1)

请注意,上面的代码未经测试。然而,无论实现如何,总体思路都将保持不变:您需要构建一个图,其中y_true and y_pred将流经它到最终的操作。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在自定义 keras 损失中使用 keras 模型 的相关文章

随机推荐

  • 如何从java代码运行gradle任务?

    我需要从 java 方法将 gradle eclipse 任务运行到外部 gradle 项目 是否可以使用 Gradle Tooling API 来完成此操作 The 摇篮论坛 https discuss gradle org t exec
  • 如何同时使用 Mercurial 和 svn

    工作中的 SVN 存储库只能在内部访问 至少对于作为承包商的我来说 不工作的时候 我想使用HG 然后第二天与SVN同步 是否建议同时使用两者 有什么问题应该注意吗 The 使用 Subversion https www mercurial
  • 找不到记录器的处理程序

    我是Python新手 我正在尝试登录 python 我遇到了找不到记录器的处理程序尝试通过记录器实例打印一些警告时出错 下面是我尝试过的代码 import logging logger logging getLogger logger lo
  • 获取 UICollectionView 中 Scroll 的总高度?

    我有一个UICollectionView我想在加载内容时调整大小 高度 这个想法是高度应该扩大 以便所有 UICollectionView 单元格都可见 我想知道是否可以获得 内容 大小或滚动高度 Thanks CGFloat height
  • Android Gradle 1.1 - 添加对另一个项目测试的测试依赖项

    我有2个模块 A and B A是一个独立的模块 它的测试本身运行得很好 B是一个依赖模块 它的测试需要某个文件A的测试文件夹 一个测试文件位于B延伸一英寸A 以下是我认为的相关部分B s build gradle android sour
  • 抽象类的析构函数应该是纯虚拟的吗?

    我认为单独虚拟通常就足够了 除了强制派生类实现自己的析构函数之外 是否还有另一个原因使其成为纯虚拟的 我的意思是 如果你在类的构造函数中分配了一些东西 你应该实现你自己的析构函数 无论你的类是否是派生的 正如我已经知道的那样 这不算是答案
  • 如何导出架构并将其导入到 PL\SQL Developer 中的另一个架构

    我正在使用 AllroundAutomations 的 PL SQL Developer 我的任务是将名为 EN 的模式导入到另一个名为 E9 的模式 现在不存在 我设法使用以下方法转储了一个方案Tools gt Export User O
  • 使用 ASP.NET 模拟读取远程文件

    我想阅读远程服务器上存储的 PDF 我已获得具有读取访问权限的用户名 密码 我正在使用此 url 中给出的 ASP NET 模拟https support microsoft com kb 306158 https support micr
  • Python - 使用 ffprobe 获取视频的持续时间

    我是Python新手 我正在尝试使用以下命令获取文件视频的持续时间 以秒为单位 ffprobe 调用如下指令 ffprobe i video mp4 show entries format duration v quiet of csv p
  • NDB 查询以字符串开头的结果

    使用 Google App Engine NDB 我希望查询以用户输入的字符串开头的所有项目 例子 abc 123 abcdefg 123abc 查询 abc 应返回 abc 123 abcdefg 但是 不是 123abc 因为它不 以
  • 在带有数字的文本框中自动添加逗号 (,)

    我当前的编码在有 4 个或更多数字时添加逗号 但不是 1101 1 101 我的代码正在这样做 1101 110 1 我希望它格式化并将逗号放在前面 我的 JavaScript
  • 无法在 Windows 7 / OSX 上安装 jasmine-core

    我正在尝试安装karma jasmine在 Windows 7 Git Bash 上 根据以下指南 http karma runner github io 0 13 intro installation html http karma ru
  • Bing Api 针对简单单词“游戏”返回 41 个结果

    我正在尝试在我的网站中实施 bing 搜索 我需要 JSON 格式的搜索结果 这是我正在使用的网址 我正在尝试搜索一个简单的文字游戏 我应该得到数百万个结果 但我总共得到 41 以下是我的结果的一部分 SearchResponse Vers
  • ASP.NET DropDownList 上的 FindByValue

    我在自定义用户控件中有以下代码 其中包含名为 ddlAggerationUnitId 的 DropDownList DropDownList 在 Page Load 事件上进行数据绑定 值 设置为 40 并且它确实存在 如果我删除 set
  • 线程安全枚举单例

    枚举非常适合创建单例 我知道枚举方法不是线程安全的 所以我尝试使其成为线程安全的 任何人都可以确认此实施是否正确 这么多地方用static和volatile好不好 可以优化吗 由于内部类是私有的 所以我必须在枚举中创建函数来访问内部类功能
  • 如何检查 PostgreSQL 公共模式是否存在?

    运行以下查询 SELECT exists SELECT schema name FROM information schema schemata WHERE schema name public AS schema exists 我总是越来
  • R中按距离聚类

    我有一个整数向量 我希望将其分成簇 以便任何两个簇之间的距离大于下限 并且在任何簇内 两个元素之间的距离小于上限 例如 假设我们有以下向量 1 4 5 6 9 29 32 36 并将上述下界和上限分别设置为 19 和 9 下面的两个向量应该
  • Team Foundation Server 合并未合并

    为什么 TFS 不想归还我的旧文件 Dev Branch Main Branch Merging Dev to Main Edit 鉴于下面的第一个答案和更多调查 我相信我正在尝试完成整个分支覆盖 这可能吗 这是一件好事 我认为最好的办法是
  • 编译 SASS 时出现预期换行错误

    我遇到的问题是我的 SASS 无法编译并且它向我显示相同的错误 Expected NewLine topper h3 text align center text decoration underline list group active
  • 在自定义 keras 损失中使用 keras 模型

    我有一个名为的常规 keras 模型e我想比较两者的输出y pred and y true在我的自定义损失函数中 from keras import backend as K def custom loss y true y pred re