keras 将两种损失与可调权重结合起来

2023-11-26

enter image description here

所以这里是详细描述。我有一个 keras 功能模型,有两层,输出为 x1 和 x2。

x1 = Dense(1,activation='relu')(prev_inp1)

x2 = Dense(2,activation='relu')(prev_inp2)

我需要使用这些 x1 和 x2,合并/添加它们并提出加权损失函数,如附图所示。将“相同的损失”传播到两个分支。 Alpha 可以灵活地随迭代而变化


似乎将“相同的损失”传播到两个分支不会生效,除非 alpha 依赖于两个分支。如果 alpha 不随两个分支而变化,则部分损失对于一个分支将是恒定的。

因此,在这种情况下,只需编译两个损失分开的模型,并将权重添加到编译方法中:

model.compile(optmizer='someOptimizer',loss=[loss1,loss2],loss_weights=[alpha,1-alpha])

当需要改变alpha时再次编译。


但如果 alpha 确实依赖于两个分支,那么您需要连接结果并计算 alpha 的值:

singleOut = Concatenate()([x1,x2])

以及自定义损失函数:

def weightedLoss(yTrue,yPred):
    x1True = yTrue[0]
    x2True = yTrue[1:]

    x1Pred = yPred[0]
    x2Pred = yPred[1:]

    #calculate alpha somehow with keras backend functions

    return (alpha*(someLoss(x1True,x1Pred)) + ((1-alpha)*(someLoss(x2True,x2Pred))

使用此函数进行编译:

model.compile(loss=weightedLoss, optimizer=....)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

keras 将两种损失与可调权重结合起来 的相关文章

  • ResNet34 在 Keras.application 中可用吗?

    我想包装一个 keras ResNet34 模型 但似乎只有 ResNet50 可以从 keras applications 导入 有没有一种方法可以直接导入 ResNet34 而不用构建 ResNet34 我在网上找到了以下代码 但我想知
  • 获取 Keras model.summary() 作为表

    我在 Keras 中创建了相当大的模型 我正在用 LaTeX 写一篇关于它的文章 为了很好地描述 LaTeX 中的 keras 模型 我想用它创建一个 LaTeX 表 我可以手动实现它 但我想知道是否有任何 更好 的方法来实现这一点 我四处
  • tf.print() vs Python print vs tensor.eval()

    看来在Tensorflow中 至少有三种方法可以打印出张量的值 我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
  • 具有动态 num_partitions 的动态分区

    变量num partitions在方法中tf dynamic partition不是一个Tensor 但是一个int 因此 如果事先不知道分区的数量 则无法通过计算唯一值的数量等方式从数据中推断出分区的数量 也无法通过tf placehol
  • 我无法使用 scikeras.wrappers.KerasRegressor 执行 cross_val_score

    from tensorflow import keras from sklearn model selection import cross val score from sklearn datasets import make regre
  • 如何在对象检测 API 中同时训练和评估?

    我想同时在我自己的数据集上训练 评估 ssd mobilenet v1 cocoObject Detection API 然而 当我尝试这样做时 我面临着 GPU 内存几乎已满 因此评估脚本无法启动 以下是我用于训练和评估的命令 在一个终端
  • 使用 VGGFace 权重微调 VGG 模型

    我正在使用经过微调的 VGG16 模型 该模型使用预训练的 VGGFace 权重来处理野外标记面孔 LFW 数据集 问题是 经过一个时期的训练 大约 0 0037 后 我得到的准确率非常低 即模型根本没有学习 我认为这与我的架构有关 我的架
  • 如何在 Tensorflow 中使用“transform_graph”

    我想优化我的冻结训练 Tensorflow 模型 然而 我发现optimize for inference图书馆不再可用 import tensorflow as tf from tensorflow python tools import
  • 图像分割 - Keras 中的自定义损失函数

    我正在使用 Keras 中实现的 U Net https arxiv org pdf 1505 04597 pdf https arxiv org pdf 1505 04597 pdf 在显微镜图像中分割细胞器 为了让我的网络能够识别仅由
  • TensorFlow:从 RNN 获取所有状态

    你如何获得所有隐藏状态tf nn rnn or tf nn dynamic rnn 在 TensorFlow 中 API 只给我最终状态 第一种选择是在构建直接在 RNNCell 上运行的模型时编写一个循环 然而 时间步数对我来说不是固定的
  • Tensorflow 保存子类模型,该模型具有 call() 方法的多个参数

    我正在关注张量流神经机器翻译教程 https www tensorflow org tutorials text nmt with attention https www tensorflow org tutorials text nmt
  • Keras 均方误差损失层

    我目前正在实现一个自定义损失层 在此过程中 我偶然发现了 Objectives py 文件 1 中均方误差的实现 我知道我对这种损失计算的理解遗漏了一些东西 因为我一直认为平均值是在每个小批量 张量的轴 0 中的每个输出的样本之间单独完成的
  • Keras 预测给出的误差与评估不同,损失与指标不同

    我有以下问题 我在 Keras 中有一个自动编码器 并对其进行了几个时期的训练 训练概览显示验证 MAE 为 0 0422 MSE 为 0 0024 但是 如果我随后调用 network predict 并手动计算验证错误 我会得到 0 0
  • 高斯 RBM 在一个简单的例子上失败了

    我想对具有连续输入变量的受限玻尔兹曼机有一个具体的了解 我正在尝试设计一个最简单的示例 以便可以轻松跟踪行为 所以 就在这里 输入数据是二维的 每个数据点均取自两个对称正态分布 sigma 0 03 之一 其中心间隔良好 15 倍 sigm
  • Tensor(..., shape=(), dtype=int64) 必须与 Tensor(..., shape=(), dtype=resource) Keras 来自同一个图

    我正在尝试使用 Keras 运行 Conv2D 网络来读取一组包含手势图像的文件夹200亿小丑 https 20bn com products datasets我知道 Conv2D 可能行不通 但我想在更改太多代码之前获得我之前使用过的东西
  • 如何在 Keras Lambda Layer 中使用 OpenCV 函数?

    我正在尝试使用一个在图像上使用某些 OpenCV 函数的函数 但我得到的数据是张量 我无法将其转换为图像 def image func img img cv2 cvtColor img cv2 COLOR BGR2YUV img cv2 r
  • 无法为从图中加载的张量变量赋值

    我已经训练了一个模型并保存了它 现在 我试图了解权重扰动如何影响其准确性 因此我需要修改权重变量中保存的值 本质上会为其添加一些噪声 问题是加载它们后我无法为它们分配值 我正在使用 TensorFlow 版本 1 2 1 来训练和加载模型
  • tf.reshape 与 tf.contrib.layers.flatten

    所以我正在运行 CNN 来解决分类问题 我有 3 个转换层和 3 个池化层 P3是最后一个池化层的输出 其维度为 Batch size 4 12 48 我想将该矩阵展平为 Batch size 2304 尺寸矩阵 为2304 4 12 48
  • ValueError:张量必须与张量来自同一个图

    我正在尝试在张量流中构建图表 但遇到以下错误 ValueError 张量 transformation 0 输出 输出 0 形状 dtype float32 必须来自同一个图表 张量 变量 总输出 0 形状 dtype float32 re
  • Edge TPU 编译器:错误:quantized_dimension 必须在 [0, 1) 范围内。是 3

    我正在尝试让 Mobilenetv2 模型 对我的数据重新训练最后一层 在 Google 边缘 TPU Coral 上运行 我已按照本教程进行操作https www tensorflow org lite performance post

随机推荐

  • 如何在运行时克隆 Control 事件处理程序?

    我想复制一个控件 如按钮 文本框等 但我不知道如何复制事件处理程序方法 例如Click 到新的控件 我现在有以下代码 var btn2 new Button btn2 Text btn1 Text btn2 size btn1 size b
  • 如何在SASS中将字符串拆分为两个数字列表?

    我有一个 SASS SCSS 字符串 其中包含两个列表 以逗号分隔 每个列表都包含数字 以空格分隔 如何将字符串拆分为两个数字列表 SCSS values 10px 20px 30px 20px 30px 40px begin should
  • 如何通过对合并值求和来合并两个数组[重复]

    这个问题在这里已经有答案了 可能的重复 PHP 如何对相同键的数组的值求和 我正在寻找一个array merge 函数不替换值 而是添加它们 例如 这是我正在尝试的代码 echo pre a1 array a gt 2 b gt 0 c g
  • 使用 Zend_Session::rememberMe 持久登录

    我在用着Zend Session管理我的用户会话 我希望在我的应用程序中实现 记住我 选项 以使用户登录状态持续两周左右 我注意到了Zend Session已经有一个名为的内置函数Zend Session rememberMe 但是我不确定
  • 在 App Engine 上使用 Spring AOP 会导致 StackOverflowError

    我们有一个在 App Engine 上运行并使用 Spring 框架的应用程序 最近我们添加了一些基于AOP的新功能 我们决定使用 AspectJ 风格 因此我们添加了
  • 有人可以帮我使用谷歌图表创建一个简单的垂直条形图吗?

    我需要帮助来构建动态图表 我有以下代码 但需要将其更改为垂直条形图而不是水平条形图 这里是示例 您可以将 bhs 更改为 bvs 并根据需要更改缩放比例 尝试这个
  • 如何避免多个
  • 产生双边框
  • 如何避免列表样式出现双边框线 请参阅下面的小提琴以获得清晰的图片 我想要每个盒子的宽度为 1px 但是当它们组合在一起时它们是双倍的 http jsfiddle net awaises 4SLPh 1 HTML ul li li li li
  • 在Java中提取int的数字

    因此 如果我输入一个整数 int num 1 128 我如何能够解析数字并获得 1 2 和 8 并将它们分配给不同的变量 Thanks 执行此操作的低效方法是将整数转换为字符串并迭代字符串字符 更有效的方法是这样的 int n 128 wh
  • Python 删除某些文件扩展名

    我对 Python 相当陌生 但我已经让这段代码可以工作 并且事实上 做了它想要做的事情 但是 我想知道是否有更有效的方法来编码 也许可以提高处理速度 import os glob def scandirs path for current
  • 浮点运算中什么是上溢和下溢

    我觉得我不太明白这个概念overflow and underflow 我问这个问题是为了澄清这一点 我需要从最基本的层面来理解它 让我们使用简化的浮点表示1 byte 1位符号 3位指数和4位尾数 0 000 0000 我们可以存储的最大指
  • iOS 8 Mapview 当前位置不火

    MKMapview当前用户位置未触发iOS 8 以前的iOS 7 iOS 6工作正常 self mapView delegate self self mapView showsUserLocation YES 在这一行中自动调用用户当前位置
  • 以编程方式打开“请勿打扰”

    在iOS 6中 您可以打开 关闭 请勿打扰模式 有可能通过应用程序做到这一点吗 或者至少有一种方法可以查明它是否已设置 我没有确切的答案 但我建议您研究 Apple 拥有的内部设置 URL prefs root 记录如下 http www
  • 为所有服务器端代码调用ConfigureAwait 的最佳实践

    当你有服务器端代码 即一些ApiController 并且你的函数是异步的 所以它们返回Task
  • 如何使用 TSQL 循环遍历文件夹中的所有文件?

    我们有一个 excel 文件文件夹 希望使用 TSQL 将其导入到数据库中 我们有使用导入单个文件的代码OpenRowSet 但需要找到一种方法来循环文件夹中的文件并在每个文件上运行此代码 如何使用 TSQL 来实现这一点 做了一些研究 找
  • 一次写入多个文件

    我有一个包含 196 个列表的文件 我想创建新的 196 个输出文件并将每个列表写入一个新文件中 这样我将拥有 196 个输出文件 每个文件包含 1 个输入数据列表 这是输入文件 128 129 116 118 108 104 137 14
  • 使用 pgp 加密两次有什么好处吗? [关闭]

    Closed 这个问题是无关 目前不接受答案 我是从 更安全 的角度来问的 我可以想象一个场景 其中解密场景需要两个必需的私钥 这可能会使其成为一个有吸引力的模型 我相信除了必须泄露两个不同的私钥之外 它不会增加任何额外的安全性 我认为 如
  • Phonegap 支持 WebRTC 吗?

    我想构建一个增强现实应用程序 我正在考虑使用类似 Wikitude SDK 的东西http www wikitude com developer或使用这个 javascript 库https github com mtschirs js o
  • 如何在 Ipython 笔记本中添加外部 javascript 文件

    我正在尝试将 cdn 托管的 d3 js 添加到我的 Ipython 笔记本中 如下所示 但是 当我第一次加载笔记本时 我收到 添加输出时的 JavaScript 错误 但如果我再次运行单元格 它就会正常工作 难道我做错了什么 提前致谢 您
  • python appdata 环境变量中的元音变音问题

    我找不到正确的方法来获取 python 中 appdata 路径的环境变量 问题是我的用户名包含特殊字符 德语 ae 和 ue 我为 Vista 和 Windows 7 使用 PyQt 做了一个解决方法 但它不适用于 XP 系统 有谁知道这
  • keras 将两种损失与可调权重结合起来

    所以这里是详细描述 我有一个 keras 功能模型 有两层 输出为 x1 和 x2 x1 Dense 1 activation relu prev inp1 x2 Dense 2 activation relu prev inp2 我需要使