Keras 中的 add_loss 函数的用途是什么？

2024-02-22

目前，我偶然发现了变分自动编码器，并尝试使用 keras 让它们在 MNIST 上工作。我找到了一个教程github https://github.com/keras-team/keras/blob/master/examples/variational_autoencoder.py.

我的问题涉及以下代码行：

# Build model
vae = Model(x, x_decoded_mean)

# Calculate custom loss
xent_loss = original_dim * metrics.binary_crossentropy(x, x_decoded_mean)
kl_loss = - 0.5 * K.sum(1 + z_log_var - K.square(z_mean) - K.exp(z_log_var), axis=-1)
vae_loss = K.mean(xent_loss + kl_loss)

# Compile
vae.add_loss(vae_loss)
vae.compile(optimizer='rmsprop')

为什么使用 add_loss 而不是将其指定为编译选项？就像是vae.compile(optimizer='rmsprop', loss=vae_loss)似乎不起作用并抛出以下错误：

ValueError: The model cannot be compiled because it has no loss to optimize.

这个函数和自定义损失函数有什么区别，我可以将其添加为 Model.fit() 的参数？

提前致谢！

P.S.：我知道 github 上有几个与此相关的问题，但其中大多数都是开放的且未评论。如果这个问题已经解决了，请分享链接！

Edit 1

我删除了向模型添加损失的行，并使用了编译函数的损失参数。现在看起来像这样：

# Build model
vae = Model(x, x_decoded_mean)

# Calculate custom loss
xent_loss = original_dim * metrics.binary_crossentropy(x, x_decoded_mean)
kl_loss = - 0.5 * K.sum(1 + z_log_var - K.square(z_mean) - K.exp(z_log_var), axis=-1)
vae_loss = K.mean(xent_loss + kl_loss)

# Compile
vae.compile(optimizer='rmsprop', loss=vae_loss)

这会引发类型错误：

TypeError: Using a 'tf.Tensor' as a Python 'bool' is not allowed. Use 'if t is not None:' instead of 'if t:' to test if a tensor is defined, and use TensorFlow ops such as tf.cond to execute subgraphs conditioned on the value of a tensor.

Edit 2

感谢@MarioZ 的努力，我找到了解决方法。

# Build model
vae = Model(x, x_decoded_mean)

# Calculate custom loss in separate function
def vae_loss(x, x_decoded_mean):
    xent_loss = original_dim * metrics.binary_crossentropy(x, x_decoded_mean)
    kl_loss = - 0.5 * K.sum(1 + z_log_var - K.square(z_mean) - K.exp(z_log_var), axis=-1)
    vae_loss = K.mean(xent_loss + kl_loss)
    return vae_loss

# Compile
vae.compile(optimizer='rmsprop', loss=vae_loss)

...

vae.fit(x_train, 
    x_train,        # <-- did not need this previously
    shuffle=True,
    epochs=epochs,
    batch_size=batch_size,
    validation_data=(x_test, x_test))     # <-- worked with (x_test, None) before

由于某些奇怪的原因，我必须在拟合模型时显式指定 y 和 y_test 。本来，我不需要这样做。生产的样品对我来说似乎很合理。

虽然我可以解决这个问题，但我仍然不知道这两种方法的区别和缺点是什么（除了需要不同的语法之外）。有人可以给我更多的见解吗？

我将尝试回答最初的问题：为什么model.add_loss()正在使用而不是指定自定义损失函数model.compile(loss=...).

Keras 中的所有损失函数始终采用两个参数y_true and y_pred。看看Keras中可用的各种标准损失函数的定义，它们都有这两个参数。它们是“目标”（许多教科书中的 Y 变量）和模型的实际输出。大多数标准损失函数都可以写成这两个张量的表达式。但一些更复杂的损失不能这样写。对于您的 VAE 示例，情况就是如此，因为损失函数还取决于附加张量，即z_log_var and z_mean，这不适用于损失函数。使用model.add_loss()没有这样的限制，并允许您编写依赖于许多其他张量的更复杂的损失，但它的不便之处在于更加依赖于模型，而标准损失函数适用于任何模型。

（注意：这里其他答案中提出的代码有些作弊，因为它们只是使用全局变量来潜入额外的所需依赖项。这使得损失函数不是数学意义上的真正函数。我认为这很重要不太干净的代码，我预计它更容易出错。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)