如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步

2023-12-04

我正在尝试通过使用自动编码器进行重建来学习文本序列的潜在表示（多个特征（3））。由于某些序列比最大 pad 长度或我正在考虑的时间步长 (seq_length=15) 短，我不确定重建是否会学会忽略时间步长或不计算损失或准确性。

我遵循了来自的建议这个答案来裁剪输出，但我的损失是 nan 以及一些精度。

input1 = keras.Input(shape=(seq_length,),name='input_1')
input2 = keras.Input(shape=(seq_length,),name='input_2')
input3 = keras.Input(shape=(seq_length,),name='input_3')
input1_emb = layers.Embedding(70,32,input_length=seq_length,mask_zero=True)(input1)
input2_emb = layers.Embedding(462,192,input_length=seq_length,mask_zero=True)(input2)
input3_emb = layers.Embedding(84,36,input_length=seq_length,mask_zero=True)(input3)
merged = layers.Concatenate()([input1_emb, input2_emb,input3_emb])
activ_func = 'tanh'
encoded = layers.LSTM(120,activation=activ_func,input_shape=(seq_length,),return_sequences=True)(merged) #
encoded = layers.LSTM(60,activation=activ_func,return_sequences=True)(encoded)
encoded = layers.LSTM(15,activation=activ_func)(encoded)

# Decoder reconstruct inputs
decoded1 = layers.RepeatVector(seq_length)(encoded)
decoded1 = layers.LSTM(60, activation= activ_func , return_sequences=True)(decoded1)
decoded1 = layers.LSTM(120, activation= activ_func , return_sequences=True,name='decoder1_last')(decoded1)

解码器一的输出形状为(None, 15, 120)。

input_copy_1 = layers.TimeDistributed(layers.Dense(70, activation='softmax'))(decoded1)
input_copy_2 = layers.TimeDistributed(layers.Dense(462, activation='softmax'))(decoded1)
input_copy_3 = layers.TimeDistributed(layers.Dense(84, activation='softmax'))(decoded1)

对于每个输出，我尝试按照建议裁剪 O 填充时间步长这个答案. padding has 0实际输入丢失（由于填充为零）并且1否则

@tf.function
def cropOutputs(x):
    #x[0] is softmax of respective feature (time distributed) on top of decoder
    #x[1] is the actual input feature
    padding =  tf.cast( tf.not_equal(x[1][1],0), dtype=tf.keras.backend.floatx())
    print(padding)
    return x[0]*tf.tile(tf.expand_dims(padding, axis=-1),tf.constant([1,x[0].shape[2]], tf.int32))

将裁剪函数应用于所有三个输出。

input_copy_1 = layers.Lambda(cropOutputs, name='input_copy_1', output_shape=(None, 15, 70))([input_copy_1,input1])
input_copy_2 = layers.Lambda(cropOutputs, name='input_copy_2', output_shape=(None, 15, 462))([input_copy_2,input2])
input_copy_3 = layers.Lambda(cropOutputs, name='input_copy_3', output_shape=(None, 15, 84))([input_copy_3,input3])

我的逻辑是裁剪每个特征的时间步长（序列的所有 3 个特征具有相同的长度，这意味着它们一起错过了时间步长）。但对于时间步长，它们已根据其特征大小（70,462,84）应用了 softmax，因此我必须通过在 mask 的帮助下制作一个由 0 或 1 组成的多维掩码数组等于此特征大小，将时间步长归零padding，并使用多维掩码数组乘以相应的 softmax 表示。

我不确定我这样做是否正确Nan这些输入的损失以及其他准确性是我正在与此任务一起学习的（它仅发生在裁剪过程中）。

如果它对某人有帮助，我最终会直接从损失中裁剪填充的条目（从这些答案).

@tf.function
def masked_cc_loss(y_true, y_pred):

        mask = tf.keras.backend.all(tf.equal(y_true, masked_val_hotencoded), axis=-1)
        mask = 1 - tf.cast(mask, tf.keras.backend.floatx())    
 
        loss = tf.keras.losses.CategoricalCrossentropy()(y_true, y_pred) * mask 
        
        return tf.keras.backend.sum(loss) / tf.keras.backend.sum(mask) #  averaging by the number of unmasked entries

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步的相关文章

张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
如何通过不规则索引获取子张量？

我想通过不规则索引获得子张量这是我的问题 Input tensor 2x8x10x1 Batch x Height x Width x Channel index Height 0 1 4 5 index Width 0 1 4 5 8
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1
Keras 可以处理不同尺寸的输入图像吗？

Keras 可以处理不同尺寸的输入图像吗例如在全卷积神经网络中输入图像可以具有任意大小然而我们在用Keras创建网络时需要指定输入形状因此我们如何使用 Keras 来处理不同的输入尺寸而不将输入图像调整为相同的尺寸谢谢你的帮
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
如何将体积补丁存储到 HDF5 中？

我有一个尺寸的体积数据256x128x256 由于内存有限我无法将整个数据直接输入到 CAFFE 因此我会随机选择n sample补丁50x50x50从体积数据中提取并将其存储到 HDF5 中我成功地从原始数据及其标签中随机提取了补丁
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
Keras IndexError：索引超出范围

我是 Keras 新手我尝试在数据集上执行二进制 MLP 并且不断使索引超出范围但不知道为什么 from keras models import Sequential from keras layers core import Dens
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
如何使用文本和？

我一直在关注this https github com tensorflow models tree master textsum使用 textsum 的链接我已经使用提供的命令训练了模型但我在 textsum log root 目录中
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
Colab 上没有名为“tensorflow.compat.v2”的模块

我正在关注这个https thebinarynotes com how to train mask r cnn on the custom dataset https thebinarynotes com how to train mask
在张量流中对不平衡数据集进行二次采样

张量流初学者在这里这是我的第一个项目我正在使用预定义的估算器我有一个极其不平衡的数据集其中积极结果大约占总数据的 0 1 我怀疑这种不平衡会极大地影响我的模型的性能作为解决这个问题的第一次尝试由于我有大量数据我想扔掉大部分底片
复制张量流图

复制 TensorFlow 图并保持更新的最佳方法是什么理想情况下我想将重复的图放在另一个设备上例如从 GPU 到 CPU 然后不时更新副本简短回答你可能想要检查点文件 https www tensorflow org progr
了解 TensorFlow 检查点加载？

TF 检查点包含什么例如估算器存储一个单独的文件其中包含GraphDef原型你基本上可以做一个tf import graph def 然后创建一个tf train Saver 并将检查点恢复到图中现在如果你还有另一个GraphDe
收到的标签值 1 超出了 [0, 1) 的有效范围 - Python、Keras

我正在使用具有张量流背景的 keras 开发一个简单的 cnn 分类器 def cnnKeras training data training labels test data test labels n dim print Initiat

随机推荐

如何只打印选定的 HTML 元素？

我正在尝试用 HTML 实现打印功能我知道我可以打印整页window print 但是如何只打印特定的页面元素呢例如一个特定的 div Some text to print div 您可以使用打印特定的 CSS 样式表并隐藏除您想要打印
如何在向导窗口的左下角添加图像横幅？

如何将图像添加到设置向导的左下角正如 TLama 评论的那样创建一个TBitmapImage 将其父级设置为WizardForm 将其放置在您想要的位置并从文件加载图片 Files Source logo bmp Flags dontc
R——按组将日期范围扩展为面板数据

我的日期范围由两个变量分组 id and type 当前存储在名为的数据框中data 我的目标是扩大日期范围以便我在日期范围内的每一天都有一行其中包括相同的id and type 以下是重现数据框示例的片段 data lt struct
如何参数化azure逻辑应用标准项目的workflow.json和connections.json文件中的值

我已经使用 Visual Studio 代码创建了 azure 逻辑应用程序单租户项目如下所示this文档然后根据我的要求创建工作流程其中包含数据工厂管道和发送网格操作工作流包含创建管道运行数据工厂操作中的硬编码值 Create a
我应该使用同步方法来改变该字段吗？

随着接下来的课程 This class should be thread safe class BankAccount private long balance Should it be volatile synchronized void
在Python中设置阻塞函数超时

我有一个阻塞函数有时它会无限期地挂起它不受CPU限制它正在访问外部的东西也是对非托管代码的调用我希望它可以在 Windows 或 Unix 上运行在超时情况下运行此方法的最佳实践是什么我认为这将涉及运行一个新线程并有一个等待事
如何禁用 RecyclerView 滚动以使布局监听其 ScrollView 父级？

我想放一个RecyclerView 里面一个ScrollView 但是ScrollView不滚动并且RecyclerView是的但我不希望它我能做什么我尝试过这门课https stackoverflow com a 30222721
通过单击子 div 来阻止 onClick 事件

我正在尝试在 React JS 中创建一个模式我有一个外部 div 它是整个 body 我有一个内部 div 如果在内部 div 外部单击我想应用该函数来关闭模式我的代码如下 popupOutterDivStyle return zI
在Python中，为什么list[]自动是全局的？ [复制]

这个问题在这里已经有答案了这是一种奇怪的行为尝试这个 rep i 0 print rep i is rep i def test global rep i without Global this gives error but list
正则表达式，2 个 html 标签之间的所有内容 vb.net

我正在尝试通过 Visual Basic 2010 上的正则表达式获取网页的一些信息是这样的 span class clear span h2 blabla h2 h2 blabla h2 b blabla b etc etc span
如何解决 OpenCV (cv2 Python) 中的 TypeError: 'NoneType' object is not subscriptable

我是 opencv 的新手我正在尝试打印像素 import numpy as np import cv2 img cv2 imread freelancer jpg cv2 IMREAD COLOR px img 55 55 print
数字差分分析仪虚线

我使用 de DDA 数字差分分析器来画一条线我想我知道也许可以像我一样使用 de DrawLine 只需跟着它运行即可我正在尝试制作不同类型的线例如虚线或点线等我正在考虑使 for 从下面跳跃一些数字来制作虚线但我仍然找不到办
如何从VS安装项目注册COM？

我已将 DLL 标记为 vsdraCOM 安装后可以在注册表中看到它但我的应用程序在手动调用 RegAsm 之前看不到 COM 接口为什么会这样呢 COM 注册在 Vista 我自己确认和 XP 同事确认上不起作用在 XP 上使用
cuBlas 的不同结果

我已经实现了以下 CUDA 代码但我对其行为有点困惑 include
我知道我是否需要启用 Multi-Dex 吗？（类未发现异常）

突然似乎没有任何原因以下错误开始出现经过一整天的斗争我发现启用 Multi Dex 可以解决问题此错误是否可能是由于我违反了 64k 参考阈值而导致的 java lang RuntimeException Unable to in
Python Numpy 获取2个二维数组之间的差异

好吧我有一个简单的问题让我头疼基本上我有两个二维数组充满 x y 坐标我想将第一个与第二个进行比较并生成第三个数组其中包含所有第一个数组中未出现在第二个数组中的元素这很简单但我根本无法让它发挥作用大小变化很大第一个数组可以
openssl_private_encrypt() 返回 false，输出为 0

我正在尝试使用 PHP 函数 openssl private encrypt 在保存上传的文件之前对其进行加密请参阅下面的代码片段但是它的 bool 返回 false 并且加密内容返回不返回任何内容没有显示或报告任何错误 data f
迁移到 WAS 8.5 和 java 1.7 后出现 javax.naming.ConfigurationException

我正在将应用程序从 java 1 5 和 WAS 6 1 迁移到 java 1 7 和 WAS 8 5 我收到以下异常 8 20 12 12 01 00 286 EDT 0000006b SystemErr R org springfram
快速排序未正确排序

试图从快速排序的实现中学习我无法找出它排序不正确的原因使用这个序列 6 7 12 5 9 8 65 3 它返回这个 3 5 7 8 9 65 12 6 似乎有点排序但不是全部我错过了什么这是我的代码 static void Mai
如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步

我正在尝试通过使用自动编码器进行重建来学习文本序列的潜在表示多个特征 3 由于某些序列比最大 pad 长度或我正在考虑的时间步长 seq length 15 短我不确定重建是否会学会忽略时间步长或不计算损失或准确性我遵循了来自的建议这

如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步

如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步 的相关文章

随机推荐

热门标签

如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步的相关文章