已经有许多论文(特别是图像字幕)联合使用 CNN 和 LSTM 架构来执行预测和生成任务。然而,它们似乎都独立于 LSTM 来训练 CNN。我正在研究 Torch 和 TensorFlow(使用 Keras),但找不到为什么不能进行端到端训练的原因(至少从架构设计的角度来看),但是有似乎没有此类模型的任何文档。
那么,可以吗? Torch 或 TensorFlow(甚至 Theanos 或 Caffe)是否支持联合训练端到端 CNN-LSTM 神经网络?如果是这样,是否就像将 CNN 的输出链接到 LSTM 的输入并运行 SGD 一样简单?还是有更复杂的情况?
CNN-LSTM模型可以使用tensorflow进行端到端训练
假设你有一个 CNN 模型M
有输入X
和 LSTM 模型LSTM
。这可以进行端到端训练
# here CNN is used to extract meaning features from the input data
features = M(X)
# CNN features are used as input to LSTM
y = LSTM(features)
cost = cost_function(ground_truths, y)
一个综合示例,显示用于句子分类的 CNN-LSTM 模型的端到端训练imdb
数据集可在CNN LSTM-and-end https://github.com/n3011/tefla/blob/master/examples/nlp/cnn_lstm_imdb.py.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)