端到端训练 CNN-LSTLM?

2023-12-27

已经有许多论文(特别是图像字幕)联合使用 CNN 和 LSTM 架构来执行预测和生成任务。然而,它们似乎都独立于 LSTM 来训练 CNN。我正在研究 Torch 和 TensorFlow(使用 Keras),但找不到为什么不能进行端到端训练的原因(至少从架构设计的角度来看),但是有似乎没有此类模型的任何文档。

那么,可以吗? Torch 或 TensorFlow(甚至 Theanos 或 Caffe)是否支持联合训练端到端 CNN-LSTM 神经网络?如果是这样,是否就像将 CNN 的输出链接到 LSTM 的输入并运行 SGD 一样简单?还是有更复杂的情况?


CNN-LSTM模型可以使用tensorflow进行端到端训练

假设你有一个 CNN 模型M有输入X和 LSTM 模型LSTM。这可以进行端到端训练

# here CNN is used to extract meaning features from the input data
features = M(X)
# CNN features are used as input to LSTM
y = LSTM(features)
cost = cost_function(ground_truths, y)

一个综合示例,显示用于句子分类的 CNN-LSTM 模型的端到端训练imdb数据集可在CNN LSTM-and-end https://github.com/n3011/tefla/blob/master/examples/nlp/cnn_lstm_imdb.py.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

端到端训练 CNN-LSTLM? 的相关文章

随机推荐

  • 为什么 Haskell 中基于 [Char] 的输入比基于 [Char] 的输出慢得多?

    这是一个不使用的常识 Char 在 Haskell 中读取大量数据 一用ByteString来完成这项工作 对此通常的解释是Chars 很大并且列表增加了它们的开销 然而 这似乎不会对输出造成任何问题 例如下面的程序 main intera
  • git重置后未暂存的文件消失了--hard

    我尝试过git reset hard HEAD n from git reflog我丢失了当前未暂存文件的所有内容 未暂存的文件是最后一个git add我做到了 在那之前我尝试过git reset到最后git commit 我所有的文件都消
  • 反应 onClick 问题

    我是 React 新手 我正在尝试将 onClick 事件连接到图像 以查看已按下的对象但无法使其工作 我已经尝试了在该网站上找到的几个答案 但没有一个起作用 可能是因为 var createItem jsx React DOM var R
  • Mono for Android OnPause 事件在 Galaxy Nexus 上未触发

    我整理了我的第一个 Mono for Android 项目 目标 API 级别 8 最低 Android 2 2 并将其部署到运行 2 3 4 的 HTC Incredible 1 一切都很顺利 并且在我的主要活动中出现了断点OnCreat
  • 对话框 ui 中的复选框不可选中

    我正在尝试使用 jQuery UI 对话框解决 z index 问题 类似于问题无法选择或取消选择 jQuery UI 模态对话框中的复选框 https stackoverflow com questions 10542327 cant s
  • 如何在 docker 容器中运行 npm 命令?

    我正在尝试在 docker 容器内以开发模式运行角度应用程序 但是当我使用 docker compose build 运行它时 它可以正常工作 但是当我尝试放置容器时 我收到以下错误 ERROR for sypgod Cannot star
  • jackson - 具有受控精度的双精度的 json 编码

    我正在使用双值数组对复杂的 Map 结构进行编码 高精度并不重要 输出大小才是重要的 所以我试图让 JSON 工具 在本例中为 Jackson 使用提供的 DecimalFormat 序列化双精度值 以下是我的最佳镜头 但由于对象映射器未选
  • C++(Windows)中的分配数及其可预测性

    我在用 CrtDump内存泄漏 http msdn microsoft com en gb library d41t22sb aspx识别我们软件中的内存泄漏 我们在多线程应用程序中使用第三方库 这个库确实存在内存泄漏 因此在我们的测试中
  • 加载 Google 地图时出现问题 - SensorNotRequired

    我正在尝试在 WordPress 网站上运行 Google 地图 代码在此完美运行JSFIDDLE http jsfiddle net 3VKQ8 55 但是当我将其带到 WordPress 时 我收到此错误 Google 地图 API 警
  • 线程过剩: glutPostRedisplay 被忽略

    我有一个程序可以更新程序输出 然后程序的状态会发生变化 当时间计时器 不是 openGL 计时器 而是在线程中实现的 发生时 以及从 glut 注册键盘输入 使用 glutKeyboardFunc 回调 时 就会发生这种情况 这两个事件都会
  • 缓冲区和缓存的区别?

    任何人都可以详细说明 系统内存中的缓冲区和缓存有什么区别 A buffer只是一个在短时间内保存数据的容器 当在任何给定时间出现的数据多于消费者可以使用 处理的数据时 这是一种先进先出的情况 数据传入 可能会被缓冲 并在一段时间后按照传入的
  • 为什么将 PDF 转换为纯文本如此困难?

    我需要将一些 PDF 转换回文本 我尝试了很多软件和在线工具 但结果总是平庸 从技术上来说为什么这么难 我们不要假设您正在谈论的 PDF 仅包含一些位图图像 因为很明显 在这种情况下您只能诉诸 OCR 及其所有限制 我们假设文本是在手边的
  • 如何从 heroku 访问私有 github 存储库?

    我有一个私人存储库 在部署到 Heroku 时我试图访问它 但是 Heroku 不允许我克隆私有存储库 并给出以下错误 正如我所期望的 Host key verification failed fatal The remote end hu
  • C:“zsh:中止”错误

    这是我的程序 include
  • SwiftUI - 按下按钮和导航时带有错误消息的表单

    我有以下场景 我有一个文本字段和一个按钮 我需要的是在该字段为空的情况下显示一条错误消息 如果不是 则将用户导航到下一个屏幕 我尝试通过使用字段值并检查按下按钮时是否为空来有条件地显示错误消息 但是 我不知道如何导航到下一个屏幕 struc
  • 直接播放 AVSpeechSynthesizer 生成的音频缓冲区

    我们需要对输出进行音频处理AVSpeechSynthesizer 所以我们开始使用write的方法AVSpeechSynthesizer类在顶部应用处理 它的 我们目前拥有的 var synthesizer AVSpeechSynthesi
  • DOM 扩展/包装到底是什么?

    我有两个主要问题 是否扩展类似的东西Object count 什么是 DOM 包装 http perfectionkills com whats wrong with extending the dom http perfectionkil
  • 如何在启用 MFA 强制的情况下使用“aws ecr get-login”?

    我正在使用 aws cli 并且我的 IAM 用户拥有完整的管理员权限 我们公司需要 MFA 因此我的 IAM 用户有 MFA 强制策略 要使用 cli 我使用以下命令获取令牌aws sts get session token 这一切都让我
  • 如何处理react+react-router+flux中的查询参数

    我正在尝试将 Backbone Marionette 应用程序替换为 React 但在思考查询参数时遇到困难 我认为我在理解这种模式时缺少一种非常简单的平静 所以如果这个问题完全是无稽之谈 我深表歉意 我将不胜感激任何支持或只是指出我可以更
  • 端到端训练 CNN-LSTLM?

    已经有许多论文 特别是图像字幕 联合使用 CNN 和 LSTM 架构来执行预测和生成任务 然而 它们似乎都独立于 LSTM 来训练 CNN 我正在研究 Torch 和 TensorFlow 使用 Keras 但找不到为什么不能进行端到端训练