Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>)

2024-01-18

我正在创建一个接受过训练的聊天机器人康奈尔电影对话语料库 https://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html using NMT https://github.com/tensorflow/nmt.

我的代码部分基于https://github.com/bshao001/ChatLearner https://github.com/bshao001/ChatLearner and https://github.com/chiphuyen/stanford-tensorflow-tutorials/tree/master/assignments/chatbot https://github.com/chiphuyen/stanford-tensorflow-tutorials/tree/master/assignments/chatbot

在训练期间，我打印从批次中馈送到解码器的随机输出答案以及我的模型预测的相应答案以观察学习进度。

我的问题：仅经过大约 4 次迭代训练后，模型就学会了输出 EOS 代币（<\s>）对于每个时间步长。即使训练仍在继续，它也始终将其输出作为其响应（使用 logits 的 argmax 确定）。模型偶尔会输出一系列周期作为答案，但这种情况很少发生。

我还在训练期间打印前 10 个 logit 值（不仅仅是 argmax），以查看其中是否有正确的单词，但它似乎是在预测词汇中最常见的单词（例如 i、you、?、. ）。即使是这前 10 个单词在训练过程中也没有太大变化。

我已确保正确计算编码器和解码器的输入序列长度，并添加了 SOS (<s>）和 EOS（也用于填充）相应的代币。我也表演masking在损失计算中。

这是一个示例输出：

训练迭代 1：

Decoder Input: <s> sure . sure . <\s> <\s> <\s> <\s> <\s> <\s> <\s> 
<\s> <\s>
Predicted Answer: wildlife bakery mentality mentality administration 
administration winston winston winston magazines magazines magazines 
magazines

...

训练迭代 4：

Decoder Input: <s> i guess i had it coming . let us call it settled . 
<\s> <\s> <\s> <\s> <\s>
Predicted Answer: <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s> 
<\s> <\s> <\s> <\s> <\s> <\s> <\s> <\s>

经过几次迭代后，它决定只预测 EOS（很少预测某些时期）

我不确定是什么导致了这个问题，并且已经被困在这个问题上一段时间了。任何帮助将不胜感激！

Update:我让它训练超过十万次迭代，但它仍然只输出 EOS（和偶尔的周期）。经过几次迭代后，训练损失也没有减少（从一开始就保持在 47 左右）

最近我也在研究seq2seq模型。我以前遇到过你的问题，就我而言，我通过更改损失函数来解决它。

你说你用面膜，所以我猜你用tf.contrib.seq2seq.sequence_loss就像我一样。

我改为tf.nn.softmax_cross_entropy_with_logits，并且它可以正常工作（并且计算成本更高）。

（编辑 05/10/2018。请原谅，我需要编辑，因为我发现我的代码中有一个严重的错误）

tf.contrib.seq2seq.sequence_loss可以很好地工作，如果形状logits ,targets , mask是对的。正如官方文档中定义的：tf.contrib.seq2seq.sequence_loss https://www.tensorflow.org/api_docs/python/tf/contrib/seq2seq/sequence_loss

loss=tf.contrib.seq2seq.sequence_loss(logits=decoder_logits,
                                      targets=decoder_targets,
                                      weights=masks) 

#logits:  [batch_size, sequence_length, num_decoder_symbols]  
#targets: [batch_size, sequence_length] 
#weights: [batch_size, sequence_length]

嗯，即使形状不符合，它仍然可以工作。但结果可能很奇怪（很多#EOS #PAD...等）。

自从decoder_outputs，以及decoder_targets可能具有与所需相同的形状（在我的例子中，我的decoder_targets有形状[sequence_length, batch_size]）。所以尝试使用tf.transpose帮助您重塑张量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>) 的相关文章

中断 Select 以添加另一个要在 Python 中监视的套接字

我正在 Windows XP 应用程序中使用 TCP 实现点对点 IPC 我正在使用select and socketPython 2 6 6 中的模块我有三个 TCP 线程一个读取线程通常会阻塞select 一个通常等待事件的写入线程
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
需要在python中找到print或printf的源代码[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在做一些我不能完全谈论的事情我
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside

随机推荐

iOS5.1：同步任务（等待完成）

我在同步 openWithCompletionHandler UIManagedDocument 与主要活动时遇到一个基本问题情况我有一个管理共享 UIManagedDocument 的单例类这个类提供了一种应该交付的方法the文档处
如何在 Android 模拟器中安装 .apk 文件？ [复制]

这个问题在这里已经有答案了我想在 android 模拟器中安装我的 apk 文件但是我打开了多个模拟器 5554 5556 并且我不想关闭任何一个模拟器当有多个模拟器时如何在模拟器中安装 apk 文件模拟器打开了吗你可以告诉adb您
获取 play.api.libs.json.JsValue 的所有键

我必须存储play api libs json JsValue列表的键我如何做到这一点 var str json String val json JsValue Json parse str val data json data prin
使用 sort() 对 unordered_map 进行排序 [重复]

这个问题在这里已经有答案了我正在尝试排序unordered map using sort 函数但我不断收到编译器错误有人可以帮忙吗 bool comp pair
MVC路由静态文件

我正在使用一个旧版 swf 文件该文件在控制器操作路由中查找静态路由例如它正在尝试下载文件 http localhost 59801 Resource Details ClearExternalPlaySeekMute swf 当文
Android Studio：编译器发生异常（1.8.0_152-release）

运行应用程序时无法完成编译继续抛出错误我正在使用 dagger2 库进行注释错误 15 04 36 466 错误 system err 编译器 1 8 0 152 release 中发生异常请针对以下错误提交错误 Java 编译器
XCode“上传期间发生错误，rsync：失败”

The last archives I ve made turn out into this error 日志显示此信息此日志中省略了应用程序名称和路由 2016 06 28 08 53 48 0000 MT Upload failed
如何发送到 Zend Framework 的自定义错误页面？

我有可以被阻止的成员当成员被阻止时我想将它们发送到自定义错误页面我将如何在 zend 框架中做到这一点我试过 throw new Zend Controller Dispatcher Exception Your message he
如何将此平板电脑注册到 Ubuntu udev 列表？

我有一台便宜的 Android 平板电脑我需要用它来测试上面的应用程序我使用的是 Ubuntu 所以我首先必须将设备添加到udev list 我连接了平板电脑但是adb没有看到它 adb devices List of devices
如何跨 Django 视图维护 LDAP 身份验证？

目前的情况如下我创建了一个登录 html我在表单中输入用户名和密码的页面在我的views py我获取 POST 数据并使用用户名和密码对我的 LDAP 服务器进行身份验证机制有效如果用户名密码错误我将被重定向回登录页面并显示错误
用于aws s3的python boto，如何获取存储桶中的排序和有限文件列表？

如果存储桶上的文件太多而我只想获取 100 个最新文件我怎样才能只得到这些列表 s3 bucket list http boto readthedocs org en latest ref s3 html boto s3 bucket
全局 Sass 导入和使用 - Nuxt 3 静态资产

我正在尝试从以下位置导入全局 Sass 样式表 assets目录并使用在整个组件中定义的变量和混入等内容我的nuxt config ts目前看起来像这样 import defineNuxtConfig from nuxt3 export
Knockout Observable 和 Google Chrome 自动填充问题

基本上我在登录表单上有一个登录按钮可以与 jQuery 1 8 3 我尝试过 1 9 0 和 Knockout 2 2 1 可观察对象一起正常工作以及用于启用禁用登录按钮的绑定当计算函数发现缺少用户名或密码时启用按钮将被禁用但
Swift：如何从 Objective-C 调用类别或类方法

我有一个类别UIImage这是用 Objective C 编写的以下是一些示例方法如何在 Swift 中调用这些方法 UIImage imageOrPDFNamed NSString resourceName UIImage image
为什么 Internet Explorer 11 无法识别 HTML 中的条件注释？现在不支持了吗？

我想在不同的浏览器上显示不同的内容我使用了 Internet Explorer 11 和 Google Chrome 39 但是在 Internet Explorer 和所有其他浏览器中都会显示不是 Internet Explore
将价目表从 Excel 复制并粘贴到浏览器

我有一个客户希望能够从 Excel 复制一系列单元格并将其粘贴到 Web 浏览器中它基本上是一列中的产品代码和另一列中的价格我希望能够将其作为表单提交以便对其进行一些 php 表单处理有没有办法可以实现这一点他想要复制和粘贴而不
当 onClick 监听器存在时如何检测运动事件？

我有一个ListView with onItemClick 方法现在我想检测屏幕中的触摸动作实施onTouchEvent 在这种情况下不起作用因为我已经编写了一个点击侦听器那么请帮我看看该怎么做我需要点击监听器和onTouchEv
如何在 iOS 中识别使用来自 esim 或物理 sim 的移动数据的用户

我想知道用户在 iOS 中使用来自 esim 或物理 sim 的移动数据以及哪张 sim 卡处于活动状态您可能可以从 Apple 获得此信息private仅 API 使用CTCellular但这绝对不是建议除非您是运营商并且有权使用
Kotlin 扩展函数突然需要 api 级别 24

我刚刚注意到这个 lint 错误调用需要 API 级别 24 当前最低为 19 java util map foreach 当我在 Kotlin 中的 MutableMap 上使用扩展函数 forEach 时当我写这行代码时并没有发生这
Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>)

我正在创建一个接受过训练的聊天机器人康奈尔电影对话语料库 https www cs cornell edu cristian Cornell Movie Dialogs Corpus html using NMT https github

Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>)

Seq2Seq 模型在几次迭代后学会仅输出 EOS 令牌 (<\s>) 的相关文章

随机推荐

热门标签