为什么我的 keras LSTM 模型陷入无限循环？

2024-04-10

我正在尝试构建一个小型 LSTM，它可以通过在现有 Python 代码上进行训练来学习编写代码（即使是垃圾代码）。我已将数百个文件中的数千行代码连接到一个文件中，每个文件以<eos>表示“序列结束”。

例如，我的训练文件如下所示：


setup(name='Keras',
...
      ],
      packages=find_packages())
<eos>
import pyux
...
with open('api.json', 'w') as f:
    json.dump(sign, f)
<eos>

我正在用以下单词创建令牌：

file = open(self.textfile, 'r')
filecontents = file.read()
file.close()
filecontents = filecontents.replace("\n\n", "\n")
filecontents = filecontents.replace('\n', ' \n ')
filecontents = filecontents.replace('    ', ' \t ')

text_in_words = [w for w in filecontents.split(' ') if w != '']

self._words = set(text_in_words)
    STEP = 1
    self._codelines = []
    self._next_words = []
    for i in range(0, len(text_in_words) - self.seq_length, STEP):
        self._codelines.append(text_in_words[i: i + self.seq_length])
        self._next_words.append(text_in_words[i + self.seq_length])

My keras型号是：

model = Sequential()
model.add(Embedding(input_dim=len(self._words), output_dim=1024))

model.add(Bidirectional(
    LSTM(128), input_shape=(self.seq_length, len(self._words))))

model.add(Dropout(rate=0.5))
model.add(Dense(len(self._words)))
model.add(Activation('softmax'))

model.compile(loss='sparse_categorical_crossentropy',
              optimizer="adam", metrics=['accuracy'])

但无论我如何训练它，该模型似乎永远不会生成<eos>甚至\n。我想这可能是因为我的 LSTM 大小是128 and my seq_length是 200，但这不太有意义？我有什么遗漏的吗？

有时，当没有limit for code generation or the <EOS> or <SOS> tokens are not numerical tokensLSTM 永远不会收敛。如果您可以发送输出或错误消息，那么调试会容易得多。

您可以创建一个额外的类来获取单词和句子。

# tokens for start of sentence(SOS) and end of sentence(EOS)

SOS_token = 0
EOS_token = 1


class Lang:
    '''
    class for word object, storing sentences, words and word counts.
    '''
    def __init__(self, name):
        self.name = name
        self.word2index = {}
        self.word2count = {}
        self.index2word = {0: "SOS", 1: "EOS"}
        self.n_words = 2  # Count SOS and EOS

    def addSentence(self, sentence):
        for word in sentence.split(' '):
            self.addWord(word)

    def addWord(self, word):
        if word not in self.word2index:
            self.word2index[word] = self.n_words
            self.word2count[word] = 1
            self.index2word[self.n_words] = word
            self.n_words += 1
        else:
            self.word2count[word] += 1

然后，在生成文本时，只需添加一个<SOS>令牌就可以了。您可以使用https://github.com/sherjilozair/char-rnn-tensorflow https://github.com/sherjilozair/char-rnn-tensorflow，一个字符级别rnn供参考。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我的 keras LSTM 模型陷入无限循环？的相关文章

TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
使用 Conda 更新特定模块会删除大量软件包

我最近开始使用 Anaconda Python 发行版因为它提供了许多开箱即用的数据分析库使用 conda 创建环境和安装软件包也轻而易举但是当我想更新 Python 本身或任何其他模块时我遇到了一些严重的问题我事先被告知我的很多
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60

随机推荐

Python：使用正则表达式获取列表索引？

在Python中如何获取列表中项目的位置使用list index 使用模糊匹配例如如何获取以下形式的所有水果的索引 berry在下面的列表中 fruit list raspberry apple strawberry Is it p
如何处理文件名中的破折号

在装有 Windows 7 的 PC 上我使用一个简单的批处理脚本来重命名一些 Excel 文件并在其父文件夹名称前面添加 for f delims i in dir b AD do cd i for f delims j in dir
如何将控制台输出发送/拆分/复制到 R 中的变量中？

如何将某些代码的输出放入变量中我希望该输出仍然发送到控制台我更喜欢sink符号我不想使用capture output有两个原因它要求相应的代码是单个函数我不想通过创建函数来捕获输出来使我的代码复杂化它不允许捕获的输出仍然进入控制
PHP - getimagesize() 重定向不起作用

问题 getimagesize 对于某些 URL 不起作用尤其是重定向的 URL 我用谷歌搜索并检查了 stackoverflow 但无济于事这是我在本地计算机上看到的内容 var dump getimagesize http gan
VB6 应用程序调用 .NET DLL OutOfMemory 异常

我们有一个调用 NET DLL 的 VB6 应用程序有时在 VB6 应用程序运行很长时间并多次调用 NET 代码后 NET 方面会抛出 OutOfMemory 异常即使计算机上有足够的可用内存 VB6 的内存空间也远未达到极限 NET
lapply-ing 与“$”函数

我正在经历一些例子 https github com hadley devtools wiki Functionals exercises 1在哈德利的泛函指南中遇到了一个意想不到的问题假设我有一个模型对象列表 x 1 3 y 3 1
使用 Multipart/Form-Data Enctype 进行表单验证失败后，Struts 1 丢失请求参数

我有一个简单的 Struts 表单它有几个文本字段和一个文件字段这enctype is multipart form data在我的表格上我在中验证actionform的验证方法如果文本字段为空我会返回错误是必要的除了可见字
如何在 R 中查找 DTM 中的术语频率？

我一直在使用 tm 包创建 DocumentTerm 矩阵如下所示 library tm library RWeka library SnowballC src lt DataframeSource data frame data3 Jo
$Proxy$_$$_Weld$EnterpriseProxy$ 代理子类是如何实现的？

在 Java EE 7 应用程序中假设我有一个会话 bean 类 Stateless public class MyEJB 在 Glassfish 4 下调试时我可以看到一个名为MyEJB Proxy Weld EnterprisePr
在处理 Angular2-typescript 项目时如何在 WebStorm 中隐藏 .js 和 .map 文件

我尝试将扩展添加到 gitignore但结果如下这些文件并未完全隐藏在没有内置 TypeScript 编译器的情况下使用 WebStorm 时例如因为您正在使用其npm start已经完成编译的脚本并且其他方法不起作用您可以为
JavaScript 中的原型继承到底是如何工作的？

我仍然没有完全理解 JavaScript 中的继承二分法原型与经典 If the class只是原型上的语法糖我应该如何去糖化它您可以向我展示使用类和原型创建 React 元素的不同方法即没有class React createCl
添加批准 Instagram 客户端的功能

我有一个经过批准的 Instagram 客户端即我的应用程序已通过审核并已上线并且我想向应用程序添加新功能我听说一些应用程序的客户被撤销我想知道我可以在将新功能投入生产之前主动提交新功能以获得批准吗有人对这个有经验么我只是想避
在 twitter-bootstrap 中居中模态

我无法将我的模态集中在各种尺寸的 twitter bootstrap 中你可以看活生生的例子here http makeshot net v 97dcd3c and here http makeshot net v 3f467c0 只需点
在 Prawn 中使用堆叠边界框时自动启动新页面

我想在 Prawn 中模拟表格的行为但无法使用表格因为我可以在单元格内绘制的内容受到限制因此我使用边界框来为每行内的元素创建上下文我遇到的问题与行有关我正在尝试这个 require prawn Prawn Document ge
如何在 EF-Code-First 中指定主键名称

我正在使用实体框架 Codefirst 来创建我的数据库当我通过 ODBC 连接到 Access 2007 时模式名称为 dbo pk Jobs 的默认主键似乎扰乱了它如果我手动编辑名称并删除架构名称并将该主键重命名为 pk jobs
Jekyll 2.1 中的 SCSS @import

我有这个项目结构 Project css main scss sass base layout pages vendor 我的 main scss 文件的内容 import sass base reset import sass base
Apache 正在将文件夹重定向到同名的 .html 文件

我正在尝试将 404 json fales 重定向到 404 json 以作为内容但 apache 正在将文件夹重定向到具有相同文件夹名称的 html 文件并且任何自定义 404 json 重定向都会失败文件结构示例1 示例2 e
Python 集合与列表

在Python中哪种数据结构更高效更快假设顺序对我来说并不重要并且无论如何我都会检查重复项那么 Python 集比 Python 列表慢吗这取决于您打算用它做什么在确定某个对象是否存在于集合中时集合的速度要快得多如x in
Typescript 重写抽象方法，该方法返回 void

abstract class Base abstract sayHello void class Child extends Base sayHello return 123 抽象方法的返回类型是void但我可以用数字类型返回来实现它我没
为什么我的 keras LSTM 模型陷入无限循环？

我正在尝试构建一个小型 LSTM 它可以通过在现有 Python 代码上进行训练来学习编写代码即使是垃圾代码我已将数百个文件中的数千行代码连接到一个文件中每个文件以

为什么我的 keras LSTM 模型陷入无限循环？

为什么我的 keras LSTM 模型陷入无限循环？ 的相关文章

随机推荐

热门标签

为什么我的 keras LSTM 模型陷入无限循环？的相关文章