检查语言模型的困惑度

2024-06-24

我使用 Keras LSTM 创建了一个语言模型，现在我想评估它是否良好，因此我想计算困惑度。

在 Python 中计算模型的困惑度的最佳方法是什么？

我已经提出了两个版本并附上了相应的来源，请随时查看链接。

def perplexity_raw(y_true, y_pred):
    """
    The perplexity metric. Why isn't this part of Keras yet?!
    https://stackoverflow.com/questions/41881308/how-to-calculate-perplexity-of-rnn-in-tensorflow
    https://github.com/keras-team/keras/issues/8267
    """
#     cross_entropy = K.sparse_categorical_crossentropy(y_true, y_pred)
    cross_entropy = K.cast(K.equal(K.max(y_true, axis=-1),
                          K.cast(K.argmax(y_pred, axis=-1), K.floatx())),
                  K.floatx())
    perplexity = K.exp(cross_entropy)
    return perplexity

def perplexity(y_true, y_pred):
    """
    The perplexity metric. Why isn't this part of Keras yet?!
    https://stackoverflow.com/questions/41881308/how-to-calculate-perplexity-of-rnn-in-tensorflow
    https://github.com/keras-team/keras/issues/8267
    """
    cross_entropy = K.sparse_categorical_crossentropy(y_true, y_pred)
    perplexity = K.exp(cross_entropy)
    return perplexity

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras

NLP

LSTM

languagemodel

perplexity

检查语言模型的困惑度的相关文章

如何使用WordNet或与wordnet相关的类别来实现基于类别的文本标记？

如何使用wordnet按单词类别标记文本 java作为接口 Example 考虑以下句子 1 计算机需要键盘显示器 CPU才能工作 2 汽车使用齿轮和离合器现在我的目标是例句必须标记为第 1 句话电脑电子键盘电子中央处理器电
使用 NLTK 生成字典以将推文分类为预定义类别

我有一个 Twitter 用户 screen names 列表我需要根据他们的兴趣领域将他们分为 7 个预定义类别教育艺术体育商业政治汽车技术我用 Python 提取了用户的最后 100 条推文并在清理推文后为每个用户创
如何使用 Keras 中的 Conv2D 在 5D 张量的最后三个维度上应用卷积？

通常的输入张量Conv2DKeras 中是一个 4D 张量其维度为batch size n n channel size 现在我有一个 5D 张量其尺寸为batch size N n n channel size我想对中的每个 i 应用
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
为什么 scikit learn 的平均精度分数返回 nan？

我的 Keras 模型旨在接收两个输入时间序列将它们连接起来通过 LSTM 提供它们并在下一个时间步骤中进行多标签预测有 50 个训练样本每个样本有 24 个时间步每个样本有 5625 个标签有 12 个验证样本每个样本有
Tensorboard 和 Dropout 层

我有一个非常基本的查询我制作了 4 个几乎相同差异在于输入形状的 CNN 并在连接到全连接层的前馈网络时合并了它们几乎相同的 CNN 的代码 model3 Sequential model3 add Convolution2D 32
有人可以简单解释一下自然语言处理的要素吗？

我是自然语言处理的新手对所使用的术语感到困惑什么是代币化 POS 标签实体识别标记化只是将文本分割成可以有意义的部分或为这些部分赋予含义以及含义当我确定某物是名词动词或形容词时它的名字是什么如果我想分为日期姓名货币呢
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
Pytorch LSTM：计算交叉熵损失的目标维度

我一直在尝试在 Pytorch 中使用 LSTM LSTM 后跟自定义模型中的线性层但在计算损失时出现以下错误 Assertion cur target gt 0 cur target lt n classes failed 我用以下函数
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
python nltk从句子中提取关键字

我们要做的第一件事就是杀掉所有律师威廉莎士比亚鉴于上面的引用我想退出 kill and lawyers 作为两个突出的关键词来描述句子的整体含义我提取了以下名词动词 POS 标签 First NNP thing NN do V
获取 Keras model.summary() 作为表

我在 Keras 中创建了相当大的模型我正在用 LaTeX 写一篇关于它的文章为了很好地描述 LaTeX 中的 keras 模型我想用它创建一个 LaTeX 表我可以手动实现它但我想知道是否有任何更好的方法来实现这一点我四处
ValueError：形状（无，1）和（无，2）不兼容

我正在训练面部表情愤怒与快乐模型最后一个密集输出层以前为 1 但当我预测图像时它的输出始终为 1 准确度为 64 所以我将其更改为 2 表示 2 个输出但现在我收到这个错误 Epoch 1 15 ValueError Traceb
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size
法语文本上的 NLTK word_tokenize 无法正常工作

我正在尝试使用 NLTKword tokenize中的一段文字French通过使用 txt Le t l travail n aura pas d effet sur ma vie print word tokenize txt langu
Keras 均方误差损失层

我目前正在实现一个自定义损失层在此过程中我偶然发现了 Objectives py 文件 1 中均方误差的实现我知道我对这种损失计算的理解遗漏了一些东西因为我一直认为平均值是在每个小批量张量的轴 0 中的每个输出的样本之间单独完成的
如何使用自定义数据生成器进行 keras 图像增强？

我正在使用 Keras 自定义生成器我想对从自定义数据生成器返回的数据应用图像增强技术我想要这些图像增强技术 ImageDataGenerator rotation range 40 width shift range 0 2 heig
安装 Visual Studio 19 时找不到 Visual Studio 17

我使用的是 win 10 Anaconda 4 8 3 和 Python 3 7 4 在 C Program Files x86 Microsoft Visual Studio 2019 BuildTools 下我有 SDK 以下是我看到的

随机推荐

如何修复“在 null 上调用 getter“文档””。颤动中

我正在使用 flutter 和 firebase 创建移动应用程序我的 Firestore 上有 2 个集合我想阅读集合帖子中的所有文档但是当我这样做时出现错误指出 getter 文档被调用为 null Widget ge
如何在 TypeScript 中创建动态对象

有没有办法在 TypeScript 中定义动态对象类型在下面的示例中我想通过以下方式定义我的复杂类型的类型我的复杂类型类型的对象是具有任意数量的属性的对象但这些属性的值必须是 IValue 类型 value interfa
始终加密功能 - 无法解密列。从 Windows 服务应用程序调用

NET 框架版本 4 6 2 数据库 SQL Server 2016 应用程序类型 Windows 服务我们正在研究 SQL 2016 数据库中的始终加密功能以对某些客户数据列执行加密我们的 Web 应用程序是在 ASP NET
如何使用 SwiftUI 动态添加联系人等文本字段？

I have a form where I d like the user to add any amount of promo codes The closest native example of this is in the Cont
批处理文件运行 npm start

我有一个角度应用程序可以使用命令启动npm start在控制台中现在我想创建一个批处理文件在启动时执行 npm install 这是我创建的批处理文件前端 bat cd
数组赋值异常：无法将类型“int”隐式转换为“string”并且两次：

我需要将结果分配给数组但是当我使用此代码时遇到问题 string result null result new string 10 int num 0 int id Convert ToInt32 textReader GetAttrib
Kubernetes 入口控制器 - 无法从外部虚拟机进行 TCP 连接，网络流量未转发到“服务”端口

我有 Azure Kubernetes 服务集群并且在集群外部有来自不同虚拟网络的虚拟机我尝试从该虚拟机连接到在 TCP 端口 9000 上运行的容器 Pod 应用程序我不能使用公共 IP 这不是 HTTP连接但我需要使用 TCP
C++ - 复制赋值运算符被隐式删除

我尝试在以下情况下使用复制分配有两个模板类 list map and xpair template
R 中 Tomek 链接的快速计算

我想实现 tomek 的链接来处理不平衡数据此代码用于二分类问题其中 1 类是多数类 0 类是少数类 X 为输入 Y 为输出我已经编写了以下代码但我正在寻找一种加快计算速度的方法我该如何改进我的代码 remove overlapp
是否可以检测浏览器何时使用后备字体而不是 CSS 中指定的主要字体？

如果在文本字段中输入字符并且当前应用的字体不支持该字符则为该字符使用备份字体是否可以通过 Javascript 或其他方式判断这种情况何时发生尝试创建一个脚本如果字体不支持某个字符则会警告用户感谢您的帮助这听起来像是一份类似的
ggplot.data.frame 中的错误：应使用 aes 或 aes_string 创建映射

我在从 a 中提取路径时遇到问题ggplot并且遇到错误下面给出的图像解释了我正在寻找的结果在图像编辑器中完成以解释目的假设图 1 是我的原始图我正在寻找的是将第一个点作为 F 点并从该点出发 24 小时行驶 Des gt mut
重构：从自定义数据访问层切换到实体框架

我是一名 NET 开发人员作为重构项目的一部分我有几个问题我们的软件当前使用 Active Record 模式数据对象和业务对象之间的一对一映射不好的是业务对象继承自数据对象导致层之间的高度耦合我们的目标是从自定义数据访问层
有一个更好的方法吗？ VBA脚本

我这里有一份供料泵的跟踪清单我们必须考虑库存水平所以我做了这个当您将泵输入表中时什么也没有发生当您将患者姓名放在上面时该行会变成粉红色表明该泵已离开我们的库存我试图将一个脚本宏放在一起可以计算我们仍然拥有的泵即白色行
SlickGrid - 默认情况下控件可见的可编辑网格

SlickGrid 支持单元格编辑器可以将其配置为单击或双击时显示但是我没有看到编辑器默认对所有单元格可见的选项而无需单击双击单元格是否可以在编辑器所在的光滑网格中支持编辑器所有单元默认为 init 有已知的解决方法吗谢谢
如何从 kivy 小部件画布中删除特定指令？

我正在编写一个基于 kivy 的图形应用程序我可以在其中动态地将节点添加到绘图区域然后用有向线边缘连接它们节点可以在绘图区域内拖动并且边缘应始终与它们保持连接 Edge 类派生自 Widget 类它的图形表示由两部分组成线本
2个选择器，2个不同的事件，相同的功能

我正在使用 jQuery 1 7 需要将相同的函数绑定到 2 个不同选择器上的 2 个不同实时事件例如 function do something this do something with this alert test input
字体在 Android Studio 预览中更改，但在模拟器/设备中未更改

我正在尝试更改文本视图复选框按钮和 android support design widget TextInputLayout 的默认字体为了清楚地说明我设置了 android fontFamily gt cursive 它似乎在
有没有办法保护 python 中的内置函数？

我的问题源于这个问题 https stackoverflow com questions 6828722 python set to list 其中用户因不知不觉地重新绑定内置全局而感到困惑set 当您尝试覆盖内置函数时有没有一种简单的方
回发后 JavaScript 不工作 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在 asp net Web 应用程序上使用引导组件它工作正常但奇怪的是它们在页面回发后停止工作外表很好但行为却不好这就
检查语言模型的困惑度

我使用 Keras LSTM 创建了一个语言模型现在我想评估它是否良好因此我想计算困惑度在 Python 中计算模型的困惑度的最佳方法是什么我已经提出了两个版本并附上了相应的来源请随时查看链接 def perplexity raw

检查语言模型的困惑度

检查语言模型的困惑度 的相关文章

随机推荐

热门标签

检查语言模型的困惑度的相关文章