在 Keras IMDB 示例中使用字符串作为输入

2024-03-18

我正在看Keras IMDB 电影评论情感分类示例 https://keras.io/datasets/#imdb-movie-reviews-sentiment-classification (以及github上对应的模型 https://github.com/keras-team/keras/blob/master/examples/imdb_lstm.py），它学习决定评论是正面的还是负面的。

数据已经过预处理，以便每个评论都被编码为整数序列，例如评论“这部电影太棒了！”将会[11, 17, 6, 1187]对于这个输入，模型给出的输出是“正”。

该数据集还提供了用于编码序列的单词索引，即我知道地图

This: 11
movie: 17
is: 6
awesome: 1187
...

我能否以某种方式将这些知识包含到模型中，使其输入是字符串，即它根据输入“这部电影太棒了！”给出预测？

首先，神经网络的输入从来都不是字符串，它实际上是词汇表中单词（或字符）索引的列表。模型通常做的第一件事就是嵌入变换（参见这个例子 https://github.com/keras-team/keras/blob/master/examples/imdb_lstm.py）进一步将这些索引转换为（可训练的）浮点向量。

你真正的意思是数据预处理将用户的原始输入（可以是文本、图像像素、录音等）转换为适合模型且方便的格式的步骤。数据预处理就像模型本身一样是机器学习应用程序的重要组成部分，应该单独存储。如果您打算使用 imdb 数据集，则词汇表已经过预处理。您可以致电imdb.get_word_index()在 keras 中获取单词索引或者您可以使用词汇 json 文件 https://s3.amazonaws.com/text-datasets/imdb_word_index.json直接地。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Keras IMDB 示例中使用字符串作为输入的相关文章

如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
Python 上每个系数具有特定约束的多元线性回归

我目前正在数据集上运行多元线性回归起初我没有意识到我需要限制自己的体重事实上我需要有特定的正权重和负权重更准确地说我正在做一个评分系统这就是为什么我的一些变量应该对音符产生积极或消极的影响然而当运行我的模型时结果不符合我
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
旧版本的 spaCy 在尝试安装模型时抛出“KeyError: 'package'”错误

我在 Ubuntu 14 04 4 LTS x64 上使用 spaCy 1 6 0 和 python3 5 为了安装 spaCy 的英文版本我尝试运行这给了我错误消息 ubun ner 3 NeuroNER master src pyt
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat

随机推荐

我可以在android中编写一个系统属性监听器吗？

使用 setprop 命令通过 adb 在 android 中设置系统属性后有没有办法在我自己的服务中监听此更改我尝试使用 SystemProperties addChangeCallback 但没有收到通知我是否错过了什么您可以
如何在Python中将日期时间转换为整数

我怎样才能转换YYYY MM DD hh mm ss在 python 中格式化为整数例如2014 02 12 20 51 14 gt 为整数我只知道如何转换hh mm ss但不是yyyy mm dd hh mm ss def time
为什么我的 AudioQueueOutputCallback 不会被调用？

我正在使用音频队列服务 API http developer apple com library mac documentation MusicAudio Reference AudioQueueReference Reference re
Flex SDK 3.5 - 检查文件 mimetype

有没有办法在 Flex SDK 3 5 中获取文件的 mimetype 而不使用其扩展名我需要验证上传的文件是否属于某种类型这适用于图像或文档 PDF ODT 等我找到的所有解决方案都是通过检查其扩展名来实现的如果我将 odt 文件
BigBlueButton 集成 - “由于缺少凭据，身份验证失败。”

我们正在考虑将 BigBlueButton 集成为我们现有网站的一部分所以我们尝试了以下可用的 APIhttps mconf github io api mate https mconf github io api mate 特别是我们
如何调用`function`函数？

我正在尝试调用该函数 function 在 R 代码中定义函数众所周知 function is a Primitive所用的内部当用户使用常规语法时通过 R 来定义函数即 mean1 function x base mean x 但没
exec-maven-plugin 生成的进程会阻止 maven 进程

我正在尝试使用 maven 执行以下场景 pre integration phase 使用主类启动基于 java 的应用程序使用 exec maven plugin Integration phase 运行集成测试用例使用 maven
错误：在“&”标记|之前应有“;”、“,”或“)”在网上找到的一个简单的C程序[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在网上找到了这个程序来练习 C 当我尝试在代码块中编译这个程序时我在两个地方收到此错误错误预期或 before token 代码
尝试安装 pygame 时元数据生成失败[重复]

这个问题在这里已经有答案了尝试使用以下命令 pip install pygame 在 python 3 11 上安装 pygame 但出现以下错误注意此错误源自子进程并且可能不是 pip 的问题错误元数据生成失败生成包元数据时
直接调用__init__的目的是什么？

我很难弄清楚我遇到的一些代码的用途代码有一个类Foo 其中有一个 init 带有多个参数的方法根据我迄今为止对 Python 的了解通过调用Foo bar 它将将此字符串作为参数传递给 init 我认为这应该相当于构造函数但我遇到的
node-webkit 中的 Require('jquery-ui') 会产生导航器未找到错误

我已经安装了jquery and jquery ui通过 npm 我的 node webkit 项目我也有一个index html它在启动时由 node webkit 加载并加载core js This core js两者都需要jque
.vimrc：获取 E474：无效参数：listchars=tab：无论我做什么

使用自定义 vimrc 文件加载 vim 时出现错误 Error E474 Invalid argument listchars tab 我尝试了很多事情包括将这些行放入我的文件中 scriptencoding utf 8 set enc
您能帮助我在实际示例中理解抽象类与接口的用法吗？

您能否让我对抽象类与继承的使用有一个几乎过于简单化的理解并帮助我以便我能够真正理解这个概念以及如何实现我有一个想要完成的项目但不知道如何实施我一直在和我的教授聊天他经常责备我说如果我无法弄清楚我可能还没有准备好学习这门课程
使用 awk 根据条件比较两个文件

我有两个文件 1 txt j e s s i c a a n n email protected cdn cgi l email protection 61b8a203438ea1c56c1489ec7bea7a0e 9871951 ema
DHL 追踪 API 和 PHP

我目前正在开展一个项目我必须获取数据包的状态通过 DHL 发送我读到过有关 DHL API 的内容它返回 XML 但不知何故没有好的示例我找到了一些代码片段但我不知道在哪里注册 API 密钥有人给我一些链接或例子吗此致卢卡
如何解决 Angular 更新问题冲突的对等依赖：@angular/[email protected]

我尝试使用官方升级指南将当前的 Angular 12 应用程序更新到 13 但失败了我不确定问题是什么坦率地说我不认为 npm 错误消息是不言自明的这是输出 PS C Projects frontend gt npx ng upda
Google Drive SDK“sharedWithMe = false”搜索查询不起作用

我正在尝试获取我的云端硬盘中的文件夹列表并请求 https www googleapis com drive v2 files https www googleapis com drive v2 files 使用此搜索查询 mimeTy
Lua 表.concat

有没有办法使用table concat的arg 2值来表示当前表索引 eg t t 1 a t 2 b t 3 c X table concat t n 表 concat X 的所需输出 1 a n2 b n3 c n 简单的回答不 ta
C# 让 Android 手机振动 100 毫秒

上周我在手机上尝试了一些游戏发现有些游戏使用了振动 as a feedback 对于玩家来说当事情发生时例如玩家crashed撞到墙上玩家做了一次完美的发射玩家获得了大奖等等我真的很喜欢给手机一点震动或轻微摇晃基本上可以告
在 Keras IMDB 示例中使用字符串作为输入

我正在看Keras IMDB 电影评论情感分类示例 https keras io datasets imdb movie reviews sentiment classification 以及github上对应的模型 https githu

在 Keras IMDB 示例中使用字符串作为输入

在 Keras IMDB 示例中使用字符串作为输入 的相关文章

随机推荐

热门标签

在 Keras IMDB 示例中使用字符串作为输入的相关文章