初始化词汇表外 (OOV) 标记

2024-03-20

我正在为 NLP 任务构建 TensorFlow 模型，并且使用预训练的 Glove 300d 词向量/嵌入数据集。

显然，有些标记无法解析为嵌入，因为它们没有包含在词向量嵌入模型的训练数据集中，例如罕见的名字。

我可以用 0 向量替换这些标记，但我更愿意以某种方式对其进行编码并将其包含到我的训练数据中，而不是将这些信息丢弃在地板上。

比如说，我有“raijin”单词，它无法解析为嵌入向量，那么与 Glove 嵌入数据集一致地对其进行编码的最佳方法是什么？将其转换为 300d 矢量的最佳方法是什么？

谢谢。

而不是分配所有Out of Vocabulary共同的令牌UNK向量（零），最好为它们分配一个唯一的随机向量。至少这样，当你发现它们与任何其他单词之间的相似性时，它们中的每一个都是唯一的，并且模型可以从中学习一些东西。在里面UNK case，它们都是相同的，因此所有 UNK 单词将被视为具有相同的上下文。

我尝试了这种方法，结果准确率提高了 3%Quora Duplicate question pair detection数据集使用LSTM model.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Embedding

wordembedding

初始化词汇表外 (OOV) 标记的相关文章

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
使用两个图像的平方差作为张量流中的损失函数

我正在尝试使用两个图像之间的 SSD 作为我的网络的损失函数 h fc2 is my output layer y is my label image ssd tf reduce sum tf square y h fc2 train st
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每

随机推荐

将自签名 XAP 部署到 Windows Phone 8

我们为 WP8 开发了一个应用程序并希望通过 XAP 文件的下载 URL 在内部分发它到目前为止我们已采取的步骤使用Makecert exe生成带有XXX pvk的自签名XXX cer 无密码使用 Pvk2Pfx exe 创建一个包
jquery ajax加载覆盖插件[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
没有 Sql Alchemy 引擎的 Dataframe 到 sql

我有一个数据框 id value name 1 100 sam 2 766 abc 3 234 qqq 4 435 ppp 5 345 mmm 我想将此表保存到 SQL Server 数据库表 tab1 中我可以df to sql 但当我
在特定日期使用 CSS 更改背景？

有谁知道如何在特定日期使用 CSS 自动更改网站的背景比如情人节复活节圣诞节等为此您必须使用 PHP 或 JavaScript 等服务器端语言例如使用 PHP 您可以使用以下命令访问服务器日期时间date http php
在另一个线程中运行异步函数

我正在评估异步 CTP 如何开始在另一个线程池的线程上执行异步函数 static async Task Test Do something await something static void Main string args Is th
如何在 Firebase 文件上设置 Access-Control-Allow-Origin

我正在尝试设置Access Control Allow Origin to 在某个文件上这是我的 firebase json 文件 database rules database rules json hosting public pub
Xunit 以下构造函数参数没有匹配的夹具数据

在使用 XUnit for NET 1 0 框架 net46 时我不断收到此错误以下构造函数参数没有匹配的夹具数据我看过这个帖子收集装置不会注入 https stackoverflow com questions 32319903
使用 mmap 逐行读取文件

我有一个程序可以逐行读取大小不同的文件我想使用 mmap 但如何使用它来逐行读取文件谢谢您的回答一旦你有mmap 编辑文件后您可以使该文件可用于合适的流缓冲区从现有内存中读取数据然后使用std getline include
如何抑制 Qt Creator 中的警告

我想知道是否可以在 Qt Creator 中抑制编译器特定的警告我的 g 4 5 打印警告条件表达式中的枚举和非枚举类型我想摆脱它因为它非常烦人乌班图 11 04 x64 g 4 5 QtCreator 2 01 Qt 4 7
库类（来自 Android sdk）取决于程序类（同样，Android sdk）

我们正在从 Android Gradle 插件 2 3 3 迁移到 Gradle 插件 3 0 1 我们的应用程序由应用程序模块和库模块组成多个依赖项是可传递的使用api关键字但甚至使用implementation没有帮助全部更改后
如何对包含空元素的对象数组进行排序？

在我的程序中有一个数组fClasses创建固定长度 7 个对象每个对象都是一个类FClass其中包含 3Strings an int 和int 这些值是从 txt 文件中读取的并根据该值添加到数组的特定索引中 int txt 文件中的条
为回归方程选择适当的滞后以及如何解释 VARselect 结果

我的问题有两个方面如何为回归方程选择合适的滞后我有房价的因变量以及租金房屋供应国家股市指数抵押贷款利率和房屋空置率的自变量我读了一些书发现VARselect data lag max 1 or 2 or 3 etc 可以帮助
ASP.NET Core应用程序设置生产SSL证书

我可以在我的开发盒上运行得很好但不能在产品中运行我在我的域服务器上安装了 SSL 证书如何告诉我的 ASP NET Core 应用程序使用哪个证书我想我需要添加一些东西让它知道我问是因为目前我得到无法启动 Kestrel Sys
使用XPATH，如何选择包含特定字符串的任何节点

假设我有一个如下所示的 XML 文件
如果其他参数为 null，SQL 正确的连接方式

我有这段代码及其临时表因此您可以运行它 create table student id int identity 1 1 firstname varchar 50 lastname varchar 50 create table quiz
根据判别器的子集获取判别联合的子集

打字稿问题给定一个受歧视的联合类型 interface A discriminator A data string interface B discriminator B data string interface C discrimin
在 R 中使用 download.file 下载时跳过错误文件

我有大量 pdf 文件的链接我想在 for 循环中使用 download file 下载这些文件我的解决方案工作正常但在遇到错误时停止许多文件不起作用我想在 download file 函数中添加一个功能告诉 R 在下载产生错误
如何强制 Rails ActiveRecord 提交事务刷新

是否可以强制 ActiveRecord 推送刷新事务或只是保存创建我有一个时钟工作人员它在后台为多个任务工作人员创建任务问题是时钟工作人员有时会在时钟工作人员信息完全刷新到数据库之前创建一个任务并将其推送给任务工作人员这会导
Linux 中上下文切换需要多长时间？

我很好奇在 Linux 中更改上下文需要多少个周期我专门使用 E5405 Xeon x64 但我也很想看看它与其他平台的比较有一个名为 LMBench 的免费应用程序由 Larry McVoy 和朋友编写它提供了一系列操作系统和硬件
初始化词汇表外 (OOV) 标记

我正在为 NLP 任务构建 TensorFlow 模型并且使用预训练的 Glove 300d 词向量嵌入数据集显然有些标记无法解析为嵌入因为它们没有包含在词向量嵌入模型的训练数据集中例如罕见的名字我可以用 0 向量替换这些标记

初始化词汇表外 (OOV) 标记

初始化词汇表外 (OOV) 标记 的相关文章

随机推荐

热门标签

初始化词汇表外 (OOV) 标记的相关文章