什么是词向量维度

2023-11-29

我目前是深度学习的业余爱好者，正在这个网站上阅读有关 word2vector 的内容https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-3-more-fun-with-word-vectors

对于 CBOW 或 Skipgram 模型，我可以看到单词向量的维度为 300，词汇量为 15000。我在上一篇文章中读到的是，我们可以对向量中的单词进行硬编码。所以我想词向量的维度应该等于词汇量的大小，或者换句话说，这个词的维度是什么以及如何可视化它。你如何看待这个维度？

“词向量维度”是您使用训练文档训练的向量的维度。从技术上讲，您可以选择任何维度，例如 10、100、300，甚至 1000。行业标准是 300-500，因为我们已经尝试过不同的维度（300、400、500，... 1000 等），但没有注意到300-400 后性能显着提升。（这也取决于您的训练数据。）顾名思义，维度越大意味着计算量越大。但是，如果我们将维度设置得太低，则没有太多向量空间来捕获整个训练文档包含的信息。

如何形象化它？

您无法轻松地可视化 300 维向量，并且可视化 300 维向量可能对您来说没有太大用处。我们能做的就是将这些向量投影到二维空间，这是我们最熟悉也很容易理解的空间。

你最后的陈述所以我猜词向量维度应该等于词汇量大小是错的！词汇量为 171,476 个单词（英语单词总数）！词向量维度（大多是300-500。你不想训练10亿维的向量吧？）是你预先决定的用于训练数据的向量的大小。我的视频（无耻插件）将帮助你理解重要的词向量概念：人工智能与最佳

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

vector

neuralnetwork

什么是词向量维度的相关文章

如何使用pycaffe重构caffe网络

我想要的是加载网络后我将分解一些特定的图层并保存新的网络例如原网数据 gt conv1 gt conv2 gt fc1 gt fc2 gt softmax New net 数据 gt conv1 1 gt conv1 2 gt c
在类中创建向量然后在函数中使用类对象不起作用

我有课Employees 我试图让用户插入和删除员工但它不起作用向量的大小应为 500 class Employees public int maxx 500 vector
ValueError：混淆矩阵不支持多标签指示符

我在尝试在二元分类问题中使用混淆矩阵时遇到此错误 Y and Yhat都是numpy数组我已经尝试过 argmax作为建议的解决方案我不再收到错误但输出不是我知道的混淆矩阵 Accuracy 0 9982449999999999 Ac
r - 根据第一个向量重新排序第二个向量

寻找解决方案来执行以下操作有两个向量 a lt c 2 1 3 4 7 6 5 9 8 10 b lt c 3 2 1 6 5 4 7 8 9 10 我想创建第三个向量它给出向量的顺序b需要重新排序使其顺序与a 在这种情况下我想得到
了解最大池层之后的全连接层的尺寸[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在下图架构中 4096 个单元的全连接密集层是如何从最后一个最大池层右侧维度导出的256x13x13 而不是 4096 不应该
深度学习——一些关于caffe的幼稚问题

我试图了解 caffe 的基础知识特别是与 python 一起使用我的理解是模型定义比如给定的神经网络架构必须包含在 prototxt file 当您使用数据训练模型时 prototxt 您将权重模型参数保存到 caffemode
什么是 ANN 中的纪元以及它如何转换为 MATLAB 中的代码？

我试图理解并可视化训练人工神经网络的时代到底是什么我们有一个包含约 7000 个产品的训练集其中有 10 个特征输入这些产品必须根据这 10 个输入分为 7 个类别我们的 ANN 有 10 个输入这些输入进入由 10 个神经
如何获取 std::vector 作为 int 的大小？

I tried include
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
3D 数组到 3D std::vector

我在代码函数中用 3D std vector 替换了 3D 数组它进入了无限循环你能给我一个提示吗我真的需要使用向量而不是数组谢谢我最初的代码是 arr is a 3D array of a sudoku table the 3
如何过滤自定义结构体的向量？

我正在尝试过滤Vec
图书馆神经实验室培训纽夫

我对 python 和 Neurolab 的使用还很陌生我在前馈神经网络的训练方面遇到了问题我已经构建了如下网络 net nl net newff 1 1 64 60 1 net init testerr net train Input
sigmoid 的导数

我正在使用反向传播技术创建一个神经网络进行学习我知道我们需要找到所使用的激活函数的导数我正在使用标准 sigmoid 函数 f x 1 1 e x 我已经看到它的导数是 dy dx f x f x 1 f x 这可能是一个愚蠢的问题但
Keras CNN 回归模型损失低，准确度为 0

我在 keras 中遇到这个 NN 回归模型的问题我正在研究一个汽车数据集以根据 13 个维度预测价格简而言之我已将其读取为 pandas 数据帧将数值转换为浮点数缩放值然后对分类值使用 one hot 编码这创建了很多新列
辍学训练

如何对由 dropout 产生的许多薄层进行平均在测试阶段要使用哪些重量我对这个问题真的很困惑因为每个细化层都会学习一组不同的权重那么反向传播是为每个稀疏网络单独完成的吗这些细化网络之间的权重究竟是如何共享的因为在测试时仅使用一
了解 Numpy 中的向量化与通过 Numexpr 进行向量化表达式的多线程处理之间的区别

我对 NumPy 据说正在向量化其算术数组运算的概念感到有点挣扎它是否克服了 Python 的 GIL 因为 NumPy 的一部分是用 C 实现的另外 Numexpr 是如何工作的呢如果我理解正确的话它通过优化 JIT 运行代码并启
“Flatten”在 Keras 中的作用是什么？

我试图理解的角色FlattenKeras 中的函数下面是我的代码这是一个简单的两层网络它接收形状为 3 2 的二维数据并输出形状为 1 4 的一维数据 model Sequential model add Dense 16 inpu
TensorFlowdynamic_rnn 回归器：ValueError 维度不匹配

我想构建一个用于回归的玩具 LSTM 模型 This http mourafiq com 2016 05 15 predicting sequences using rnn in tensorflow html不错的教程对于初学者来说已经太
使用迭代器遍历和取消遍历 std::vector 最干净的方法是什么？

我遇到一种情况我正在穿过一个向量做一些事情 std vector
std::ostream {又名 std::basic_ostream} Ivalue 为 'std::basic_ostream&&

在此代码中我尝试将迭代器移动 10 个元素 include

随机推荐

Java：如何控制JPanel的宽高比？

我有一个 JPanel 我想保持正方形但我希望它的大小能够填充其父 JFrame 中可能的最大空间量但保持正方形即它采用 JFrame 的最短边作为正方形宽度我搜索过网络检查了所有布局管理器似乎没有一个可以简单地解决这个非常简单
需要更新SQLite中某列的值

我需要对列中所有行的列值求反我尝试使用以下查询来执行此操作但它没有更新任何行 sqliteDatabase rawQuery UPDATE SQL TABLE NAME SET COL 1 COL 1 null 其中COL 1 col
条件 WHERE 语句 SQL Server

我想创建一个 SP 来返回所有Country行除非CountryID作为参数提供这是我想象的它可能的工作方式但它不喜欢它 ALTER PROCEDURE dbo usp return countries CountryID AS IN
HTML5 将加密的视频帧绘制到画布（带有clearkey的加密媒体扩展）

我正在尝试使用 Javascript 将 HTML5 视频元素中的帧绘制到画布其中视频 webm VP9 已使用 Clearkey 加密我正在使用 EME 在 Chrome 中解密它使用 EME 加密媒体扩展时 Chrome gt
检测我何时在页面顶部滚动 UIWebView

我想在我的 webview 顶部添加一个 URL google 栏并像 Safari 一样通过向上滚动我的网页来访问它为此我将检测用户何时滚动页面以及何时滚动到达顶部但我实在不知道怎么办一个主意非常感谢 Martin 我也在挖
如何在 Perl 中解析 XML 并创建树结构

我正在解析 XML 文件XML Simple 有没有办法从 XML 中获取树形形式如果是这样请举例说明或建议 CPAN 包我想知道之后我必须处理哪个标签column等等标签没有顺序这column标签可以出现在Table or di
用于检索各种日期范围内的 SUM 的 SQL 查询

我有一个表格其中包含有关已售产品客户购买日期和已售单位摘要的信息我想要得到的结果应该是 4 行其中前三行是一月二月和三月最后一行是这 3 个月内未售出的产品这是桌子 http imageshack us a img823 8
不能对承诺式任务调用 Start。异常即将到来

我正在创建一个简单的 wpf 桌面应用程序 UI 只有一个按钮和 cs 文件中的代码例如 private void Button Click 2 object sender RoutedEventArgs e FunctionA publ
随机数类内初始化

我目前正在创建一个类我希望每次创建对象时都用随机数初始化其中一个私有成员下面的代码不会产生任何问题 private unsigned random rand 10 不过我想使用 C 11 随机引擎和发行版来执行此操作我希望能够按照以
如何在android中的asynctask中检查互联网连接

Override protected void onCreate Bundle savedInstanceState TODO Auto generated method stub super onCreate savedInstanceS
Woocommerce 多个结账页面

所以我一直在用头撞我的电脑试图弄清楚如何让它工作并且想知道这是否可能只要做一些工作一切皆有可能我的最终目标是拥有多个包含 Woocommerce 结帐表单的页面以便我可以拥有一个用于自定义单页订阅结帐的页面当我通过设置面板将结
SurfaceTexture 的 onFrameAvailable() 方法总是调用得太晚

我正在尝试让以下 MediaExtractor 示例正常工作 http bigflake com mediacodec ExtractMpegFramesTest java 需要 4 1 API 16 我遇到的问题是 outputSurfa
使用最近邻缩放图像

我一直在尝试让我的程序放大图像我在为缩放图像分配新空间时遇到一些问题但我认为它已经解决了我遇到的问题是当我尝试从临时内存持有者发回图像时程序崩溃了加载的图像放置在我的struct Image 像素被放置在img gt pixel
jQuery：查找特定父级之前的所有父级

jQuery 中是否有一个内置函数可以让我将所有父级添加到具有特定 ID 的父级我有一个深度嵌套的无序列表如果我有对 li 之一的引用我需要找到所有父 li 直到根 ul 如果我使用parents 它会给我所有的父母直到文档的根目录
使用 iPhone sdk 编辑 PDF

我想在现有的 pdf 上添加一些图像单击这些图像后我应该能够显示一些动画或能够播放音乐是否可以这样做我使用 pageCurlUp 动画逐页显示 pdf 但我不知道如何使用外部图像显示 pdf 不同页面和不同位置会有不同的图像请指导
当不通过 ObjectMapper 时，如何在 JsonParser 上设置 ObjectCodec？

注意这是使用 Jackson 2 3 2 为了满足我的一个项目的需要我正在编写一个自定义的JsonParser其中记录了一个Map钥匙在哪里JsonPointers 和值是Integers 指针指向的行号该类被命名为LineRecor
Ionic 3 延迟加载使大型 html 文件出现滞后

我在我的项目中使用 ionic 3 但在延迟加载方面遇到了一些问题我有一个ResultPage与模板resultpage html有超过1000html 行代码在里面HomePage我想导航到ResultPage by navCtrl
Bash - 简单问号（？）的含义

我正在尝试一些 bash 功能当我尝试回显一些输出时我注意到 echo what about in some more complex example 结果是在一些更复杂的例子中怎么样我知道转义问号或整行引号可以解决问题但我很好奇
Xcode 未找到匹配的私钥

我有一个从另一台 Mac 分发的应用程序我需要从另一台 Mac 获得什么才能将我的应用程序存档以供上传以及我需要在 Xcode 路径中进行哪些更改才能使所有工作正常进行谢谢抱歉英语不好如果您使用某人的证书您还必须获取与该证书关联
什么是词向量维度

我目前是深度学习的业余爱好者正在这个网站上阅读有关 word2vector 的内容https www kaggle com c word2vec nlp tutorial details part 3 more fun with word

什么是词向量维度

什么是词向量维度 的相关文章

随机推荐

热门标签

什么是词向量维度的相关文章