Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
什么是 doc2vec 训练迭代?
我是 doc2vec 的新手 我最初试图理解 doc2vec 下面提到的是我使用 Gensim 的代码 正如我想要的那样 我得到了两个文档的训练模型和文档向量 但是 我想知道在几个时期重新训练模型的好处以及如何在 Gensim 中做到这一点
python
deeplearning
Word2Vec
gensim
doc2vec
gensim 错误:导入错误:没有名为“gensim”的模块
我尝试导入 gensim import gensim 但出现以下错误 ImportError Traceback most recent call last
python
gensim
Word2Vec
运行需要 gensim 旧版本的模型
我需要运行一个模型 但它需要具有 DocvecsArray 属性的旧版本 gensim 我该如何运行它 AttributeError 无法在 The DocvecsArray该类已被 2018 年 2 月发布的 Gensim 3 3 0 删
python
NLP
gensim
Word2Vec
doc2vec
使用 word2vec 的二元组向量表示
我想使用 word2vec 工具构建文档的词嵌入 我知道如何找到与单个单词 一元组 相对应的向量嵌入 现在 我想找到二元组的向量 是否可以使用 word2vec 构建二元词嵌入 如果是 怎么办 以下代码片段将为您提供二元组的向量表示 请注意
NLP
Word2Vec
wordembedding
在 Word2Vec 中合并预训练模型?
我已经下载了 1000 亿字的 Google 新闻预训练矢量文件 除此之外 我还在训练自己的 3GB 数据 生成另一个预训练的矢量文件 两者都有 300 个特征维度和超过 1GB 的大小 我如何合并这两个巨大的预训练向量 或者我如何训练一个
machinelearning
Word2Vec
给定单词向量(而不是单词本身),获取最相似的单词
使用gensim models Word2Vec库 您可以提供一个模型和一个 单词 您希望找到最相似单词的列表 model gensim models Word2Vec load word2vec format model file bin
python
gensim
Word2Vec
错误:“utf8”编解码器无法解码位置 0 中的字节 0x80:起始字节无效
我正在尝试执行以下操作Kaggle作业 https www kaggle com c word2vec nlp tutorial 我正在使用 gensim 包来使用 word2vec 我能够创建模型并将其存储到磁盘 但是当我尝试加载文件时
python
characterencoding
gensim
Word2Vec
kaggle
Word2vec - 获取相似度排名
鉴于我有一个 word2vec 模型 由 gensim 提供 我想获得单词之间的排名相似度 例如 假设我有 desk 这个词 与 desk 最相似的词是 表0 64 椅子0 61 预订 0 59 铅笔0 52 我想创建一个函数 f 桌子 书
python
python3x
NLP
gensim
Word2Vec
使用 word2vec 嵌入句子
我想比较不同句子中提到的相同单词的差异 例如 旅行 我想做的是 将提及 旅行 一词的句子视为纯文本 在每个句子中 将 旅行 替换为travel sent x 在这些句子上训练 word2vec 模型 计算 Travel sent1 trav
python
gensim
Word2Vec
Embedding
为什么word2Vec使用余弦相似度?
我一直在阅读有关 Word2Vec 的论文 例如this one https papers nips cc paper 5021 distributed representations of words and phrases and th
NLP
deeplearning
Word2Vec
Gensim 3.8.0 至 Gensim 4.0.0
我使用 Gensim 3 8 0 训练了 Word2Vec 模型 后来我尝试在GCP上使用Gensim 4 0 o来使用预训练模型 我使用了以下代码 model KeyedVectors load word2vec format wv pa
python
NLP
gensim
Word2Vec
wordembedding
如何从句子中标记的 word2vec 中获取句子的向量
我已经使用 word2vec 从大型文档中生成了标记列表的向量 给定一个句子 是否可以从句子中标记的向量得到该句子的向量 有不同的方法来获取句子向量 Doc2Vec 您可以使用 Doc2Vec 训练数据集 然后使用句子向量 Word2Vec
Word2Vec
word2vec - 什么是最好的?添加、连接或平均词向量?
我正在研究循环语言模型 为了学习可用于初始化语言模型的词嵌入 我使用 gensim 的 word2vec 模型 训练后 word2vec 模型为词汇表中的每个单词保存两个向量 单词嵌入 输入 隐藏矩阵的行 和上下文嵌入 隐藏 输出矩阵的列
python
Word2Vec
gensim
wordembedding
languagemodel
如何从回调函数中中断Word2vec训练?
我正在使用 gensim word2vec 训练 Skipgram 模型 我想在达到基于不同数据集的特定准确性测试的参数中传递的时期数之前退出训练 以避免模型过度拟合 gensim 有没有办法从回调函数中断 word2vec 的训练 如果事
python
Callback
gensim
Word2Vec
earlystopping
word2vec - KeyError:“单词 X 不在词汇表中”
使用Word2Vec模块的实现gensim为了为我在纯文本文件中拥有的句子构建单词嵌入 尽管这个词happy在词汇表中定义 得到错误KeyError word happy not in vocabulary 尝试将给出的答案应用到类似的问题
gensim
Word2Vec
wordembedding
在 word2vec Gensim 中获取二元组和三元组
我目前在我的 word2vec 模型中使用 uni gram 如下所示 def review to sentences review tokenizer remove stopwords False Returns a list of se
python
tokenize
Word2Vec
gensim
NGram
Gensim:KeyError:“单词不在词汇表中”
我有一个使用 Python 的 Gensim 库训练过的 Word2vec 模型 我有一个标记化列表 如下所示 词汇量为 34 但我只给出 34 中的几个 b let know buy someth featur mashabl might
python
NLP
gensim
Word2Vec
topicmodeling
TensorFlow 嵌入查找
我正在尝试学习如何使用 TensorFlow 构建用于语音识别的 RNN 首先 我想尝试 TensorFlow 页面上提供的一些示例模型TF RNN https www tensorflow org versions master tuto
tensorflow
Word2Vec
recurrentneuralnetwork
languagemodel
使用 LSTM 教程代码来预测句子中的下一个单词?
我一直在尝试理解示例代码https www tensorflow org tutorials recurrent https www tensorflow org tutorials recurrent你可以在以下位置找到https git
python
tensorflow
LSTM
Word2Vec
wordembedding
为什么我们使用输入隐藏权重矩阵而不是隐藏输出权重矩阵作为词向量?
在word2vec中 经过训练 我们得到两个权重矩阵 1 输入隐藏权重矩阵 2 隐藏输出权重矩阵 人们会使用输入隐藏权重矩阵作为词向量 每一行对应一个词 即词向量 这是我的困惑 为什么人们使用输入隐藏权重矩阵而不是隐藏输出权重矩阵作为词向量
NLP
gensim
Word2Vec
«
1
2
3
4
5
»