我正在看这篇论文http://cs.stanford.edu/~quocle/paragraph_vector.pdf http://cs.stanford.edu/~quocle/paragraph_vector.pdf
它指出
" 段落向量和词向量被平均或连接
预测上下文中的下一个单词。在实验中,我们使用
连接作为组合向量的方法。”
串联或平均如何工作?
示例(第 1 段包含 word1 和 word2):
word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]
concat method
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?
Average method
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?
还来自这张图片:
据称:
段落标记可以被认为是另一个词。它充当
记住当前上下文中缺少的内容的记忆 – 或
该段落的主题。出于这个原因,我们通常称这种模型为
段落向量的分布式内存模型(PV-DM)。
段落标记是否等于段落向量,该向量等于on
?
串联或平均如何工作?
你的平均值是正确的。连接是:[0.1,0.2,0.3,0.4,0.5,0.6]
.
段落标记是否等于等于 on 的段落向量?
“段落标记”被映射到称为“段落向量”的向量。它不同于标记“on”,也不同于标记“on”映射到的词向量。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)