给定单词向量（而不是单词本身），获取最相似的单词

2024-01-08

使用gensim.models.Word2Vec库，您可以提供一个模型和一个“单词”，您希望找到最相似单词的列表：

model = gensim.models.Word2Vec.load_word2vec_format(model_file, binary=True)
model.most_similar(positive=[WORD], topn=N)

我想知道是否有可能为系统提供模型和“向量”作为输入，并要求系统返回最相似的单词（它们的向量非常接近给定的向量）。类似于：

model.most_similar(positive=[VECTOR], topn=N)

我需要此功能用于双语设置，其中我有 2 个模型（英语和德语），以及一些我需要找到最相似的德语候选词的英语单词。我想做的是从英语模型中获取每个英语单词的向量：

model_EN = gensim.models.Word2Vec.load_word2vec_format(model_file_EN, binary=True)
vector_w_en=model_EN[WORD_EN]

然后用这些向量查询德国模型。

model_DE = gensim.models.Word2Vec.load_word2vec_format(model_file_DE, binary=True)
model_DE.most_similar(positive=[vector_w_en], topn=N)

我已经使用 word2vec 包中的原始距离函数在 C 中实现了这一点。但是，现在我需要它在 python 中，以便能够将它与我的其他脚本集成。

你知道是否已经有一种方法gensim.models.Word2Vec图书馆或其他类似的图书馆有这个功能吗？我需要自己实施吗？

方法similar_by_vector https://radimrehurek.com/gensim/models/word2vec.html#gensim.models.word2vec.Word2Vec.similar_by_vector按向量返回前 N 个最相似的单词：

similar_by_vector(vector, topn=10, restrict_vocab=None)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

gensim

Word2Vec

给定单词向量（而不是单词本身），获取最相似的单词的相关文章

并行 dask for 循环比常规循环慢？

如果我尝试使用 dask 并行化 for 循环它最终会比常规版本执行得慢基本上我只是按照 dask 教程中的介绍性示例进行操作但由于某种原因它在我这边失败了我究竟做错了什么 In 1 import numpy as np from
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
在Python上获取字典的前x个元素

我是Python的新手所以我尝试用Python获取字典的前50个元素我有一本字典它按值降序排列 k 0 l 0 for k in len dict d l 1 if l lt 51 print dict 举个小例子 dict d m
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

在没有 IIS 和 VS 2017 的情况下使用 Kestrel

依赖于微软文档 Kestrel 可以单独使用也可以与反向代理服务器例如 IIS Nginx 或 Apache 一起使用反向代理服务器接收来自 Internet 的 HTTP 请求并在进行一些初步处理后将它们转发到 Kestrel 如
使用导数和雅可比增强 odeint 类

我打算在 MCMC 例程中使用 Boost odeint 库来估计 ODE 模型中的参数由于这些 ODE 可能很僵硬因此我需要能够将雅可比矩阵与导数一起传递到求解器中我想创建一个类其中参数和初始值作为私有成员然后将导数雅可比和更
我应该在私有/内部方法中添加空参数吗？

我正在编写一个库它具有多个公共类和方法以及库本身使用的多个私有或内部类和方法在公共方法中我有一个空检查和一个抛出如下所示 public int DoSomething int number if number null throw
Java：使用异步编程优化应用程序

我必须修改 dropwizard 应用程序以提高其运行时间基本上该应用程序每天接收大约 300 万个 URL 并下载和解析它们以检测恶意内容问题是该应用程序只能处理 100 万个 URL 当我查看该应用程序时我发现它正在进行大量顺序
将文件下载到特定文件夹 python

我可以从以下位置下载文件URL以下方式 import urllib2 response urllib2 urlopen http www someurl com file pdf html response read 我能想到的一种方法是以
从流中读取数据的最有效方法

我有一种使用对称加密来加密和解密数据的算法无论如何当我要解密时我有 CryptoStream cs new CryptoStream ms cryptoTransform CryptoStreamMode Read 我必须从 cs C
来自产品 ID 的 MSI 产品代码？

我正在尝试将 MSI 产品代码 GUID 转换为用于标识 MSI 注册表项中已安装项目的产品代码 ID 有这方面的API吗如果不是这该怎么办 Warning Microsoft 强烈建议您不要弄乱他们的 MSI 注册表项但如果您确实必
如何删除 AWS ECS 任务定义？

在 Amazon 的 EC2 容器服务中创建任务定义后如何删除或移除它 It s a 已知问题 https forums aws amazon com thread jspa threadID 170378 一旦取消注册任务定义它就会进
PHP：没有连接的字符串中的变量

如果我在这个字符串中有一个变量 var echo Hello there are many vars Php 寻找variable vars代替 var 没有连接如 Hello there are many var s 还有另一种方法可以
Jboss不部署战争，JBAS011006

我需要你的帮助我正在尝试将 WAR 部署到 Jboss Application Server 7 1 但无法实现我通过 Web 控制台部署它它在部署过程中冻结没有任何错误这是我的 server log http rghost ru
HTML5

我想知道这是什么意思
更好的说法是 x == Foo::A || x == Foo::B || x == Foo::C || ...？

假设我有一堆众所周知的价值观就像这样但是const char 这只是一个例子可能更复杂 const char A A B B C C D D E E F F G G 现在假设如果某个表达式的结果位于这些表达式的子集中我想以特定的方式
简单的 yacc 语法给出错误

我有一个关于 yacc 编译器的问题我不编译简单的 yacc 语法这是代码部分 anbn 0 y token A B start anbn n printf is in anbn 0 n return 0 anbn empty A an
before(:each) 与之前

我是 ruby on Rails 的新手并进行测试之间有区别吗 before each do some test code end and before do some test code end The before方法接受一个sco
write()-Python 3.x 中的编码字符串

我有一个 unicode 字符串我想将其写入文件中在 Python 2 中我可以这样写 open filename w write s encode utf 8 但这对于 Python 3 来说失败了显然 s encode 返回 by
如何根据文本长度增加UITextview高度，如whatsapp

我已经使用 websocket 在我的 iOS 应用程序中实现了聊天功能它对我来说工作得很好问题是我想增加 UITextView 的高度而 UITableView 应该根据 UITextView 增加的高度向上移动谁能帮我以下是我
使用过滤器返回对象中的属性值

尝试创建一个使用 filter 但不使用 for 或 while 循环或 foreach 函数的函数该函数将循环遍历对象数组仅返回其属性值例如 function getShortMessages messages return mes
带有 addrinfo 结构的智能指针

我需要处理两个结构addrinfo指针由于我使用 C 11 进行编码因此我必须使代码异常安全事实上我的构造函数可能会抛出一个runtime error 当你不再需要那种结构时你应该调用freeaddrinfo为了释放结构内的列表
MailSystem.Net 删除邮件，IndexOnServer 属性 = 0

我在用着邮件系统 NET http mailsystem codeplex com并尝试从服务器删除消息问题是 IndexOnServer 属性为 0 我收到以下错误 Command store 0 flags silent Delete
给定单词向量（而不是单词本身），获取最相似的单词

使用gensim models Word2Vec库您可以提供一个模型和一个单词您希望找到最相似单词的列表 model gensim models Word2Vec load word2vec format model file bin

给定单词向量（而不是单词本身），获取最相似的单词

给定单词向量（而不是单词本身），获取最相似的单词 的相关文章

随机推荐

热门标签

给定单词向量（而不是单词本身），获取最相似的单词的相关文章