将 freebase 向量与 gensim 一起使用

2024-04-26

我正在尝试使用 Google 发布的 freebase 单词嵌入，但我很难从 freebase 名称中获取单词。

model = gensim.models.Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000.bin',binary=True)
model.vocab.keys()[:10]

Out[22]:
[u'/m/026tg5z',
 u'/m/018jz8',
 u'/m/04klsk',
 u'/m/08gd39',
 u'/m/0kt94',
 u'/m/05mtf0t',
 u'/m/05tjjb',
 u'/m/01m3vn',
 u'/m/0h7p35',
 u'/m/03ggvg3']

有谁知道是否存在某种表将 freebase 表示映射到它们所表示的单词？

Regards,

Hedi

实际上，有人为我们所有人做了一件好事，并将 ID 映射到预训练模型中的名称。你可以下载那个模型here https://docs.google.com/file/d/0B7XkCwpI5KDYeFdmcVltWkhtbmM/edit?usp=sharing.

from gensim.models import Word2Vec
model = Word2Vec.load_word2vec_format('freebase-vectors-skipgram1000-en.bin.gz',
                                       binary=True)

注意额外的-en before .bin。然后是一些示例词汇：

>>> list(model.vocab.keys())[:10] 
['/en/the_final_country', '/en/independent_curators_international', 
'/en/coney_reyes', '/en/scalr', '/en/everyman_palace_theatre', 
'/m/0g55w3s', '/en/waltershausen', '/en/river_frome_stroud', 
'/en/grzegorz_turnau']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

freebase

gensim

Word2Vec

将 freebase 向量与 gensim 一起使用的相关文章

Python 中的 Flask 错误：“无法导入 webapp”

我正在尝试运行 Flask 但是每当我输入 flask run 时都会出现错误 Could not import webapp 作为参考我正在使用 Visual Studio Code 并运行以下代码 from flask impor
如何从字典构造defaultdict？

如果我有d dict zip range 1 10 range 50 61 我怎样才能建立一个collections defaultdict出于dict 唯一的论点defaultdict似乎采取的是工厂功能我必须初始化然后再经历原来的d并
Python数据框将列表列分解为多行[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 desc id info a b c 2 type u v w 18 tail 三列 desc id info desc 是一个列表我想要这个 des id info a 2 type
自 1.4.0 版本以来，sphinx_rtd_theme 不再是硬依赖项

C Users Administrator Desktop item code serv documents api gt 制作 html 运行 Sphinx v1 6 2 加载腌制环境失败无法获取属性 WarningStream
Pythonic方式逐行读取文件？

以下两种方法中逐行读取文件的 Pythonic 方法是什么 with open file r as f for line in f print line or with open file r as f for line in f read
Keras AttributeError：“顺序”对象没有属性“predict_classes”

我试图按照本指南找到模型性能指标 F1 分数准确性召回率 https machinelearningmastery com how to calculate precision recall f1 and more for deep l
对seaborn图中的分类x轴进行排序

我正在尝试使用 seaborn 散点图绘制数据框中前 30 的值如下所示同一图的可重现代码 import seaborn as sns df sns load dataset iris function to return top 30
Python 有哪些 SOAP 客户端库，它们的文档在哪里？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
向 list.extend() 传递不可迭代对象

我正在创建一个公共方法来允许调用者将值写入设备例如将其称为 write vals 由于这些值将实时输入因此我希望通过允许用户输入列表或单个值来简化用户的生活具体取决于他们需要写入的值的数量例如 write to device 1 2
冻结（.exe）一个traitsUI程序，现实可行吗？

我正在尝试使用 cx freeze 或 pyInstaller 冻结一个 TraitsUI 程序该程序利用 Chaco Traits TraitsUI 以及较小程度的 mayavi 实际上可以取出我需要它在 mac linux ubun
无法写入文本文件

我正在运行一些测试并需要写入文件当我运行测试时open file r 不写入文件测试脚本如下 class GetDetailsIP TestGet def runTest self self category PTZ try This
Django 1.7.1 需要字段的默认值 - 但数据库中没有条目。为什么？

我遇到了一个奇怪的问题我在 Mac OS X Yosemite 上使用 Django 1 7 1 并且配置了本地 MySQL 数据库通常我创建一个模型如果我想添加另一个字段我只需做一个 manage py migrateDjang
如何在 Django 中创建多选框？

我正在尝试创建多选框字段来自姜戈选择 2 https github com applegrew django select2库如下图所示我使用了下一个代码但它返回简单的选择多个小部件我想我忘了补充一些东西我的错误在哪里有人可以告诉
PySide2/QML 填充 Gridview 模型/委托并为其设置动画

我是 QML 的新手正在寻求以下几点帮助如何基于 TextField 输入如 Regex 通过 PySide2 过滤 Gridview 模型中的 QAbstractListModel 数据标题如何在鼠标悬停时为 Gridview
PyCharm 可以列出项目中的所有 Python 错误吗？

我在虚拟环境中使用 python 2 7 和 PyCharm 2 7 2013 年 2 月 7 日的新版本每当我打开其中有明确错误的Python文件相当于其他语言中的编译错误例如使用未声明的变量调用不存在的函数时它会在文件的装订
如何用不同的颜色填充seaborn.distplot中的区域

是否可以用颜色填充两条阈值线 line1 和 line2 之外的区域并通过 distplot 绘制的 KDE 曲线限制 Y 轴代表我的应用程序的 3 sigmas import pylab as pl import seaborn as
Python 中的延迟求值/惰性求值

我想延迟对类实例的成员函数的调用的评估直到该实例实际存在最小工作示例 class TestClass def init self variable 0 self variable 0 variable 0 def get variabl
使用 PyODBC 选择表中的列名

我正在编写一个 Python 程序该程序使用 PyODBC 从 Microsoft Access mdb 文件中选择一些数据我需要发现几个不同表的列名在 SQL Server 中这可以通过使用类似的查询来完成 SELECT c na
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
Python 装饰器只是语法糖？ [复制]

这个问题在这里已经有答案了可能的重复了解 Python 装饰器 https stackoverflow com questions 739654 understanding python decorators 我对使用 Python 装

随机推荐

我应该在 Uber 应用程序中放置什么重定向 URL？

我正在阅读 Uber 的 sdk api 文档但我是菜鸟我不知道redirectURL 应该是什么这是 Uber 提供的给定网址吗因为我找不到它或者是由应用程序开发人员部署自己的服务器本地计算机定制的网页的 URL 如果是的话我
json_encode 可以触发 catch 块吗？ [复制]

这个问题在这里已经有答案了这可能是一个非常简单的问题但我找不到任何相关信息我使用的系统聚合了来自不同来源的大量数据然后将这些数据存储在数据库中在大多数情况下系统工作正常但有时我们会遇到一个问题即数据可能具有我们的系统不喜欢的
使用 Spring Data 进行不区分大小写的排序

如何使用 Spring data Pageable 进行不区分大小写的排序我的存储库中有这个方法 public interface ItemRepository extends QueryDslPredicateExecutor
使用类方法作为 celery 任务

我正在尝试使用类的方法作为 django celery 任务并使用 task 装饰器对其进行标记描述了同样的情况here https stackoverflow com questions 8846489 celery python o
viewForHeaderInSection 的框架始终大小相同

UIView tableView UITableView tableView viewForHeaderInSection NSInteger section if section 0 UIView view UIView alloc in
在Python中分配空值或字符串

我想了解分配空值和空输出之间是否有区别如下所示 1 gt 像这样分配一个值 string 2 gt 作为输出返回空值 string abcd str1 str2 split 换句话说 1 gt 中的 string 和2 gt 中的 str
检查是否有任何输入元素处于焦点

我有一个 jquery 脚本当按下键盘上的任意键时它会显示一个 div 我想向脚本添加一个条件仅当页面上没有其他输入区域文本区域或文本字段处于焦点时才运行脚本这样您就可以在页面的其余部分实际键入内容而无需显示 div docu
如何在 Linux 中离线安装 vscode-server [重复]

这个问题在这里已经有答案了我正在尝试安装 VScode 远程 ssh 扩展但我的远程主机无法连接到互联网因此无法下载软件所以我收到了一些类似的错误消息 SSH Resolver called for ssh remote kf SS
java与maven和eclipse中的clojure混合

我创建了一个示例多语言程序我有一个用java实现的传感器和一个机器人以及用clojure实现的AI 我无法正确连接maven src main java clojuretest DistanceSensor java AI clj us
NiFi 如何将 InvokeHTTP 处理器与 SOAP 结合使用

我看到其他人已经能够使其发挥作用但是我无法找到足够的详细信息来解释他们如何实现这一目标以便我能够使其发挥作用 This guy http apache nifi developer list 39713 n7 nabble com SO
是否存在具有单个强所有者和多个弱引用的共享指针？

我正在寻找类似于的智能指针Arc Rc只不过它不允许共享所有权我想要尽可能多的rc Weak我需要的参考资料但我只想one强引用又称所有者我想通过类型系统来强制执行这一点 Arc Rc可以克隆并且可以在多个地方拥有它们滚动我自己
如果在 Application_Start 中抛出未处理的异常会发生什么？

是否会针对下一个请求再次运行 Application Start 方法它是否取决于 ASP NET 版本托管服务器版本和或其他上下文我试图确定在那里加载关键程序集是否是一件好事例如对于整个应用程序的功能是否至关重要的数据访问组件
filehelpers - 解析可变行长度

我必须解析 C a CSV文件具有变量宽度和 2 行标题信息第一行是名称第二行是单位数据如下示例1 CSV timestamp NAME 1 NAME 2 NAME 3 NAME 4 ms unit 1 unit 2 unit
设置 xamarin studio 以与 PCL 和 MVVMCross 配合使用

我真的很喜欢 Xamarin Studio 并且正在寻找一个模板解决方案来开始使用 MvvmCross 开发跨设备应用程序但我找不到如何将项目设置为与 Xamarin Studio 一起使用 PCL 和 MvvmCross 如果有人能给我
在 C++ 中求和 1<<2 和 1<<3 时出现奇怪的输出

所以我只是尝试用 C 进行一些位操作这是我尝试过的 int a 1 lt lt 2 cout lt
XML 签名中的“SignatureMethod”算法与“DigestMethod”算法

如果我们以下面的 Signature 元素为例
谷歌地理编码 API 不如使用地址的谷歌地图准确

我有很多例子其中谷歌地图返回确切的位置而地理编码无法找到精确的匹配并且仅提供紧密匹配的纬度经度这对我的目的没有好处例如谷歌地图中的 1729 State Road 8 auburn IN 46706 将我精确地定位到了沃尔玛配
枚举是单数还是复数？

枚举时使用单数还是复数我认为声明中使用复数最有意义 enum Weekdays Monday Tuesday Wednesday Thursday Friday Saturday Sunday 但我认为在使用类型时使用单数更有意义例如
如何绘制 NxN 圆数组？

我想绘制一个 NxN 的圆数组为了形象化我附上了我想要实现的目标的图像我是 MatlLab 的新手所以我尝试先绘制一个圆下面是示例代码 n 2 10 size of mask M zeros n I 1 n x I n 2 mas
将 freebase 向量与 gensim 一起使用

我正在尝试使用 Google 发布的 freebase 单词嵌入但我很难从 freebase 名称中获取单词 model gensim models Word2Vec load word2vec format freebase vecto

将 freebase 向量与 gensim 一起使用

将 freebase 向量与 gensim 一起使用 的相关文章

随机推荐

热门标签

将 freebase 向量与 gensim 一起使用的相关文章