在 python 中加载预训练的手套向量

2024-01-07

我已经从互联网下载了预训练的手套矢量文件。它是一个 .txt 文件。我无法加载和访问它。使用 gensim 加载和访问词向量二进制文件很容易,但我不知道当它是文本文件格式时该怎么做。


手套模型文件采用词向量格式。您可以打开文本文件来验证这一点。以下是一小段代码,可用于加载预训练的手套文件:

import numpy as np

def load_glove_model(File):
    print("Loading Glove Model")
    glove_model = {}
    with open(File,'r') as f:
        for line in f:
            split_line = line.split()
            word = split_line[0]
            embedding = np.array(split_line[1:], dtype=np.float64)
            glove_model[word] = embedding
    print(f"{len(glove_model)} words loaded!")
    return glove_model

然后,您只需使用 gloveModel 变量即可访问词向量。

print(gloveModel['hello'])

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 python 中加载预训练的手套向量 的相关文章

  • 如何在 Windows 命令行中使用参数运行 Python 脚本

    这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
  • 如何在 R 中的 for 循环内将值存储在向量中

    我正在开始使用 R 但我对以下问题感到非常沮丧 我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中 问题是如何进行索引 因为for循环迭代代码的次数取决于用户的输入 所以变量i不一定要从1开始 它可以从80开始 for举个例
  • 管道:多个流消费者

    我编写了一个程序来计算语料库中 NGram 的频率 我已经有一个函数 它消耗一串令牌并生成一个订单的 NGram ngram Monad m gt Int gt Conduit t m t trigrams ngram 3 countFre
  • Python:返回 // 正则表达式之间的字符串[重复]

    这个问题在这里已经有答案了 我仍然不明白正则表达式 我阅读了文档 但是在我想出了正则表达式字符之后 那么如何使用它们呢 例如 我只想返回前两个斜杠之间的任何内容 en lemon peel n ca llimona n is 的输出应该是
  • 如何检查字符串是否严格包含字母和数字

    如何检查一个字符串是否是strictly同时包含字母和数字 关注还不够 def containsLettersAndNumber input if input isalnum return True else return False is
  • 对 std::vector 进行排序但忽略某个数字

    我有一个std vector
  • 迭代 pandas 数据框的最快方法?

    如何运行数据框并仅返回满足特定条件的行 必须在之前的行和列上测试此条件 例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
  • std::vector 迭代器失效

    之前有几个关于这个问题的问题 我的理解是调用std vector erase只会使位于某个位置的迭代器无效after被擦除的元素 然而 擦除一个元素后 该位置的迭代器是否仍然有效 当然 前提是它不指向end 擦除后 我对向量如何实现的理解似
  • 从 x,y 屏幕空间坐标查找 2D 等距网格上的列、行(将方程转换为函数)

    我试图在屏幕空间点 x y 的二维等距网格中找到行 列 现在我几乎知道我需要做什么 即找到上图中红色向量的长度 然后将其与表示网格边界的向量的长度 由黑色向量表示 进行比较 现在我在数学堆栈交换中寻求帮助 以获得用于计算点 x y 与黑色边
  • Django 中所有应用程序的基本模板

    我有一个包含 2 个应用程序的项目 project blog templates index html polls templates index html project templates base html index html 现在
  • 递归单元测试发现

    我有一个带有目录 tests 的包 我在其中存储单元测试 我的包裹看起来像 LICENSE models init py README md requirements txt tc py tests db test employee py
  • python-messaging 无法处理 HTTP 请求

    我正在使用下面的代码尝试使用 python messaging 发送彩信https github com pmarti python messaging blob master doc tutorial mms rst https gith
  • Lucene 标准分析器与 Snowball

    刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行 运行了一些测试查询 并注意到如果原始术语是单数 则复数查询不会返回结果 我知道雪球分析器增加了词干支持 这听起来不错 不过 我想知道 超过标准的雪球锣是否有任何
  • python 根据日期创建目录结构

    我使用以下函数根据今天的日期创建目录 usr bin python import time datetime os today datetime date today todaystr today isoformat os mkdir to
  • 获取 NLTK 索引的所有结果

    我正在使用 NLTK 来查找单词的一致性 但我不知道如何获取所有结果并将它们放入list or set 例如 text concordance word 仅打印前 25 个结果 TL DR text concordance lines 10
  • python类型中的__flags__有什么用

    我最近阅读了pickle源代码 以下代码在copy reg让我很困惑 HEAPTYPE 1 lt lt 9 def reduce ex self proto assert proto lt 2 for base in self class
  • 如何随机打乱向量中的元素

    我正在尝试完成一项需要发生以下情况的作业 请求所需的元素数量 n 用元素 0 1 2 n 1 填充向量并将其显示到控制台 随机打乱元素并将新的排列显示到控制台 我可以输入向量 但我不知道如何对向量进行洗牌 注意 我不能使用 random s
  • Tornado 和 WTForms

    我是第一次使用 WTForms 使用 WTForms 验证 Tornado 中的 POST 请求 以下是我的表格 表格 py class UserForm Form user TextField user validators Length
  • Aptana Python stdlib 与 virtualenv 的问题

    我最近开始开发一个项目 仅使用 vim 作为我的文本编辑器和 virtualenv 设置 我从 GitHub 在此 virtualenv 上安装了一些 API 最终 项目变得有点大了 超出了 vim 的处理能力 所以我不得不将项目移动到 I
  • scrapy蜘蛛如何将值返回给另一个蜘蛛

    我正在爬行的网站包含许多玩家 当我点击任何玩家时 我都可以进入他的页面 网站结构是这样的

随机推荐

  • Visual Studio 2017 错误无法打开“X”进行写入 - 对路径的访问被拒绝

    抱歉 我似乎无法修复此错误 严重性代码 说明 项目文件行抑制状态 错误 CS2012 无法打开 C Users Usuario source repos WindowsFormsApp1 WindowsFormsApp1 obj Debug
  • docker本地注册表“exec:\”htpasswd \“:在$ PATH中找不到可执行文件”

    直到最近这还工作得很好 docker run entrypoint htpasswd registry 2 Bbn myuser mypwd gt my registry2 reg hub auth htpasswd 现在它出错了 dock
  • 从结果集中创建长字符串

    我在存储过程中的 MS SQL 中有一个结果集 假设它有一个 VARCHAR 列 但有许多行 我想创建一个包含所有这些值的逗号分隔字符串 有没有一种简单的方法可以做到这一点 或者我是否必须逐步遍历每个结果并手动构建字符串 最好我想在存储过程
  • 访问不同端口中的 spring security,以字符串“anonymousUser”形式获取主要数据

    我有一个应用程序在我的本地 8100 中运行 我的服务器端代码在它已实现的 8065 中执行Spring Security作为 Java 配置 当我从 8100 ionic 浏览器窗口输入登录服务器代码时 我得到的原则对象数据只有字符串作为
  • 您的 Ruby 版本是 2.3.0,但您的 Gemfile 指定为 2.1.2

    我正在尝试设置一个现有项目 跑步时bundle install 我收到以下错误 我已经尝试了许多可能的解决方案 但对我不起作用 我也运行了建议的命令 例如gem pristine bcrypt version 3 1 10但对我不起作用 b
  • sbt 任务类路径

    我正在处理 sbt 任务 我希望能够访问一些应用程序类和依赖项 具体来说 我想使用 scalaquery 生成数据库 DDL 有什么方法可以将这些依赖项添加到任务中 或者我可能需要为此创建一个插件 object ApplicationBui
  • 复制到本地主机后,Wordpress 总是重定向到 https

    当我将 WordPress 安装从服务器复制到本地网络服务器 MAMP 并尝试访问时localhost 8888 它总是将 http 重定向到 https 所以我总是得到一个ERR SSL PROTOCOL ERROR 我在任何地方都找不到
  • Ninject 在 appharbor 上启动应用程序时崩溃

    我在部署在 appharbor 上的 MVC 3 项目上使用 Ninject 我注意到应用程序启动时出现异常 看起来 Ninject 内部的某些内容是原因 但我找不到任何答案 所以请帮助我 将尝试在此处添加完整的异常 Server Erro
  • Openid 禁止错误

    在我能够正确安装它 打开 id 库 后 我在让它工作时遇到了一些问题 我正在使用打开 id 选择器 http jvance com pages JQueryOpenIDPlugin xhtml一个 jquery 插件 问题是 当我单击任何打
  • 升级到 ADT 20 后,键盘在 Intel x86 Android 模拟器上停止工作

    我的意思是我不能再从笔记本电脑键盘输入 Android 模拟器了 虚拟键盘和屏幕键盘工作正常 升级到工具版本 20 后 我遇到了同样的问题 我必须编辑 AVD 以添加一个选项 如下所示 从 Eclipse 转到 AVD 管理器 选择特定的
  • 通过索引变量访问 SML 元组

    问题很简单 如何在SML中使用索引变量访问元组 val index 5 val tuple1 1 2 3 4 5 6 7 8 9 10 val correctValue index tuple1 我希望有人能够提供帮助 提前致谢 不存在接受
  • 配置 Flask 开发服务器在网络上可见

    我不确定这是否是 Flask 特定的 但是当我在开发模式下运行应用程序时 http localhost 5000 我无法从网络上的其他机器访问它 使用http dev host ip 5000 例如 当 Rails 处于开发模式时 它可以正
  • 如何在 Android 上的片段中使用共享首选项?

    我有一个片段 我想将 Facebook ID 存储在共享首选项中 我无法在获取首选项函数中编写私有模式 我还想在另一个片段中访问这个共享首选项 我怎样才能这样做呢 这是我的代码 Session openActiveSession getAc
  • 使用键盘输入切换值以进行绘图

    我有矩阵中的数据集 我想在一组上绘图 然后使用键盘输入移动到另一组 这很可能是这样的 for t 1 N plot data t pause end 但我想及时向前和向后移动t 例如使用箭头 好的 可以这样做 direction input
  • 如果 Ubuntu 上安装了多个 Java 版本,如何检查 Oracle Java 版本

    我两者都有OpenJDK and 甲骨文Java安装在我的 Ubuntu 上 如果激活的java是OpenJDK 有没有办法在bash shell中检查Oracle java的版本 update java alternatives l将列出
  • 非管理员用户上的客户端无法使用 net.pipe 与服务进行通信

    我有一个使用 net pipe 协议托管 WCF 服务的客户端应用程序 客户端无法与在管理员用户下运行的其他 WCF 服务通信 我读到您无法在不同用户之间使用 net pipe 进行通信 有办法绕过它吗 我读到您无法在之间使用 net pi
  • NSURLConnection 进度条与 sendAsynchronousRequest Objective-C

    我正在使用以下方法下载一堆较大的 zip 文件 这可能需要一段时间 所以我想显示一个进度条 我研究了如何使用 NSURLConnection 的委托方法 它看起来很简单 但是我想通过 sendAsynchronousRequest 实现同样
  • 在 SQL Server 中加密/在 .Net 4 中解密

    我知道这可能是这个问题的重复 如何在 sql server 中加密数据并在 net 应用程序中解密 https stackoverflow com questions 3202011 how to encrypt data in sql s
  • 可以在不播放动画的情况下加载 gif 动画吗?

    我想知道是否有一种方法可以阻止浏览器实际对加载到 a 中的动画 gif 进行动画处理 img 标签 我只想让它显示 gif 的第一帧而不播放动画 我已经担心这是不可能的 我必须提取第一帧并将其渲染到画布上 这是一个有点昂贵的解决方案 但如果
  • 在 python 中加载预训练的手套向量

    我已经从互联网下载了预训练的手套矢量文件 它是一个 txt 文件 我无法加载和访问它 使用 gensim 加载和访问词向量二进制文件很容易 但我不知道当它是文本文件格式时该怎么做 手套模型文件采用词向量格式 您可以打开文本文件来验证这一点