05 神经网络语言模型(独热编码+词向量的起源)

2023-10-30


统计语言模型

统计+语言模型–》用统计的方法去完成以下两个和人说的话相关的任务

语言模型 = 语言(人说的话) + 模型(去完成两个任务)

  1. 比较,“词性”,“磁性”
  2. 预测下一个单词(填空)

n 元语言模型

取 a(2,3,4) 个词

神经网络语言模型

神经网络+语言模型–》用神经网络的方法去完成以下两个和人说的话相关的任务。

第二个任务:

“判断”,“一个”,“词”,“的”,“___

假设词库里有“词性”和“火星”

P(__|“判断”,“一个”,“词”,“的”)

词性

img

w1,w2,w3,w4(上述 4 个单词的独热编码)

w1*Q=c1,
w2*Q=c2,
w3*Q=c3,
w4*Q=c4,

C=[c1,c2,c3,c4]
Q就是一个随机矩阵,是一个参数(可学习)

“判断”,“这个”,“词”,“的”,“词性”

softmax(U[tanh(WC+b1)]+b2)== [0.1, 0.1, 0.2, 0.2, 0.4] ∈ [ 1 , V L ] \in[1,V_L] [1,VL]

独热编码 (one-hot 编码)

独热编码:让计算机认识单词

img

词典 V(新华字典里面把所有词集合成一个集合 V)

假设词典里面只有 8 个单词

计算机不认识单词的

但是我们要计算机认识单词

“fruit”

独热编码:给出一个 8*8 的矩阵

“time” --》 10000000

“fruit” --》 01000000

“banana” --》 00000001

余弦相似度 去计算两者的相似度(0)–词向量(矩阵乘法)

词向量(神经网络语言模型的副产品 Q)

给我任何一个词,

“判断” --》 独热编码w1 [1,0,0,0,0]

w1*Q =c1 (“判断”这个词的词向量)

词向量:就是用一个向量来表示一个单词

可以控制词向量的维度(大小)

如果我们得到的词向量,第一个问题也被解决了,(下游任务)

总结

神经网络语言模型:通过神经网络解决两个人说的话的问题

有一个副产品:Q 矩阵–》新的词向量(词向量可以选择词向量的维度,可以求两个词之间的相似程度)

下游任务

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

05 神经网络语言模型(独热编码+词向量的起源) 的相关文章

  • idea中如何生成程序运行的时序图

    IDEA中如何生成程序运行的时序图 程序运行的时序图 可以帮助我们分析程序执行流程和理解一些关键的业务逻辑或者阅读源码 那么怎么样才能生成时序图尼 经过了一番寻找 发现idea中有个插件可以实现自动生成代码的时序图 时序图生成工具 Sequ
  • Linux模拟弱网丢包、延时和限制带宽

    Linux操作系统中的流量控制器TC Traffic Control 用于Linux内核的流量控制 主要是通过在输出端口处建立一个队列来实现流量控制 通过tc命令我们可以模拟弱网进行测试 note 命令中eth0是需要模拟弱网的网卡 可通过

随机推荐

  • pandas1-数据的增删改查

    文章目录 核心数据结构 Series DataFrame 数据查改 对Series操作 对DataFrame操作 对单列数据访问 对多列数据访问 对某几行访问 loc与iloc ix方法 数据修改 更新修改DataFrame中的数据 为Da
  • Java中的多线程

    java中的多线程是同时执行多个线程的过程 线程基本上是一个轻量级的子进程 是一个最小的处理单元 多处理和多线程都用于实现多任务 但是我们使用多线程而不是多进程 因为线程共享一个共同的内存区域 它们不分配单独的内存区域 因此节省内存 并且线
  • 我的Java后端书架

    这位大侠 这是我的公众号 程序员江湖 分享程序员面试与技术的那些事 干货满满 关注就送 我的Java后端书架 2016年暖冬4 0版 原文出处 江南白衣 书架主要针对Java后端开发 3 0版把一些后来买的 看的书添补进来 又或删掉或降级一
  • git: Your branch and 'origin/master' have diverged解决方法

    如果不需要保留本地的修改 只要执行下面两步 git fetch origin git reset hard origin master 当我们在本地提交到远程仓库的时候 如果遇到上述问题 我们可以首先使用如下命令 git rebase or
  • C++11 lambda函数

    用过脚本语言的童鞋都知道 函数的定义可以在任何地方 例如 local function table sort t local function sort by len t1 t2 return t1 lt t2 end table sort
  • 在idea中创建maven,修改pom.xml文件(二)

    续上 修改pom xml文件 1 springframework下载配置 2 打jar包文件时 配置成打包包涵依赖文件
  • 工具包安装-梳理

    文章目录 1 conda 虚拟环境安装 2 使用网络代理后网络连接断掉 解决 1 conda 虚拟环境安装 1 创建虚拟环境 conda create n env name python 3 7 使用 conda env list 查看已有
  • 一致性模型

    一致性模型
  • 熬夜总结的2022java面试题

    java面试宝典 前言 java基础 什么是面向对象 值传递和引用传递 和equals的区别是什么 重载和重写的区别 抽象类和接口的区别 构造器 Constructor 是否可被 override java静态变量 代码块 和静态方法的执行
  • Django(1)-创建django项目

    前提 已安装django 创建项目 django admin startproject mysite django 运行后 在当前目录下生成了一个项目 asgi py 为项目创建AGSI兼容web服务器入口 settings py 项目的配
  • Win11共享打印机错误0x00000040

    在办公打印的时候 想要连接共享打印机 但是遇到了错误0x00000040指定的网络名不再可用的提示 该如何解决呢 方法一 1 按键盘上的 Win X 组合键 或右键点击任务栏上的Windows 徽标 在打开的隐藏菜单项中 选择运行 2 运行
  • SpringCloud基础9——服务异步通信-高级篇

    导航 黑马Java笔记 踩坑汇总 JavaSE JavaWeb SSM SpringBoot 瑞吉外卖 SpringCloud SpringCloudAlibaba 黑马旅游 谷粒商城 目录 服务异步通信 高级篇 1 消息可靠性 1 1 生
  • linux脚本里ps进程多出一个,运行shell脚本时进程数量变多

    写了一个很简单的脚本 用于统计memcache进程的数量 bin bash echo ps aux grep memcache grep v grep wc l 然而在执行时却遇到了问题 work oss memcache status p
  • Linuxcentos7.5二进制安装mysql8.0.23(切勿继续踩坑)

    场景 这个量有点大 闲话不多说 都是小细节 开始 首先下载mysql8 0 23 这个你们可以去官网下载800多m 也可以使用我分享的这个 链接 https pan baidu com s 1S1ZQyjv9pOSr5zBsgt0lRA 提
  • c语言从文件中读取数据到链表_C语言

    点击上方 C语言中文社区 选择 设为星标 技术干货第一时间送达 作者 ancientear 原文 https www jianshu com p e43e795808aa 要求设计的管理系统能够实现以下功能 1 每一条记录包括一个学生的学号
  • 【Linux】解决运行sudo时提示sudo: unable to resolve host

    因为开发需要 把主机名从oldname修改成newname后 再运行sudo时会报一行错误 sudo unable to resolve host newname 解决方法 sudo gedit etc hosts打开 etc hosts
  • Linux LDAP搭建与使用

    Linux LDAP搭建与使用 标签 空格分隔 LDAP ubuntu ldap安装 执行以下命令安装ldap apt get install slapd ldap utils migrationtools dpkg reconfigure
  • 用keras进行猫狗识别(一)

    Keras是一个高层神经网络API Keras由纯Python编写而成并基Tensorflow Theano以及CNTK后端 Keras 为支持快速实验而生 能够把你的idea迅速转换为结果 如果你有如下需求 请选择Keras 简易和快速的
  • VMA与page fault

    一 红黑树与VMA 红黑树的应用 广泛用于 C 的 STL 中 set 和 map 是用红黑树实现的 Linux 的的进程调度 用红黑树管理进程控制块 进程的虚拟内存空间都存储在一颗红黑树上 每个虚拟内存空间都对应红黑树的一个节点 左指针指
  • 05 神经网络语言模型(独热编码+词向量的起源)

    博客配套视频链接 https space bilibili com 383551518 spm id from 333 1007 0 0 b 站直接看 配套 github 链接 https github com nickchen121 Pr