如何在 RNN 中嵌入句子序列？

2024-01-11

我正在尝试制作一个 RNN 模型（在 Pytorch 中），它需要几个句子，然后将其分类为Class 0 or Class 1.

为了解决这个问题，我们假设句子的 max_len 为 4，max_amount of time steps 为 5。因此，每个数据点都在表单上（0 是用于填充填充值的值）：

    x[1] = [
    # Input features at timestep 1
    [1, 48, 91, 0],
    # Input features at timestep 2
    [20, 5, 17, 32],
    # Input features at timestep 3
    [12, 18, 0, 0],
    # Input features at timestep 4
    [0, 0, 0, 0],
    # Input features at timestep 5
    [0, 0, 0, 0]
    ]
    y[1] = [1]

当我刚刚每个目标一句话：我只是将每个单词传递到嵌入层，然后传递到 LSTM 或 GRU，但是当我有一个单词时，我有点不知道该怎么做。每个目标的句子序列?

如何构建可以处理句子的嵌入？

最简单的方法是使用2种LSTM。

准备玩具数据集

xi = [
# Input features at timestep 1
[1, 48, 91, 0],
# Input features at timestep 2
[20, 5, 17, 32],
# Input features at timestep 3
[12, 18, 0, 0],
# Input features at timestep 4
[0, 0, 0, 0],
# Input features at timestep 5
[0, 0, 0, 0]
]
yi = 1

x = torch.tensor([xi, xi])
y = torch.tensor([yi, yi])

print(x.shape)
# torch.Size([2, 5, 4])

print(y.shape)
# torch.Size([2])

Then, x是输入的批次。这里batch_size = 2.

嵌入输入

vocab_size = 1000
embed_size = 100
hidden_size = 200
embed = nn.Embedding(vocab_size, embed_size)

# shape [2, 5, 4, 100]
x = embed(x)

第一个词-LSTM是将每个序列编码成一个向量

# convert x into a batch of sequences
# Reshape into [2, 20, 100]
x = x.view(bs * 5, 4, 100)

wlstm = nn.LSTM(embed_size, hidden_size, batch_first=True)
# get the only final hidden state of each sequence

_, (hn, _) = wlstm(x)

# hn shape [1, 10, 200]

# get the output of final layer
hn = hn[0] # [10, 200]

第二个 seq-LSTM 是将序列编码成单个向量

# Reshape hn into [bs, num_seq, hidden_size]
hn = hn.view(2, 5, 200)

# Pass to another LSTM and get the final state hn
slstm = nn.LSTM(hidden_size, hidden_size, batch_first=True)
_, (hn, _) = slstm(hn) # [1, 2, 200]

# Similarly, get the hidden state of the last layer
hn = hn[0] # [2, 200]

添加一些分类层

pred_linear = nn.Linear(hidden_size, 1)

# [2, 1]
output = torch.sigmoid(pred_linear(hn))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

neuralnetwork

Pytorch

recurrentneuralnetwork

Embedding

如何在 RNN 中嵌入句子序列？的相关文章

Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
使用 numpy 在 python 中执行最大方差旋转

我正在研究矩阵的主成分分析我已经找到了如下所示的组件矩阵 A np array 0 73465832 0 24819766 0 32045055 0 3728976 0 58628043 0 63433607 0 72617152 0 5
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
如何在 robobrowser-python 中发出 POST 请求

http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
更改 Python Cmd 模块处理自动完成的方式

我有一个 Cmd 控制台设置为自动完成 Magic the Gathering 收藏管理系统的卡牌名称它使用文本参数在数据库中查询卡片并使用结果自动完成建议卡片然而这些卡片名称有多个单词 Cmd 会从last到行尾的空间例如
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010

随机推荐

关联的“保存前”回调

保存父对象时如何调用关联上的 before save 回调例如 class Company lt ActiveRecord Base belongs to user before save Proc new Not called end
Selenium 单击一次，但下次单击返回 StaleElementReferenceException

import sys import urllib2 import time from bs4 import BeautifulSoup from selenium import webdriver import string import
如何检查 Windows 窗体中两个控件是否重叠

我创建了一个类允许用户在表单上拖动面板我怎样才能确保用户不会将两个面板放在一起如果它们这样做我想在它们都重叠时移动或突出显示其中一个控件我尝试在 OnMouseDown 事件中设置它但这不太有效此外表单上的面板数量根据表
从像素到 NDC 的转换

假设我的屏幕是 800 600 并且我使用以下顶点位置绘制了一个四边形 2D 三角形条带在国家数据中心 float vertices 0 2f 0 2f 0 2f 0 2f 0 2f 0 2f 0 2f 0 2f 我以这种方式设置我的变
需要创建一个或多个导入周期来编译该组件，当前编译器配置不支持这一点

我有一个旧的角度库当我迁移到angular 12并尝试构建我的库我收到以下错误 projects namespace lin folder src lib components alerts alerts component ts 7 1
如何通过 Enum 执行 LINQ 查询？

下面是我的Enumerator List public enum StatusEnum Open 1 Rejected 2 Accepted 3 Started 4 Completed 5 Cancelled 6 Assigned 7 我需
如何使用

我正在尝试使用我这样调用该函数
Django REST Framework 中序列化器验证的顺序

情况在 Django REST Framework 中进行验证时ModelSerializer 我注意到Meta model字段始终经过验证即使这样做不一定有意义以下面的例子为例User模型的序列化我有一个创建用户的端点因此有一
如何强制本机应用程序使用较旧的 C 运行时

Visual Studio 2010 安装 VC9 运行时的 4974 版本其 pdb 不可用 http social msdn microsoft com Forums en US vcgeneral thread dd8783ec 3
Spring Boot、Keycloak 和 Vaadin 集成问题

我一直在玩 Spring Boot 并成功地在不同的项目中分别使用 Keycloak 和 Vaadin 现在我想将两者结合起来以避免必须使用 Vaadin 实现我自己的安全性到目前为止我得到的结果可以在这里找到 github项目 ht
如何编写正则表达式来重复捕获较大匹配中的组？

我对正则表达式感到头疼所以希望有人可以帮助我我正在做一些文件语法转换文件中出现这种情况 OpenMarker keyword some expression keyword some expression keyword some e
如何在 Silverlight 中通过名称获取 DependencyProperty？

情况我有一个字符串表示 Silverlight 中 TextBox 的 DependencyProperty 的名称例如文本属性我需要获取对 TextBox 的实际 TextProperty 的引用它是一个 Dependency
使用单个事件处理程序检测元素内部/外部的单击

假设我的页面中有一个 div 如何通过 JavaScript 或 JQuery 检测用户点击 div 内容或 div 内容之外请帮忙处理小代码片段谢谢 Edit 正如下面的答案之一所述我只想将事件处理程序附加到我的主体并且还想知道单
从 pdf 中提取文本的最佳 Perl 模块是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Linux 脚本检查进程是否正在运行并对结果采取行动

我有一个经常失败的进程有时会启动重复的实例当我跑步时 ps x grep v grep grep c processname 我会得到 2这是正常的因为该进程与恢复进程一起运行如果我有0我想开始这个过程如果我有 4我想停止并重新启
使用 ruby 将 unicode 转换为字符

我找到了unicode的汉字词典我正在尝试用这本字典建立一个字符数据库但我不知道如何将 unicode 转换为字符 p 国 unpack U first this gives the unicode 22269 怎样才能转换22269返
Python os.forkpty 为什么我不能让它工作

import pty import os import sys import time pid fd os forkpty if pid 0 Slave os execlp su su MYUSERNAME c id Master prin
如何使用 Go 驱动程序在 Mattermost 中从机器人发送直接消息？

使用 Mattermost 的 Go 驱动程序是否可以从机器人帐户向用户发送直接消息我一直在尝试下面的这种方法但我不断收到错误您没有适当的权限我已经多次检查了机器人的权限它应该能够发送消息我已经确认它也可以将消息发送到公共渠道
Android 在首选项中存储数组

我知道只有原语可以存储在android首选项中但是数组算吗我可以在 Android 首选项中存储字符串或布尔值数组吗仅当将数组转换为字符串时
如何在 RNN 中嵌入句子序列？

我正在尝试制作一个 RNN 模型在 Pytorch 中它需要几个句子然后将其分类为Class 0 or Class 1 为了解决这个问题我们假设句子的 max len 为 4 max amount of time steps 为 5