8.bidirectional_recurrent_neural_network

2023-11-08

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')
sequence_length=28
input_size=28
hidden_size=128
num_layers=2
num_classes=10
batch_size=100
num_epochs=1
learning_rate=0.001
train_dataset=torchvision.datasets.MNIST(root='../../data/',train=True,transform=transforms.ToTensor(),download=True)
test_dataset=torchvision.datasets.MNIST('../../data/',train=False,transform=transforms.ToTensor())
train_loader=torch.utils.data.DataLoader(dataset=train_dataset,batch_size=batch_size,shuffle=True)
test_loader=torch.utils.data.DataLoader(dataset=test_dataset,batch_size=batch_size,shuffle=False)
class BiRNN(nn.Module):
    def __init__(self,input_size,hidden_size,num_layers,num_classes):
        super(BiRNN,self).__init__()
        self.hidden_size=hidden_size
        self.num_layers=num_layers
        self.lstm=nn.LSTM(input_size,hidden_size,num_layers,batch_first=True,bidirectional=True)
        self.fc=nn.Linear(hidden_size*2,num_classes)
    def forward(self,x):
        h0=torch.zeros(self.num_layers*2,x.size(0),self.hidden_size).to(device)
        c0=torch.zeros(self.num_layers*2,x.size(0),self.hidden_size).to(device)
        out,_=self.lstm(x,(h0,c0))
        out=self.fc(out[:,-1,:])
        return out
model=BiRNN(input_size,hidden_size,num_layers,num_classes).to(device)
criterion=nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(model.parameters(),lr=learning_rate)
total_step=len(train_loader)
for epoch in range(num_epochs):
    for i,(images,lables) in enumerate(train_loader):
        images=images.reshape(-1,sequence_length,input_size).to(device)
        labels=lables.to(device)
        outputs=model(images)
        loss=criterion(outputs,lables)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        if (i+1)%100==0:
            print('epoch[{}/{}],step[{}/{}].loss:{:.4f}'.format(epoch+1,num_epochs,i+1,total_step,loss.item()))

with torch.no_grad():
    correct=0
    total=0
    for images,labels in test_loader:
        images=images.reshape(-1,sequence_length,input_size).to(device)
        labels=labels.to(device)
        outputs=model(images)
        _,predicted=torch.max(outputs.data,1)
        total+=labels.size(0)
        correct+=(predicted==lables).sum().item()
    print('test accuracy of the model on the 10000 test images:{}%'.format(100*correct/total))
torch.save(model.state_dict(),'model.ckpt')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AIGC

深度学习

Pytorch

神经网络

8.bidirectional_recurrent_neural_network 的相关文章

为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
PyTorch LSTM 中的“隐藏”和“输出”有什么区别？

我无法理解 PyTorch 的 LSTM 模块以及类似的 RNN 和 GRU 的文档关于输出它说输出输出 h n c n 输出 seq len batch hidden size num directions 包含RNN最后一层的
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Pytorch 中是否有一种方法可以以可反向传播的方式计算唯一值的数量？

给定以下张量这是网络的结果注意 grad fn tensor 121 241 125 1 108 238 125 121 13 117 121 229 161 13 0 202 161 121 121 0 121 121 242 125
如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM

随机推荐

词法分析器简介

词法分析器简介引言编译器的工作的开始就是读入源码预编译先不考虑然后去除一些空字符然后经过词素匹配并和其属性可选组成一个的词法单元多个词法单元连接成词法单元序列自此此法分析器的工作就算完成了呵呵就这么简单可见
sourcetree创建分支与分支合并

一 Sourcetree简单介绍通过Git可以进行对项目的版本管理但是如果直接使用Git的软件会比较麻烦因为是通过一条一条命令进行操作的 Sourcetree则可以与Git结合提供图形界面使用会方便很多 Git和Sourcetre
Flowable BPMN 用户手册 (v 6.3.0)

小编本来想学习 activity但是被同事强烈推荐学习Flowable 百度了一下发现Flowable是activity的一个升级第一步找学习资料找到一个分享给大家 https tkjohn github io flowable use
linux的核心安装下的命令行,linux lilo命令安装核心载入，开机管理程序

lilo linux loader 安装核心载入开机管理程序语法 lilo clqtV b C d D f i I m P r R s S uU v 补充说明 lilo 是个 Linux 系统核心载入程序同时具备管理开机的功能单独
合理使用 inline来优化程序尽可能减少临时对象尽可能使用初始化列表

1 合理使用inline 调用函数实际上将程序执行顺序转移到函数所存放在内存中某个地址将函数的程序内容执行完后再返回到转去执行该函数前的地方这种转移操作要求在转去前要保护现场并记忆执行的地址转回后先要恢复现场并按原来保存地址
Would you like Visual Studio Code to periodically run “git fetch“?是什么意思？

这句话的意思是你是否想让Visual Studio Code定期运行 git fetch 命令 git fetch 是 Git 命令之一用于从远程代码仓库获取最新的代码变动但不会自动将这些变动合并到你当前所在的分支该命令通常用于更新
Python os.path模块的使用

Python os path模块的使用 Python的os模块是一个对接操作系统的模块当我们需要对路径进行操作时可以使用os path os path模块实现了很多处理长文件名长路径名的函数可以用来对路径切分拼接转换等先导入o
Seata分布式事务失效踩坑记录

在学习Seata过程中偶然发现了一个坑这里做个记录环境说明先说下我的环境我是搭建了一个SpringCloud微服务然后A服务调用B服务然后在这两个服务都集成了Seata 集成过程是没有问题的业务场景是注册场景 A服务中需要操
01-java学习笔记【接口与抽象类】

这些是我自己的理解加上网上优秀的分享总结出来的抽象类是用来捕捉子类的通用特性的它不能被实例化只能被用作子类的超类抽象类是被用来创建继承层级里子类的模板接口是抽象方法的集合如果一个类实现了某个接口那么它就继承了这个接口的抽象方法
papers with code介绍（人工智能方向研究生的必备网站）

paperswithcode介绍人工智能方向的必备网站本文将从两个部分介绍一正文二导航 A browse State of the Art B Datasets C Method D More 网站首页一正文 2 最上面是四
Python中RSA加密

文章目录 RSA加密一概述 1 简介 2 签名 3 环境配置二算法实现 1 公钥和私钥 2 加密和解密 3 签名和解签 RSA加密一概述 1 简介 RSA是非对称的也就是用来加密的密钥和用来解密的密钥不是同一个和DES一样的
LCD背光控制芯片

PWM信号可通过调整占空比来调节输出电压可以使用PWM来控制LCD的背光但CPU的pwm引脚驱动能力太弱常外接一个背光芯片 rt9293就是这样的一个恒流升压转换器 Iled Vref Rset Vfb Duty 300mV Duty
论文阅读_大语言模型_Llama2

英文名称 Llama 2 Open Foundation and Fine Tuned Chat Models 中文名称 Llama 2 开源的基础模型和微调的聊天模型文章 http arxiv org abs 2307 09288 代码
js怎样判断引用类型和值类型？

1 typeof 输出的类型 console log typeof y undefined console log typeof 101 number console log typeof hello string console log
如何使用logging生成日志

GiantPandaCV导语日志对程序执行情况的排查非常重要通过日志文件可以快速定位出现的问题本文将简单介绍使用logging生成日志的方法 logging模块介绍 logging是python自带的包一共有五个level deb
https 访问 iframe 的http

最近做的项目要求https 嵌入http的项目浏览器老是提示https不能访问http 为了满足需求在本地项目中添加了nginx转发服务将项目中的iframe 转发为https 再又nginx将https转发至http 满足需求了 n
1. 经验累积分布函数

为了说明经验累积分布函数我们这里使用一个学生成绩的数据集假设班有50名学生这些学生刚刚进行了一个测试这个测试的结果是以0 100的分数来体现的我们要如何更好的可视化结果呢例如确定成绩的最大值和最小值对于这个数据的可视化我们可
jar包修改并重新打包，jar包反编译使用工具以及修改代码方法

jar包修改并重新打包 jar包反编译使用工具以及修改代码方法备忘 https blog csdn net tomcat zhu article details 79240011
unity中的reflectionProbe的使用

下面说一下Reflection Probe 大家都知道当使用标准着色器时每一个材质都会具有一定程度的镜面反射 specularity 和金属反射 metalness 属性在没有强大的硬件来处理即时光迹追踪反射的情况下我们得仰赖预先计
8.bidirectional_recurrent_neural_network

import torch import torch nn as nn import torchvision import torchvision transforms as transforms device torch device cu

8.bidirectional_recurrent_neural_network

8.bidirectional_recurrent_neural_network 的相关文章

随机推荐

热门标签