lstmcell转onnx报错自定义pytorch模型替换

2023-10-27

lstmcell在转onnx的时候会遇到不支持的情况，如果模型已经训练好，可以通过自己实现lstmcell的方式，加载训练好的权重；以下是实现代码

class MyLSTMCell(nn.Module):
    def __init__(self, input_size, hidden_size):
        super(MyLSTMCell, self).__init__()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.weight_ih = nn.Parameter(torch.Tensor(4 * hidden_size, input_size))
        self.weight_hh = nn.Parameter(torch.Tensor(4 * hidden_size, hidden_size))
        self.bias_ih = nn.Parameter(torch.Tensor(4 * hidden_size))
        self.bias_hh = nn.Parameter(torch.Tensor(4 * hidden_size))
        self.reset_parameters()

    def reset_parameters(self):
        nn.init.kaiming_uniform_(self.weight_ih, a=math.sqrt(5))
        nn.init.kaiming_uniform_(self.weight_hh, a=math.sqrt(5))
        nn.init.zeros_(self.bias_ih)
        nn.init.zeros_(self.bias_hh)

    def forward(self, input, hx):
        # input: (batch_size, input_size)
        # hx: (batch_size, hidden_size)
        hx = hx[0] if isinstance(hx, tuple) else hx
        gates = (input @ self.weight_ih.t() + self.bias_ih +
                 hx @ self.weight_hh.t() + self.bias_hh)
        ingate, forgetgate, cellgate, outgate = gates.chunk(4, 1)
        ingate = torch.sigmoid(ingate)
        forgetgate = torch.sigmoid(forgetgate)
        cellgate = torch.tanh(cellgate)
        outgate = torch.sigmoid(outgate)
        cy = (forgetgate * hx) + (ingate * cellgate)
        hy = outgate * torch.tanh(cy)
        return hy, cy

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

深度学习

Powered by 金山文档

lstmcell转onnx报错自定义pytorch模型替换的相关文章

检查 PyTorch 张量在 epsilon 内是否相等

如何检查两个 PyTorch 张量在语义上是否相等考虑到浮点错误我想知道元素是否仅相差一个小的 epsilon 值在撰写本文时这是最新稳定版本 0 4 1 中的一个未记录的函数但文档位于master unstable branch
MNIST、torchvision 中的输出和广播形状不匹配

在 Torchvision 中使用 MNIST 数据集时出现以下错误 RuntimeError output with shape 1 28 28 doesn t match the broadcast shape 3 28 28 这是我的
PyTorch：tensor.cuda（）和tensor.to（torch.device（“cuda：0”））之间有什么区别？

在 PyTorch 中以下两种将张量或模型发送到 GPU 的方法有什么区别 Setup X np array 1 3 2 3 2 3 5 6 1 2 3 4 X model X torch DoubleTensor X Method
pytorch - “conv1d”在哪里实现？

我想看看 conv1d 模块是如何实现的https pytorch org docs stable modules torch nn modules conv html Conv1d https pytorch org docs stabl
Pytorch 数据加载器：错误的文件描述符和 EOF > 0

问题描述在使用由自定义数据集制作的 Pytorch 数据加载器进行神经网络训练期间我遇到了奇怪的行为数据加载器设置为workers 4 pin memory False 大多数时候训练都顺利完成有时训练会随机停止并出现以下错误
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
我可以使用逻辑索引或索引列表对张量进行切片吗？

我正在尝试使用列上的逻辑索引对 PyTorch 张量进行切片我想要与索引向量中的 1 值相对应的列切片和逻辑索引都是可能的但是它们可以一起吗如果是这样怎么办我的尝试不断抛出无用的错误类型错误使用 ByteTensor 类型的
查找张量中沿轴的非零元素的数量

我想找到沿特定轴的张量中非零元素的数量有没有 PyTorch 函数可以做到这一点我尝试使用非零 http pytorch org docs master torch html highlight nonzero torch nonzer
为什么测试时一定要用DataParallel？

在GPU上训练 num gpus设置为1 device ids list range num gpus model NestedUNet opt num channel 2 to device model nn DataParallel m
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p

随机推荐

Linux笔记

命令提供一定功能的工具 ssh 提供远程登录功能参数命令的作用对象 193 3 3 3 远程登录的作用主机选项命令作用的方式 p 22 通过22端口登录到主机电脑外壳shell 内核输入输出设备用户提供意愿转化为命令与
nestjs：Cannot read property ‘retryAttempts‘ of undefined

描述 Cannot read property retryAttempts of undefined 解决检查数据库的配置是否有问题
日期格式化方法

时间格式化有时候我们会用到时间的展示时间的展示种类也是各种各样对于不用的产品需要不同的样式这时候就需要我们做一下时间的格式化处理下面是一种常见的日期显示方式代码如下格式化时间 param String date 原始时间格式
23种设计模式（七） —— 手写实现 Builder 模式（组装复杂实例）

文章目录一 Builder 模式二示例 2 1 示例实现功能 2 2 具体实现 2 3 运行结果三 Builder 模式中登场的角色四原文链接 Author Gorit Date 2021 10 24 2021年发表博文 22
你还不知道的简历准备及面试技巧

最近已经不止听到一位朋友吐槽工作不好找了一波又一波的裁员潮 ChatGPT 等人工智能工具的爆火 1158 万的应届毕业生都让今年 IT 行业的就业状况雪上加霜面对愈加激烈的求职竞争作为程序员应该掌握哪些面试技巧本文邀请了 2
Internet的路由选择协议(RIP、OSPF)

有关路由选择协议的几个概念 1 理想的路由算法路由选择协议的核心就是路由算法即路由器通过算法来获得路由一个理想的路由算法应该具有以下的特点算法必须是正确和完整的算法在计算上应简单算法应能适应通信量和网络拓扑的变化算法应具有稳定
OSG仿真案例（9）——JY61陀螺仪控制飞机姿态

前言在调试osg中模型运动姿态时总觉得直观性不够强所以有了想买个硬件陀螺仪当时并不知道这个硬件应该叫什么名字在淘宝搜索角度传感器的几个驱动 1 CH340驱动这个驱动在自带资源包里面但是不可以用只能自己在网上找发现是型号
数据库JDBC --- Java Database Connectivity

数据库JDBC Java Database Connectivity 关于JDBC 什么是JDBC JDBC的组成 JDBC API JDBC的数据类型创建JDBC的步骤常用属性 Result Set ResultSetMetaData
Oracle使用IN 不能超过1000问题

1 美图 2 背景是写代码的是遇到问题 ORA 01795 列表中的最大表达式数为 1000 虽然使用了批量处理解决了问题但是因为是使用了myIbatis spring boot oracle 我不太想直接改代码想通过修改myIb
25行jQuery代码实现轮播图

对于刚刚学习前端的同学来说做一个轮播图是非常不容易的今天我就将自己的心得跟和大家分享一下实现轮播图有很多方法今天我们就讲其中一种方法让图片显示在一行内然后让图片有规律的向左移动大家可以先看看效果http www shareko
sqli-labs (less-24)

sqli labs less 24 进入24关输入用户名和密码登入后会显示你的用户名下面的输入框就是改密码我在输入用户名和密码的位置试了很多次发现用户名和密码的位置是没有注入点的这里我们先点击右下角的 New User clic
Flutter-设置分割线Divider

Divider height 1 0 indent 0 0 color MyColors color gray 150
PowerBI开发第十八篇：行级安全（RLS）

PowerBI可以通过RLS Row level security 限制用户对数据的访问过滤器在行级别限制数据的访问用户可以在角色中定义过滤器通过角色来限制数据的访问在PowerBI Service中 workspace中的memb
uniapp getUserProfile:fail invalid session

uniapp uni getUserProflie 部分安卓手机调不起来弹窗错误原因应该在uni getUserProflie之前调用uni login 但是直接在uni login的成功回调里面调用uni getUserProflie
九、Linux系统中的文件传输

九 Linux系统中的文件传输实验准备两台可以通信的主机 systemctl disable firewalld systemctl stop firewalld 9 1 scp命令上传 scp 本地文件远程主机用户远程主机ip
SDUT 2023 summer team contest（for 22) - 14

A Amanda Lounges 题意有n个机场 m条边对于每个机场可能需要等候室也可能不需要如果输入2 代表路线连接的两个机场都需要建立输入1 代表路线连接的其中一个机场建立必须输入0代表路线连接的两个机场都不可以建立问你最
关于https页面使用ifream嵌套http页面问题解决

之前公司项目部署的时候协议用的http 然后前几天把协议换成了https的当时也没仔细测试觉得没什么问题然后昨天发现其中的某个播放视频的页面显示不出来了报错信息接着上这个页面的部分代码就是这个页面用ifram嵌套了另一个项目
MyBatisPlus-黑马-笔记

MyBatisPlus 目录入门案例标准数据层开发标准CRUD使用分页 DQL编程控制条件查询 null判定查询投影查询条件等值查询范围查询模糊查询映射匹配兼容性 DML编程控制 id生成策略控制多记录操作逻辑删除
window.close()失效问题

一般的窗口关闭的JS如下写法 window close 但是呢 chrome firefox等中有时候会不起作用改为下面的写法 window open about blank self close 或者 window open self
lstmcell转onnx报错自定义pytorch模型替换

lstmcell在转onnx的时候会遇到不支持的情况如果模型已经训练好可以通过自己实现lstmcell的方式加载训练好的权重以下是实现代码 class MyLSTMCell nn Module def init self input

lstmcell转onnx报错 自定义pytorch模型替换

lstmcell转onnx报错 自定义pytorch模型替换 的相关文章

随机推荐

热门标签

lstmcell转onnx报错自定义pytorch模型替换

lstmcell转onnx报错自定义pytorch模型替换的相关文章