Graph Wavenet：入门图神经网络训练的demo

2023-11-17

1. 数据的准备

DCRNN的github项目有完整的数据

Graph Wavenet 提供的数据缺少 '/data/sensor_graph/adj_mx.pkl'

2. engine.train 与engine.eval 的区别

区别仅在于model.train()与model.eval()

具体区别见https://blog.csdn.net/qq_43118572/article/details/118615095

class trainer():
    def __init__(self, scaler, in_dim, seq_length, num_nodes, nhid, dropout, lrate, wdecay,
                 device, supports, gcn_bool, addaptadj, aptinit):
        self.model = gwnet(device, num_nodes, dropout, supports=supports, gcn_bool=gcn_bool, aptinit=aptinit, in_dim=in_dim,
                           out_dim=seq_length, residual_channels=nhid, skip_channels=nhid * 8, end_channels=nhid *16)
        self.model.to(device)
        self.optimizer = optim.Adam(self.model.parameters(), lr=lrate, weight_decay=wdecay)
        self.loss = util.masked_mae
        self.scaler = scaler
        self.clip = 5
    
    def train(self, input, real_val):
        self.model.train()
        self.optimizer.zero_grad()
        input = nn.functional.pad(input, (1,0,0,0))
        output = self.model(input)
        output = output.transpose(1,3)
        real = torch.unsqueeze(real_val, dim=1)
        predict = self.scaler.inverse_transform(output)

        loss = self.loss(predict, real, 0.0)
        loss.backward()
        if self.clip is not None:
            # 梯度剪切，规定了最大不能超过的max_norm.
            torch.nn.utils.clip_grad_norm_(self.model.parameters(), self.clip)
        self.optimizer.step()
        mape = util.masked_mape(predict, real, 0.0).item()
        rmse = util.masked_rmse(predict, real, 0.0).item()
        return loss.item(), mape, rmse

    def eval(self, input, real_val):
        self.model.eval()
        input = nn.functional.pad(input, (1, 0, 0, 0))
        with torch.no_grad():
            output = self.model(input)
        output = output.transpose(1, 3)

        real = torch.unsqueeze(real_val, dim=1)
        predict = self.scaler.inverse_transform(output)
        loss = self.loss(predict, real, 0.0)
        mape = util.masked_mape(predict, real, 0.0).item()
        rmse = util.masked_rmse(predict, real, 0.0).item()
        return loss.item(), mape, rmse

3. masked loss

具体原因查看：https://blog.csdn.net/qq_43118572/article/details/118698359

4. utils用到的函数：

import pickle
import numpy as np
import os
import scipy.sparse as sp
import torch
from scipy.sparse import linalg

class DataLoader(object):
    def __init__(self, xs, ys, batch_size, pad_with_last_sample=True):
        self.batch_size = batch_size
        self.current_ind = 0
        if pad_with_last_sample:
            num_padding = (batch_size - (len(xs) % batch_size)) % batch_size
            x_padding = np.repeat(xs[-1:], num_padding, axis=0)
            y_padding = np.repeat(ys[-1:], num_padding, axis=0)
            xs = np.concatenate([xs, x_padding], axis=0)
            ys = np.concatenate([ys, y_padding], axis=0)

        self.size = len(xs)
        self.num_batch = int(self.size // self.batch_size)
        self.xs = xs
        self.ys = ys

    def shuffle(self):
        permutation = np.random.permutation(self.size)
        xs, ys = self.xs[permutation], self.ys[permutation]
        self.xs = xs
        self.ys = ys

    # 产生批数据的生成器
    def get_iterator(self):
        self.current_ind = 0

        def _wrapper():
            while self.current_ind < self.num_batch:
                start_ind = self.batch_size * self.current_ind
                end_ind = min(self.size, self.batch_size * (self.current_ind + 1))
                x_i = self.xs[start_ind:end_ind, ...]
                y_i = self.ys[start_ind:end_ind, ...]
                yield (x_i, y_i)

        return _wrapper()

class StandardScaler():
    def __init__(self, mean, std):
        self.mean = mean
        self.std = std

    # 批正则化数据
    def transform(self, data):
        return (data - self.mean) / self.std

    # 批正则化数据逆运算
    def inverse_transform(self, data):
        return data*self.std + self.mean

# [A * D^(-1/2)]^T * D^(-1/2) = D^(-1/2) * A * D^(-1/2)
def sym_adj(adj):
    """Symmetrically normalize adjacency matrix."""
    adj = sp.coo_matrix(adj)  # 转换为coordinate形式的压缩邻接矩阵
    rowsum = np.array(adj.sum(1))
    d_inv_sqrt = np.power(rowsum, - 0.5).flatten()  # 将n*1的矩阵转换为1个向量
    d_inv_sqrt[np.isinf(d_inv_sqrt)] = 0.
    d_mat_inv_sqrt = sp.diags(d_inv_sqrt) # ndarray类型
    # toarray returns an ndarray; todense returns a matrix. If you want a matrix, use todense otherwise, use toarray
    return adj.dot(d_mat_inv_sqrt).transpose().dot(d_mat_inv_sqrt).astype(np.float32).todense()

# D^(-1/2) * A
def asym_adj(adj):
    adj = sp.coo_matrix(adj)
    rowsum = np.array(adj.sum(1))
    d_inv = np.power(rowsum, -1).flatten()
    d_inv[np.isinf(d_inv)] = 0.
    d_mat = sp.diags(d_inv)
    return d_mat.dot(adj).astype(np.float32).todense()

def calculate_normalized_laplacian(adj):
    # L = D^-1/2 (D-A) D^-1/2 = I - D^-1/2 A D^-1/2
    # D = diag(A 1)

    # 由于下面用到的是与稀疏的单位阵相减，故需要tocoo()
    D_tilde = sym_adj(adj).tocoo()
    normarlized_laplacian = sp.identity(np.size(adj)[0]) - D_tilde
    return normarlized_laplacian

def calculate_scaled_laplacian(adj_mx, lambda_max=2, undirected=True):
    if undirected:
        adj_mx = np.maximum.reduce([adj_mx, adj_mx.T])
    L = calculate_normalized_laplacian(adj_mx)
    if lambda_max is None:
        # ‘LM’ : Largest (in magnitude) eigenvalues.
        # 返回1个绝对值最大的特征值与特征向量
        lambda_max, _ = linalg.eigsh(L, 1, which='LM')
        lambda_max = lambda_max[0]
    # 转换为稀疏矩阵
    L = sp.csc_matrix(L)
    M, _ = L.shape  # 原始矩阵的行数
    I = sp.identity(M, format='csr', dtype=L.dtype)
    L = (2 / lambda_max * L) - I
    return L.astype(np.float32).todense()

def load_pickle(pickle_file):
    try:
        with open(pickle_file, 'rb') as f:
            pickle_data = pickle.load(f)
    except UnicodeDecodeError as e:
        with open(pickle_file, 'rb') as f:
            pickle_data = pickle.load(f, encoding='latin1')
    except Exception as e:
        print('Unable to load data', pickle_file, ':', e)
        raise
    return pickle_data

def load_adj(pkl_filename, adjtype):
    sensor_ids, sensor_id_to_ind, adj_mx = load_pickle(pkl_filename)
    if adjtype == "scalap":
        adj = [calculate_scaled_laplacian(adj_mx)]
    elif adjtype == "normlap":
        adj = [calculate_normalized_laplacian(adj_mx).astype(np.float32).todense()]
    elif adjtype == "symnadj":
        adj = [sym_adj(adj_mx)]
    elif adjtype == "transition":
        adj = [asym_adj(adj_mx)]
    elif adjtype == "doubletransition":
        adj = [asym_adj(adj_mx), asym_adj(np.transpose(adj_mx))]
    elif adjtype == "identity":
        adj = [np.diag(np.ones(adj_mx.shape[0])).astype(np.float32)]
    else:
        error = 0
        assert error, "adj type not defined"
    return sensor_ids, sensor_id_to_ind, adj

# 返回train_loader、val_loader、test_loader及归一化所需的均值与方差参数
def load_dataset(dataset_dir, batch_size, valid_batch_size=None, test_batch_size=None):
    data = {}
    for category in ['train', 'val', 'test']:
        cat_data = np.load(os.path.join(dataset_dir, category+'.npz'))
        data['x_' + category] = cat_data['x']
        data['y_' + category] = cat_data['y']

    scaler = StandardScaler(mean=data['x_train'][..., 0].mean(), std=data['x_train'][..., 0].std())
    # Data format
    for category in ['train', 'val', 'test']:
        data['x_' + category][..., 0] = scaler.transform(data['x_' + category][..., 0])
    data['train_loader'] = DataLoader(data['x_train'], data['y_train'], batch_size)
    data['val_loader'] = DataLoader(data['x_val'], data['y_val'], valid_batch_size)
    data['test_loader'] = DataLoader(data['x_test'], data['y_test'], test_batch_size)
    data['scaler'] = scaler
    return data

def masked_mse(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels != null_val)
    mask = mask.float()
    mask /= torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = (preds - labels) ** 2
    loss = loss * mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)

def masked_rmse(preds, labels, null_val=np.nan):
    return torch.sqrt(masked_mse(preds=preds, labels=labels, null_val=null_val))

def masked_mae(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels != null_val)
    mask = mask.float()
    mask /= torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)
    loss *= mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)

def masked_mape(preds, labels, null_val=np.nan):
    if np.isnan(null_val):
        mask = ~torch.isnan(labels)
    else:
        mask = (labels != null_val)
    mask = mask.float()
    mask /= torch.mean((mask))
    mask = torch.where(torch.isnan(mask), torch.zeros_like(mask), mask)
    loss = torch.abs(preds-labels)/labels
    loss *= mask
    loss = torch.where(torch.isnan(loss), torch.zeros_like(loss), loss)
    return torch.mean(loss)

def metric(pred, real):
    # torch.tensor.item(): Returns the value of this tensor as a standard Python number.
    mae = masked_mse(pred, real, 0.0).item()
    mape = masked_mape(pred, real, 0.0).item()
    rmse = masked_rmse(pred, real, 0.0).item()
    return mae, mape, rmse

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

机器学习

Graph Wavenet：入门图神经网络训练的demo 的相关文章

如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
使用 pytorch 获取可用 GPU 内存总量

我正在使用 google colab 免费 Gpu 进行实验并想知道有多少 GPU 内存可供使用 torch cuda memory allocated 返回当前占用的 GPU 内存但我们如何使用 PyTorch 确定总可用内存 PyT
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
如何将 35 类城市景观数据集转换为 19 类？

以下是我的代码的一小段使用它我可以在城市景观数据集上训练名为 lolnet 的模型但数据集包含 35 个类别标签 0 34 imports trainloader torch utils data DataLoader datase
无法在 Windows 10 上构建 Detectron2

尽管 Windows 上的 Detectron2 没有官方支持但有很多可用的说明我尝试按照这些说明进行操作但最终出现了相同的错误这是我的设置 OS Windows 10 专业版 19043 1466 微软视觉工作室 2019 CUD

随机推荐

从零开始，教你如何开发一款自己的 IDEA 插件！

程序员的成长之路互联网程序员技术资料共享关注阅读本文大概需要 4 分钟来自 blog csdn net smile 795 article details 125470136 idea插件介绍作为一枚程序员平时最常用的id
cdn服务器pnk_cdn服务器是什么

对于cdn我们不陌生你听过cdn服务器吗 CDN服务器是建立在网络上的内容分发网络依托布置在各地的边缘服务器用户可以经过中央渠道的负载平衡内容分发调度等功用模块获取附近所需的内容然后减少网络拥塞进步用户拜访响应速度和命中率为
数据结构与算法——线性表的顺序储存结构

目录前言一顺序储存的定义及储存方式二地址计算方法三顺序存储结构的插入和删除 3 1 获得元素操作 3 2 插入操作 3 3 删除操作四分析插入和删除操作的时间复杂度五线性表顺序存储结构的优缺点前言在介绍线性表的顺序
Windows安装程序遇到错误：0x80240037

在安装微软的程序时遇到此错误本例以安装PB的帮助文档为例解决办法是第一步更改安装文件后缀第二步 Win R执行第一步将msu后缀更改为cab 更改后变为然后将其解压到一个新文件夹比如cab 解压后的内容为第二步 WIN
Linux与Windows下CMake的安装与编译

一背景介绍 CMake 这个名字是 Cross platform Make 的缩写虽然名字中含有 make 但是CMake和Unix上常见的 make 系统是分开的而且更为高端它可与原生建置环境结合使用例如 make 苹果的Xco
GPS开发常用方法和用Criteria确定android location providerGPS开发常用方法

GPS常用方法总结取得LocationProvider Java代码 public void getLocationProvider try Criteria mCriteria01 new Criteria mCriteria01 se
利用Visual Studio程序写出循环结构求1+3+5+....+100的值

下面是在 Visual Studio 中使用 C 编写循环结构求 1 3 5 100 的值的示例代码 int sum 0 for int i 1 i lt 100 i 2 sum i Console WriteLine sum 上面的代码使
Excel里怎么冻结某一行某一列

企业内部日常运营中需要不断的处理数据来为决策做支撑但是如果数据大的话会发现看不到表头那边不知道这些数据属于哪个地方下面小编就告诉大家如何在Excel里来冻结窗口固定表头以下就是Excel里冻结首行首列已经冻结多个窗口的方法 Ex
《程序员的自我修养——链接、装载与库》

先不说别的就单看书名就知道是什么意思了作者的意思是想演员的自我修养的作者斯坦尼斯拉夫斯基致敬老斯的那本书我没看过但我看这本书的意思就是培养程序员的基本素质你说啥叫基本素质那就是你能够了解你编写的程序的任何一个运行的细节
c++可变参数完美转发

c 语法真的怪异看线程源码的时候看到一段 template
基于51单片机可控电压0-5V输出PWM方式PID稳压

视频地址链接 https www bilibili com video BV17V411n72P 本设计为AT89C51为主控芯片主要是实现了PWM方式输出可调电压0 5V输出使用PID方式稳压
c51单片机中断详解--适合初学者

代码文本在文末文中为代码截图工程图第一题每次亮一个灯的流水灯定义P1为led1 外部中断0允许中断 EX0 1 下降沿触发 IT0 1 总开关 EA 1 中断要执行的是P0引脚的4个二极管闪六次其实这里还有个想说的是 IE在中断
spring yml 配置事务_spring boot详解, 配置文件加载顺序, spring事务管理, spring定时任务...

spring boot 简介 spring boot是为了简化spring的开发不需要进行大量的配置是由pivotal公司提供的全新框架为什么使用spring boot 独立运行简化配置自动配置无需xml配置 spring bo
使用rand函数生成随机数来发红包

include
一张图告诉你如何提高 API 性能

API 性能是指一个 API 在执行其功能时的效率和性能表现通常用于衡量 API 的响应时间吞吐量可伸缩性和稳定性等方面的表现 API 性能的指标包括响应时间 API 的响应时间是指从发出请求到接收到响应所需的时间较低的响应时间通
input file获取文件路径

html代码段
SpringBoot2.* 配置拦截器(Interceptor) 并集成swagger2 3.0版本

1 Interceptor 简介拦截器在Web系统中非常常见对于某些全局统一的操作我们可以把它提取到拦截器中实现在 Spring MVC 中使用接口 HandlerInterceptor 表示包含三个方法 preHandle 在请
python3.8 安装robotframework启动报错以及HttpLibrary导入报错

1 问题现象 python3 8环境安装rf工具套件启动rf后报错如下
Ubuntu 周立功CAN分析仪 USBCAN-II 驱动

首先从官网https www zlg cn Index Search search key linux的下载资料界面下载 Linux驱动 USBCAN I I II II 2A I MINI安装驱动 USBCAN II新版驱动基于libus
Graph Wavenet：入门图神经网络训练的demo

1 数据的准备 DCRNN的github项目有完整的数据 Graph Wavenet 提供的数据缺少 data sensor graph adj mx pkl 2 engine train 与engine eval 的区别区别仅在于mod

Graph Wavenet：入门图神经网络训练的demo

1. 数据的准备

2. engine.train 与engine.eval 的区别

Graph Wavenet：入门图神经网络训练的demo 的相关文章

随机推荐

热门标签