torch.fx介绍

2023-10-27

Node

Node类构造函数的各项参数如下（参考torch.fx下的node.py）：

graph：指明实例化的Node属于哪个Graph
op：节点的类型。一共有如下的几种类型：
- placeholder：占位符，一般代表输入。
- call_method：表示一种操作，该操作表示让前驱节点的输出对象调用自己的方法。
- call_module：表示一种操作，该操作表示将前驱节点的输出输入到nn.Module中。
- call_function：表示一种操作，该操作表示将前驱节点的输出输入到一个函数中。
- get_attr：表示一个操作，该操作获取Module自己的一个属性，并保存到输出中。
- output：输出节点，表示该节点是所属Graph的输出节点，即在所属Graph中无后继节点。
- root：整个Node在底层的数据结构是一个循环双向链表，root代表这个双向链表的头，是一个空的链表节点，用于维护双向链表。
name：节点的名字。
target：该节点需要调用的对象。如果op是call_function，那么target必须是一个Callable，否则必须是str。
args：需要传递给target的变长参数。
kwargs：需要传递给target的位置参数。
return_type：代表该节点的输出数据的数据类型。

除此之外，Node在初始化时会创建几个属性，其中有几个比较重要：

_input_nodes：一个哈希表，key是Node，value是None：代表self在Graph模式下的所有前驱节点。
users：一个哈希表，数据类型同_input_nodes，代表self在Graph模式下的所有后继节点。
_prev：self底层存储逻辑的前驱节点。
_next：self底层存储逻辑的后继节点。

剩下来对于双向循环链表的插入（往前还是往后）和删除在Node中都实现了。

总结一下，Node通过_input_nodes和users来表示原本计算图的拓扑结构。其管理和存储是通过双向循环链表来的（和CPython的堆变量管理类似）

#查找conv节点
model = models.resnet18()
fx_model = fx.symbolic_trace(model)
modules = dict(fx_model.named_modules())

for node in fx_model.graph.nodes:
    if node.target in modules:
        print(node.target)
        if type(modules[node.target]) == nn.Conv2d:
            print('conv node')

Graph

由于Node中已经定义了完整管理计算图的属性和方法，因此Graph更多是对Node的管理和封装。

首先Graph在初始化时会创建一个root节点（在一张图中，有且仅有一个root）：

 self._root : Node = Node(self, '', 'root', '', (), {})

这个root就是底层用于存储和管理Node的双向循环链表。并且指定了插入节点的方法为向前插入。

在Graph的create_node方法中。就是创建一个node，然后再插入到链表中。

除此之外，Graph还指定了一些用于描述上下文、所属模块的信息，这些和后续的原理关系不大，就不赘述了。

GraphModule

GraphModule是对Graph的封装，为啥还要封装呢？因为Graph的mro中没有nn.Module，为了工程规范，GraphModule继承了nn.Module并对Graph做了一个简单的封装。

Proxy

正如其名，Proxy类是对Node类的一层包裹，它允许用户在不修改原图的情况下，用自定义的函数代理其中的节点，从而完成重载。

Tracer

Tracer类是对符号跟踪的一层抽象，它的symbolic_trace(m)等价于Tracer().trace(m)。Tracer继承自TracerBase。

而symbolic_trace也只是对Tracer().trace的输出结果使用GraphModule进行了一次包装。因此，只需要看懂Tracer().trace的实现逻辑即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

算法部署

人工智能

torch.fx介绍的相关文章

【连续和自适应资源需求估计】通过不断应用在线优化、选择和估计，SARDE能够有效地适应在线跟踪，并使用得到的集成技术减少模型误差（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码数据文章
扬帆证券：产业化破题在即人形机器人超预期演进

大模型助力下的拐点特斯拉A股产业链上两笔重磅出资几乎一起现身总规划超百亿元 1月4日拓普集团公告与宁波经济技能开发区办理委员会签署了机器人电驱系统研发生产基地项目出资协议书公司拟出资50亿元建设机器人核心部件生产基地此次出
毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
喜报|华测导航荣获“张江之星”领军型企业称号

近日 2023年度张江之星企业培育名单发布上海华测导航荣获2023年度张江之星领军型企业称号据悉张江之星企业培育是上海科创办为落实关于推进张江高新区改革创新发展建设世界领先科技园区的若干意见张江高新区加快世界领先科技园区
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
明日 15:00 | NeurIPS 2023 Spotlight 论文

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入哔哩哔哩直播通道扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍黄若孜腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
国产化率100%，北斗导航单日定位4500亿次，外媒：GPS将被淘汰

追赶30年的技术差距国产卫星导航系统北斗开始扬眉吐气数据显示北斗导航目前单日定位量达4500亿次已经获得100多个国家的合作意向甚至国际民航也摒弃以往独宠 GPS的惯例将北斗纳入参考标准对此有媒体直言 GPS多年来的技
对中国手机作恶的谷歌，印度CEO先后向三星和苹果低头求饶

日前苹果与谷歌宣布合作发布了 Find My Device Network 的草案旨在规范蓝牙追踪器的使用在以往苹果和谷歌的生态形成鲜明的壁垒各走各路如今双方竟然达成合作发生了什么事首先是谷歌安卓系统的市场份额显著下滑数年来

随机推荐

csu 1809 Parenthesis 2016湖南省赛 G

Problem acm csu edu cn csuoj problemset problem pid 1809 vjudge net contest 161962 problem G Reference blog csdn net l95
spring之bean注入的意义

简而言之就是首先 service注解在当前类的上边表示在当前类是spring管理的一个bean 使用 autowired 将另外一个A类的实体bean注入到当前类中让当前类具备那个A类的功能
Android SDK & AVD Manager

0 前言 Android源码中的prebuilts devtools tools android程序可根据不同的参数来启动SDK Manager或AVD Manager 1 SDK Manager 1 启动 android or andro
Chrome 基于 Wappalyzer 查看网站所用的前端技术栈

1 找到谷歌商店 https chrome google com webstore search wappalyzer utm source ext app menu 2 搜索 Wappalyzer 3 添加至Chrome 4 使用插件
MySQL的脏读、幻读、不可重复读

首先我们要知道我们的脏读幻读不可重复读这些概念是在事务中的概念脏读也就是读取了未提交的数据比如我开启了一个事务A 在里面操作一个用户表获取里面一个用户的积分比如此时这个用户的积分是100 此时有另外一个事务B也操作了这个用户
LD3320语音识别

芯片介绍 LD3320 不需要外接任何辅助的Flash芯片 RAM芯片和AD芯片就可以完成语音识别功能每次识别最多可以设置50项候选识别句每个识别句可以是单字词组或短句另一方面识别句内容可以动态编辑修改只需要主控MCU把识别关
碎碎念，浅浅饮-------Day30

这不是一篇关乎技术的文章它偏离了我原本的计划轨迹但是相信它的意义会远超出任何一项技术带给我的价值高考已经开始了不知道在这片宁静的夜空下有多少人已经美美的睡了香甜憨然又有多少人这睡着的眼角还挂着泪滴偶尔蹙起眉头却也记载不下那
固态硬盘接口类型介绍

固态硬盘接口类型介绍现在装机硬盘肯定会首选SSD 容量小一点不怕后面再补一个机械硬盘不迟 SSD有着稳固和高速的优势深受用户喜爱然而SSD有着各种各样的尺寸和接口并不是每一个用户的电脑都能通用所以选购SSD硬盘前必须先了解SSD
ajax请求出现闪屏,jquery $.Ajax 火狐浏览器闪屏解决办法

本文章介绍了关于jquery的async false Ajax 火狐浏览器闪屏解决办法 jquery的async false 这个属性默认是true 异步 false 同步代码如下复制代码 ajax type post url pat
vue2知识点梳理

Vue梳理对于Vue 我们并不陌生现在我们来梳理一下关于它的东西吧知识点 1 生命周期最基本的就是它的生命周期 beforeCreate 在 beforeCreate 生命周期函数执行时 data 和 methods 中的数据都还没
Open3D (C++) 点云按坐标值大小进行排序

目录一概述二点云排序三结果展示一概述如题点云按坐标大小进行排序二点云排序代码以按照Z坐标的大小按照从小到大进行排序为例 include
java输出1~100之间的全部素数的5种方法

文章目录一前言二需求分析 2 1 什么是素数 2 2 分析三代码实现 3 1 方法一根据素数的定义来遍历检查 3 2 方法二根据判断条件2进行遍历检查减少遍历次数 3 3 方法三根据判断条件3进行遍历检查减少遍历次数
达梦数据库调优组合索引的使用

调优工程中对组合索引的使用的一个小总结一组合索引的执行计划首先关于几个概念等值条件和范围条件 1 等值条件 C1 X C1 X OR C1 Y 会被优化成C1 IN X Y C1 IN X Y 这种形式的我们都叫做等值条件 2 范围
Linux 安装Xrdp，实现RDP连接

linux 安装xrdp RDP 连接安装前提 root 权限 root server 76 conf yum install xrdp root 权限安装 yum install xrdp Loaded plugins fastest
Eigen不同的方法来求矩阵的逆的效率

背景不同尺寸的矩阵求逆使用不同的方法会有不同的效率的 16x16矩阵的直接求逆与PartialPivLU的效率对比本人亲测 1 实现代码 GetSystemTimeInMacroSecond的实现 boost posix time
自适应卡尔曼滤波_【导师论坛】

复杂噪声情况下的新型卡尔曼滤波器研究主讲黄玉龙副教授哈尔滨工程大学时间 2019年1月17日周四 14 30 16 30 地点智能科学学院主楼401会议室主讲人介绍黄玉龙博士哈尔滨工程大学自动化学院副教授 2018年1
远程代码执行漏洞的利用与防御

什么是RCE漏洞全称 remote command code execute 分为远程命令执行和远程代码执行 1 命令执行漏洞直接调用操作系统命令 2 代码执行漏洞靠执行脚本代码调用操作系统命令一般出现这种漏洞是因为应用系统从设计
第十届蓝桥杯省赛Java B组数的分解

试题 D 数的分解本题总分 10 分问题描述把 2019 分解成 3 个各不相同的正整数之和并且要求每个正整数都不包含数字 2 和 4 一共有多少种不同的分解方法注意交换 3 个整数的顺序被视为同一种方法例如 1000 100
mysql 数据恢复 binlog

被删库勒索的一次记录项目在云服务器运行了一年多了中间迁移过一次从阿里迁到华为了迁移的时候把数据库文件 test sql 用完了之后就扔在了服务器上最近访问系统的时候忽然系统崩溃表不存在了数据库连接工具也连不上了到服务器上的
torch.fx介绍

Node Node类构造函数的各项参数如下参考torch fx下的node py graph 指明实例化的Node属于哪个Graph op 节点的类型一共有如下的几种类型 placeholder 占位符一般代表输入 call meth