TVM优化原理学习

2023-05-16

没有看论文，看了b站陈天奇的视频，还有一些博客的分析，学习了优化原理。后续需要深入理解再看论文。

TVM对于神经网络的优化主要有两部分，计算图优化和算子优化，下面分开说明。

计算图优化

例如算子融合，常量传播等。这一步是在IR层面完成，现在TVM是使用relay IR来描述计算图。优化的过程蕴含在relay.build中，参考https://zhuanlan.zhihu.com/p/113962405
op算子优化

对于一个给定的计算问题，该如何映射到后端硬件上呢？tvm的方案是张量表达式，schedule + auto-tuning。对于一个给定的计算，会有很多种实现方式，每一种实现方式称为一个schedule。例如GEMM计算中，矩阵的分块大小，数据预取步长等等。我们要做的就是在所有schedule中，找到性能表现最好的schedule。

这里就有很多问题，比如给定的计算问题该怎么描述呢？对应的解决是TVM的张量表达式，可以更好的体现计算的数据特性。

再比如该如何确定出不同的schedule呢？

再比如，一个很重要的问题是，可能有billion量级的schedule，每个schedule都尝试的话，用时肯定是不可接受的。所以就有了autoTVM这样基于machine learning的搜索方式，可能使用GBDT来进行决策，减小搜索空间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TVM

优化原理学习

TVM优化原理学习的相关文章

ubuntu20.04配置TVM环境

官方安装教程 xff1a https tvm hyper ai docs install from source 安装环境配置信息 xff1a system xff1a ubuntu20 span class token punctuati
Windows安装TVM详细教程及报错提示

Windows中安装TVM xff0c 网上有各种教程 xff0c 但是由于某些原因 xff0c 总是无法安装成功 xff0c 这大概率是各种工具之间的版本不兼容原因注 xff1a 虽然本博客是为了教大家在windows中安装tvm xf
TVM在Windows10下编译安装

本教程记录了Windows端安装tvm的过程 xff0c 欢迎交流教程参考 TVM Windows下全功能编译方法 xff1a 从入门到劝退 https blog csdn net znsoft article details 11503
深度学习编译器系列视频摘要

文章目录 0 前言深度学习编译器一综述深度学习编译器二 Auto TVM 深度学习编译器三 Auto Schedule 0 前言在B站黄雍涛博士发了几个深度学习编译器的视频感觉说得挺好所以记录一下深度学习编译器一综述
冯思远：Apache TVM 与机器学习编译发展

下午好欢迎大家今天来参加 2023 Meet TVM 作为 Apache TVM PMC 由我来给大家做关于 TVM 的发展以及 TVM 未来 Unity 框架的分享 Apache TVM Evolution 首先为什么会有 MLC Ma
TVM张量表达式

Get Started with Tensor Expression TVM使用一个定义域特定张量表达式来高效地构造核 In 1 import tvm import tvm testing from tvm import te import
TVM 0.9 在 ubuntu（任意版本）上的安装（简单且保姆级！）

近一年来尝试过TVM在ubuntu16 04 ubuntu18 04 ubuntu20 04 以及windows上的安装也看了官方教程和网上各种博客踩坑无数现在总结在Ubuntu上踩坑几率最小的安装流程如下建议学习TVM一开始就在u
编译 OneFlow 模型

本篇文章译自英文文档 Compile OneFlow Models tvm 0 14 dev0 documentation 作者是 BBuf Xiaoyu Zhang GitHub 更多 TVM 中文文档可访问 Apache TVM 是一个
编译 Keras 模型

本篇文章译自英文文档 Compile Keras Models 作者是 Yuwei Hu 更多 TVM 中文文档可访问 TVM 中文站本文介绍如何用 Relay 部署 Keras 模型首先安装 Keras 和 TensorFlow 可通
TVM中python访问c++函数机制

data TVM tvm python tvm ffi registry py data TVM tvm python tvm ffi registry py data TVM tvm python tvm ffi ctypes packe
AutoSchedule和AutoTVM

简介 AutoTVM 用户自己手写一个模版在模版里面自己定义一下tune的参数例如tile size等给定一个模版在这个模版里面去搜索参数使得可以达到一组最好的参数使得张量计算的结果最好但是它是一种基于模板的方法因此仍然需要
【TVM 学习资料】使用 Python 接口（AutoTVM）编译和优化模型

本篇文章译自英文文档 Compiling and Optimizing a Model with the Python Interface AutoTVM 作者是 Chris Hoge 更多 TVM 中文文档可访问 TVM 中文站 TVMC
TVM 结构学习总结

最近对深度学习编译器TVM学习了一下了解各部分的功能根据自己的理解进行总结如有不正确请指正话不多说上脑图 TVM为解决各种深度学习训练框架的模型部署到各种硬件而诞生下图是TVM经典技术栈图编译器层次抽象编译器前端接收C C
陈天奇等人提出TVM：深度学习自动优化代码生成器

TVM 是由华盛顿大学在读博士陈天奇等人提出的深度学习自动代码生成方法去年 8 月机器之心曾对其进行过简要介绍该技术能自动为大多数计算硬件生成可部署优化代码其性能可与当前最优的供应商提供的优化计算库相比且可以适应新型专用加速器后端
TVM（一）：简介与安装

简介 TVM是一个用于深度学习系统的编译器堆栈它旨在缩小以生产力为中心的深度学习框架与以性能和效率为中心的硬件后端之间的差距 TVM与深度学习框架合作为不同的后端提供端到端编译换句话说 TVM就是一种将深度学习工作负载部署到硬件的端到
【TVM 学习资料】用 Schedule 模板和 AutoTVM 优化算子

本篇文章译自英文文档 Optimizing Operators with Schedule Templates and AutoTVM 作者是 Lianmin Zheng Chris Hoge 更多 TVM 中文文档访问 TVM 中文站
TVM编译安装

本文是在已大致了解tvm功能和架构的基础上根据官方文档在x86 64 Ubuntu 18 04 GPU Pytorch1 8 0上安装TVM的流程参考文档 TVM安装官方文档 llvm下载链接 1 下载源代码从tvm官网下载源代码
TVM编译pytorch模型

编译PyTorch模型加载预训练的PyTorch模型加载测试图像将图形导入到Relay 构建Relay 在TVM上执行可移植图形查找同义词集名称本文是介绍如何使用Relay部署PyTorch模型的入门教程首先应该安装PyTor
windows11安装wsl2（linux）+VScode+ miniconda+TVM+python环境部署

在wsl上运行 TVM demo 环境配置预备加速工具 vpn 清华镜像第一次安装失败 1 Windows11 D盘安装wls linux 2 安装vscode并连接到WSL2 3 wsl 安装miniconda 4 wls安装TVM
深度学习编译中间件TVM之编译&安装

参考文档 mxnet官方install手册 TVM 0 4 0官方安装指导手册 LLVM下载地址 Debian Ubuntu Linux下安装LLVM Clang编译器开发环境介绍操作系统版本 Ubuntu16 04 LTS 64 bi

随机推荐

ovn metadata (by quqi99)

作者 xff1a 张华发表于 xff1a 2022 08 25 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明问题客户描述虚机的metadata功能偶尔有问题 xff0c
网络攻防实验 (by quqi99)

作者 xff1a 张华发表于 xff1a 2022 08 29 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明测试环境 lxd容器 xff0c i3为中间攻击者所以在i3上
nova VirtualInterfaceCreateException (by quqi99)

作者 xff1a 张华发表于 xff1a 2022 09 01 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明问题虚机有时候会报下列错误 xff1a nova excep
ovn-central raft HA (by quqi99)

作者 xff1a 张华发表于 xff1a 2022 10 12 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明 What s raft RAFT https raft git
Linux（五）：Ubuntu 16.04 更改系统语言为简体中文（Chinese simplified）

Linux xff08 五 xff09 xff1a Ubuntu 16 04 更改系统语言为简体中文 xff08 Chinese simplified xff09 文章目录 1 问题2 设置中文2 1 设置 xff1b 2 2 点击 Ins
juju创建lxd容器时如何使用本地镜像(by quqi99)

作者 xff1a 张华发表于 xff1a 2023 03 01 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明问题没有外网 xff0c 所以配置了一个local cust
my cloud test bed (by quqi99)

作者张华发表于 2023 03 10 版权声明可以任意转载转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明问题有一台NUC minipc 配置是 CPU i7 13700H 16核20线程内存 16G 32G 4
try chatgpt api (by quqi99)

作者 xff1a 张华发表于 xff1a 2023 03 23 版权声明 xff1a 可以任意转载 xff0c 转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明 chatgpt web 试了网上的一个chatgpt web
ubuntu操音量调整命令amixer

1 解除静音 sudo amixer set 39 Master 39 unmute sudo amixer set 39 Headphone 39 unmute sudo amixer set 39 Front 39 unmute 实际为
IAR软件应用中的错误提示

1 Q xff1a Error e16 Segment XDATA Z size 0x19a1 align 0 is too long for segment definition At least 0xe4c more bytes nee
软件工程—结构化分析设计

进行完需求分析 xff0c 下一步该进行系统结构分析和设计了现在主流的设计理念为结构化开发和面向对象开发 xff0c 本次主要讲解结构化开发结构化开发分为结构化分析和设计两个阶段结构化分析是面向数据流的分析方法 xff0c 基本思想是
项目流标了怎么办？

公开招标的项目如果出现流标现象 xff0c 是不能直接采取议标的方式 xff0c 或者直接采取竞争性谈判单一来源采购询价等非招标方式 xff0c 而应当组织二次招投标 xff0c 如果二次招标后仍然流标的 xff0c 可以核准后不再招标
xubuntu 14.04 LTS安装拼音输入法

一 xff0c 安装fcitx sudo apt get install fcitx table wbpy 是不是很好记的样子 xff0c wb五笔py拼音二 xff0c 配置fcitx desktop gnome language se
整理库函数依赖关系

问题 xff1a 现有一函数库 xff0c 这里是lapack3 5 lapack提供的每一个函数API都单独是一个 c 请给出这些API的相互调用关系间接调用也要统计 xff0c 循环调用 xff08 如果可能的话 xff09 不计进
手把手教你写出正确的二分搜索！

写出正确的二分搜索知易行难 xff0c 原理好像都懂 xff0c 但是实际上手就出各种错误 xff0c 例如如何确定循环终止条件区间搜小判断条件等这里就手把手教你写出正确的二分检索 xff01 二分法共有下面7种变式是否存在数字t 返
SphereFace: Deep Hypersphere Embedding for Face Recognition

Weiyang Liu 1 Yandong Wen 2 Zhiding Yu 2 Ming Li 3 Bhiksha Raj 2 Le Song 1 1 Georgia Institute of Technology 2 Carnegie
一文解答你关于“轨道问题”的所有疑问！（有环链表问题）

问题描述 xff1a 给定一个链表 xff0c 返回链表开始入环的第一个节点如果链表无环 xff0c 则返回 NULL 我看过很多博客 xff0c 对于最优解法的解释无非两个字 xff0c 神奇 xff0c 并没有说明如何构思出这样的思路
从bt到dp的困惑

每一个dp的背后都必然有一个bt bt的基础上加上记忆化搜索 xff0c 然后对问题的拆分由从上到下变成从下到上 xff0c 即可转化为dp 但绝不是所有的bt就天然的可以转化为dp 例如下面这个例子 leetCode 115题 xff0c
教练，我想学二叉树遍历！

二叉树具有前序中序后序三种遍历方式递归的相信大家都会写 xff0c 但是迭代的该怎么写呢 xff1f 怎样的迭代写法才能具有统一性便于理解呢 xff1f 请看下面具体的做法 xff0c 每种遍历方式各有2种策略 xff0c 基于栈的和
TVM优化原理学习

没有看论文 xff0c 看了b站陈天奇的视频 xff0c 还有一些博客的分析 xff0c 学习了优化原理后续需要深入理解再看论文 TVM对于神经网络的优化主要有两部分 xff0c 计算图优化和算子优化 xff0c 下面分开说明计算图优化

TVM优化原理学习

TVM优化原理学习 的相关文章

随机推荐

热门标签

TVM优化原理学习的相关文章