10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程

2023-11-10

研究背景

科学和工程中的许多应用需要求解具有不同方程系数、不同边界条件甚至不同求解域形状的偏微分方程(Partial Differential Equation，PDE)，即需要求解一个方程族而不是单个方程。这类应用经常在反问题求解、控制和优化、风险评估和不确定性量化领域中出现。从数学上讲，这类应用需要求解以下参数化偏微分方程(Parametric PDE)：

第一类方法是用神经网络去近似单个PDE的解。这类方法主要依赖控制方程（或其变分形式）和边界条件来训练神经网络。例如，物理信息神经网络(Physics-Informed Neural Networks，PINNs)和DGM (Deep Galerkin Method)通过约束深度神经网络的输出来满足给定的控制方程和边界条件。DRM (Deep Ritz Method)利用偏微分方程的变分形式求解可以表示为等效能量最小化问题的偏微分方程。基于偏微分方程的弱形式，弱对抗网络(Weak Adversarial Network，WAN)将弱解和测试函数分别参数化为Primal神经网络和Adversarial神经网络。这些方法都可以在无监督的方式下工作，即不需要利用传统的数值方法来生成标签数据。然而，当采用这类的方法求解参数化偏微分方程时，我们需要针对每一个PDE参数去单独训练一个模型。当需要求解具有大量PDE参数的参数化偏微分方程时，这类方法的计算量大且不切实际。DRM提出采用迁移学习的方法降低从头训练模型的成本，即将某个任务下训练得到的神经网络权重作为另一个任务的初始化权重。然而当两个任务的相关性较小时，迁移学习的方法相较于从头训练神经网络并没有带来明显的好处。

第二类方法使用神经网络来学习两个无限维函数空间之间的解映射（即PDE参数到方程解的映射）。例如，PDE-Net 用受矩约束的卷积层来逼近空间微分算子（类似于传统的有限差分方法），它能够从观察到的动力学数据中发现支配该动力学系统的控制方程，同时进行快速而准确的预测。深度算子网络(Deep Operator Network，DeepONet)使用两个子网分别对PDE参数和坐标进行编码，并将两个子网的输出做内积以得到方程的解。傅立叶神经算子 (Fourior Neural Operator，FNO)直接在傅立叶空间参数化积分核，从而实现表征能力更强的网络架构。这类方法的显著优点是一旦训练好了神经网络，预测时间几乎可以忽略不计。尽管这类方法在很多应用中都展示出了很理想的效果，但依然存在如下几个问题：1)复杂的物理、生物或工程系统中，标签数据获取成本过高，然而当可用的标签数据很少时，这些模型的泛化能力会很差；2) 这类方法中的大多数都需要一个预定义的网格，并利用网格上的标签数据进行训练和推理；3) 泛化性能难以保证，特别是将模型用于外插时（即用于训练和推理的PDE参数来自于不同的概率分布）；4) 这些方法会直接将PDE参数作为神经网络的输入，如果是异构的，这将给网络架构的设计带来不便。虽然PI-DeepONet (Physics-Informed DeepONet)可以在无标签数据和无需重新训练的情况下学习PDE参数到方程解的映射并且不需要一个预定义的网格，但是它需要在参数空间中收集大量的训练样本才能获得一个相对可接受的精度，并且其不能灵活地处理异构PDE参数。

传统意义上的机器学习针对的是一个学习任务，而元学习(Meta Learning)基于一系列相关的学习任务来改进学习算法本身，以使得模型可以更快、更好地处理新的学习任务。经典的元学习算法：MAML和Reptile，已在很多领域被广泛使用。这些元学习算法试图找到一个泛化能力更强的初始模型，以使其能够在少量梯度更新下就能处理新的学习任务。借鉴元学习的思想可以求解参数化偏微分方程，即将不同的PDE参数对应的方程求解视作是不同的学习任务。Meta-MgNet是第一个将求解参数化偏微分方程视为元学习问题的工作，它基于超网和多重网格算法。Meta-MgNet利用任务之间的相似性自适应地生成良好的平滑算子，从而加快求解过程，但是其无法直接应用于不能使用多重网格算法的偏微分方程。最近有研究者将Reptile算法与PINNs相结合用于加速偏微分方程的求解。但是我们通过实验发现，对于一些训练难度较大的偏微分方程来说（例如参数化的带点源的麦克斯韦方程组），Reptile算法并没有明显的求解速度提升。

论文主要内容简介

通过将求解参数化的偏微分方程视为一个元学习问题，我们提出了元自动解码器 (Meta-Auto-Decoder , MAD)，这是一种无网格、无监督的深度学习方法，通过自动解码器(Auto-Decoder)架构将（异构）偏微分方程参数隐式编码为隐向量，使得预训练模型能够快速适配到新的方程实例。

论文的主要贡献如下：

提出了一种求解参数化偏微分方程的无网格、无监督的深度神经网络方法。基于元学习的概念，一旦预先训练好神经网络，求解一个新任务只需要进行少量迭代数目的微调。此外，MAD采用的自动解码器架构可以实现对不同PDE参数的自动编码。
从流形学习的角度分析了MAD方法的有效性。简而言之，神经网络通过预训练来逼近解流形，而微调对应着在解流形或解流形所在的邻域中搜索方程解。
通过大量的数值实验验证了MAD方法的有效性，结果表明MAD算法能够显著提高模型的收敛速度，并且具有良好的外插能力。

代码链接

论文: Meta-Auto-Decoder for Solving Parametric Partial Differential Equations

https://arxiv.org/abs/2111.08823

代码链接:

https://gitee.com/mindspore/mindscience/tree/master/MindElec/examples/physics_driven/incremental_learning

算法框架与技术要点

技术要点1：MAD的预训练和微调

图四：从流形学习角度解释MAD方法的有效性。

实验

总结

基于元学习思想，本文提出了一种求解参数化偏微分方程的无网格、无监督的深度学习方法MAD。MAD的预训练是从一组采样任务中学习有用的信息，模型通过加载预训练得到的网络权重可以加快其在微调时的收敛速度。不仅如此，MAD还可以将异构的PDE参数隐式编码为可训练的隐向量。我们还从流形学习的角度分析了MAD方法的有效性，并通过大量的数值实验验证了MAD方法的有效性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程的相关文章

让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

近日权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点报道指出波场TRON网络在2023年取得了一系列的发展和合作提升了其在Web3领域的地位其中波场TRON网络账户数量增加了 54
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
矩阵基本操作2

题目描述问题描述将方阵 n 行n列 n lt 100 置成下三角矩阵主对角线右上角数字全部清零输入格式第一行输入n 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式 n行n列下三角矩阵每个数字3个占位符左对齐输入样
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
「优选算法刷题」：快乐数

一题目编写一个算法来判断一个数 n 是不是快乐数快乐数定义为对于一个正整数每一次将该数替换为它每个位置上的数字的平方和然后重复这个过程直到这个数变为 1 也可能是无限循环但始终变不到 1 如果这个过程结果为 1 那么这个
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
CorelDRAW2024官方中文版重磅发布更新

35年专注于矢量设计始于1988年并不断推陈出新致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
高精度运算合集，加减乘除，快速幂，详细代码，OJ链接

文章目录零前言一加法高精度加法步骤 P1601 A B 二减法高精度减法步骤
最大流-Dinic算法，原理详解，四大优化，详细代码

文章目录零前言一概念回顾可略过 1 1流网络 1 2流 1 3最大流 1 4残留网络 1 5增广路
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建
【算法】使用BFS算法（队列、哈希等）解决最短路径问题（C++）

文章目录 1 前言 1 1 什么是最短路问题 1 1 1 什么是权值 1 2 如何解决此类最短路径 1 3 BFS解最短路径前提 FloodFill 洪流问题 2 算法题

随机推荐

【计算机网络】图解应用层协议

图解应用层协议 1 应用层 2 远程登录 2 1 Telnet 2 2 SSH 3 文件传输 3 1 FTP 3 2 TFTP 4 电子邮件 4 1 通信架构 4 2 邮件地址 4 3 SMTP 协议 4 4 POP3 协议 4 5 IMA
疯壳出品鸿蒙os-驱动程序接收应用程序的消息

当明确驱动已经加载完成时用户态应用可通过接口 struct HdfIoService HdfIoServiceBind const char serviceName mode t permission 获取驱动的服务获取到服务后通过服务
C#中List集合的常用方法

C 中List集合的常用方法常用方法和属性常用属性常用方法 List类是ArrayList类的泛型等效类该类使用大小可按需动态增加的数组实现IList泛型接口泛型的好处它为使用c 语言编写面向对象程序增加了极大的效力和灵活性不
事物属性表现形式之变量、常量

目录新生的疑惑变量的定义变量注意事项常量的定义常量表现形式命名规范新生的疑惑先给大家模仿一段java老师讲课的情形来大家能看到我的PPT吧今天我们重点讲讲变量常量及首先来看变量顾名思义变量变量就是可变的量为
1、算法导论---时间复杂度、确定性和非确定性图灵机、算法的确定性与非确定性、P问题、NP问题、规约/约化、NPC问题、NP-hard问题

算法导论 1 时间复杂度 2 图灵机 3 算法的确定性与非确定性 4 P问题 5 NP问题 6 规约约化 7 NPC问题 8 NP Hard问题 9 四大问题关系 1 时间复杂度要想了解算法的问题首先要知道问题的分类而要想知道问题的
【华为OD机试真题 Java】路灯照明问题

前言本专栏将持续更新华为OD机试题目并进行详细的分析与解答包含完整的代码实现希望可以帮助到正在努力的你关于OD机试流程面经面试指导等如有任何疑问欢迎联系我 wechat steven moda email nansun09
在线协作文档综合评测：金山文档、腾讯文档、石墨文档

在线协作文档综合评测 Notion FlowUs Wolai 飞书语雀微软 Office 谷歌文档金山文档腾讯文档石墨文档 Dropbox Paper 坚果云文档百度网盘在线文档如今在线协作文档已经成为效率办公的必备产品然
安装SQL2008 提示创建usersettings/microsoft.sqlserver.configuration.landingpage.properties.se

安装SQL2008 提示创建usersettings microsoft sqlserver configuration landingpage properties se 环境WIN7 64位安装SQL2008之前已安装好了 VS2
关于QT中tr()翻译的简单理解

当我们使用一下方式进行翻译时候需要了解tr是怎么运行的 tr qstring 1 tr 接口会去调用一个 QCoreApplication translate objectClassName this s c n 其中this形参就是翻译所
jedis 出现java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Long

问题使用jedis出现java lang ClassCastException java util ArrayList cannot be cast to java lang Long 解决办法参考文章 http hellojimmy
【设计模式】创建者模式_工厂、抽象工厂、建造者

设计模式六大原则开闭原则 Open Close Principle 开闭原则就是说对扩展开放对修改关闭在程序需要进行拓展的时候不能去修改原有的代码而是要扩展原有代码单一职责原则不要存在多于一个导致类变更的原因也就是说每个类应
若依框架_05：接口汇总

若依接口汇总一登录路由渲染 1 1 登录 1 1 1 登录 1 1 2 注册 1 1 3 获取验证码 1 1 4 获取用户详细信息 1 1 5 登出 1 2 路由渲染 1 2 1 获取路由二系统管理模块 2 1 用户管理 2 1
javascript中defer和async 区别

defer和async 区别 1 没有 defer 或 async 浏览器会立即加载并执行指定的脚本立即指的是在渲染该 script 标签之下的文档元素之前也就是说不等待后续载入的文档元素读到就加载并执行 2 有 async 加载和
递归函数的例子python卖鸭子_递归算法实现卖鸭子

问题重述 1 一个人赶着鸭子去每个村庄卖每经过一个村子卖去所赶鸭子的一半又一只这样他经过了七个村子后还剩两只鸭子问他出发时共赶多少只鸭子经过每个村子卖出多少只鸭子代码题目分析设在经过n 个村子时有xn 只鸭子根据题意可以得到
MATLAB算法实战应用案例精讲-【集成算法】集成学习模型Bagging（附Python和R语言代码）

目录前言几个相关概念几个高频面试题目
阿里云-MaxComputer学习+踩坑第001天

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言一 DataWorks是什么二 MaxComputer是什么 1 产品介绍 2 表分区规范 3 官方分区文档总结前言由于公司一家蒸蒸日上的小跨境电商
[搬运]台湾大学机器学习课程 by 李宏毅

最近看到一个比较好的机器学习课程大致听了一遍整体感觉机器学习领域还是比较难虽然李宏毅老师讲得还是挺好的没有足够基础吸收起来还是有一定困难即便是已经把过程讲了一遍也很难理解到那些理论是如何构建起来的这个课程一个好是讲到了当前最热
科目一考试系统服务器奔溃,科目一错误率最高的题学员都崩溃了

2017 02 28 09 07 59 做错这种基础题目的时候与其有时间责怪出题人套路太深不如反省一下自己为什么做题的时候没有多看选项一眼在学习科目一的时候很多学员都对科目一的题目感到头疼有的是因为交通法规太难背有的是对绕人的题
css video 样式,使用CSS修改 video 标签默认样式

使用CSS修改 video 标签默认样式时间 2019 11 08 17 42 14 来源作者效果展示 1 模拟直播去除进度条当前观看时间剩余时间效果 2 去除 video 标签全部控件效果 Tags CSS 点击评论声
10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程

研究背景科学和工程中的许多应用需要求解具有不同方程系数不同边界条件甚至不同求解域形状的偏微分方程 Partial Differential Equation PDE 即需要求解一个方程族而不是单个方程这类应用经常在反问题求解控制和优

10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程

10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程 的相关文章

随机推荐

热门标签

10x倍加速PDE的AI求解：元自动解码器求解参数化偏微分方程的相关文章