飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新

2023-10-30

在人工智能时代,深度学习框架下接芯片,上承各种应用,是“智能时代的操作系统”。近期,我国首个自主研发、功能完备、开源开放的产业级深度学习框架飞桨发布了2.0正式版,实现了一次跨时代的升级。

**这次2.0版本的发布对于飞桨来说,可以说是一次“基础设施”的全面更新换代!**生活中,我们看到过很多基础设施建设工程,例如西电东送、南水北调、高铁建设等等,这些在保证生产生活设施正常运行、推动整个社会的经济发展和人们生活水平改善的过程中,以一种 “润物细无声”的形式扮演着关键基础性角色!此次飞桨升级就是以这样方式悄然为整个产业及生态的发展繁荣奠定基础、积蓄能量、增添后劲!下面将为广大开发者详细介绍飞桨都做了哪些“基础设施”级别的关键工程。

使用飞桨框架2.0 更高效地开发AI模型

成熟完备的动态图模式

此次升级,飞桨将默认的开发模式升级为命令式编程模式,即大家常说的动态图。飞桨框架2.0支持用户使用动态图完成深度学习相关领域全类别的模型算法开发。动态图模式下可以让开发者随时查看变量的输入、输出,方便快捷的调试程序, 带来最佳的开发体验。为了解决动态图的部署问题,飞桨提供了全面完备的动转静支持,在Python语法支持覆盖度上达到领先水平。开发者在动态图编程调试的过程中,仅需添加一个装饰器,即可无缝平滑地自动实现静态图训练或模型保存。同时飞桨框架2.0还做到了模型存储和加载的接口统一,保证动转静之后保存的模型文件能够被纯动态图加载和使用。

在飞桨框架2.0版本上,官方支持的动态图算法数量达到了200+,涵盖计算机视觉、自然语言处理、语音、推荐等多个领域,并且在动态图的训练效率和部署效率方面都有所提升。2.0版本的动态图支持了自动混合精度和量化训练功能,实现了比静态图更简洁灵活的混合精度训练接口,达到媲美静态图的混合精度和量化训练效果。无论从功能还是性能角度,飞桨的动态图在国产深度学习框架中都处于领先地位!

同时,为了推进各个主流场景的产业级应用,飞桨的系列开发套件也随飞桨框架2.0完成了升级,全面支持动态图开发模式。从开发、训练到预测部署提供优质体验。如视觉领域的图像分割套件PaddleSeg,随飞桨框架2.0升级后,涵盖了高精度和轻量级等不同特点的大量高质量分割模型,采用模块化的设计,提供了配置驱动和API调用两种应用方式,帮助开发者更便捷地完成全流程图像分割应用;又如自然语言处理领域的PaddleNLP,与飞桨框架2.0深度适配,拥有覆盖多场景的网络模型、简洁易用的全流程API,以及动静统一的高性能分布式训练能力,非常便于二次开发,大大提升建模效率。具体可以参见下面链接中的项目示例。

飞桨框架2.0动态图模型:
https://github.com/PaddlePaddle/models/tree/develop/dygraph

全新PaddleSeg项目应用实例:
https://aistudio.baidu.com/aistudio/projectdetail/1339458

全新PaddleNLP项目应用示例:
https://aistudio.baidu.com/aistudio/projectdetail/1329361

API体系全新升级

API是用户使用深度学习框架的直接入口,对开发者使用体验起着至关重要的作用,飞桨一直以来对API设计以及整体API体系的完善给予高度重视。飞桨框架2.0对 API体系进行了全新升级,让开发者们在使用飞桨研发的过程中可以体验到随心所欲、畅通无阻的愉悦感觉。

体系化: 基于长期的产业实践积累与用户使用习惯的洞察,飞桨重新梳理和优化了API的体系结构,使其更加清晰、科学,让广大开发者可以更容易地根据开发使用场景找到想要的API。此外可以通过class和functional两种形式的API来模块化的组织代码和搭建网络,提高开发效率。同时,API的丰富度有了极大的提升,共计新增API 217个,优化修改API 195个。

**简洁化:**提供更适合低代码编程的高层API。像数据增强、建立数据流水线、循环批量训练等可以标准化的工作流程,以及一些经典的网络模型结构,在飞桨框架2.0中,都被封装成了高层API。基于飞桨高层API,开发者只需10行左右代码就可以编写完成训练部分的程序。最为重要的是,高层API与基础API采用一体化设计,即在编程过程中可以同时使用高层API与基础API,让用户在简捷开发与精细化调优之间自由定制。新API体系完全兼容历史版本,同时飞桨提供了升级工具,帮助开发者降低升级迁移成本。

飞桨开源框架2.0 API参考文档:
https://www.paddlepaddle.org.cn/documentation/docs/zh/api/index_cn.html

使用飞桨框架2.0 更高效地训练AI模型

训练更大规模的模型

众所周知,飞桨框架的英文名Paddle便是并行分布式训练学习的缩写,分布式可以说是飞桨与生俱来的特性。飞桨支持包括数据并行、模型并行、流水线并行在内的广泛并行模式和多种加速策略。在飞桨框架2.0版本中,新增支持了混合并行模式,即数据并行、模型并行、流水线并行这三种并行模式可以相互组合使用,更高效地将模型的各网络层甚至某一层的参数切分到多张GPU卡上进行训练,从而实现支持训练千亿参数规模的模型。

业内首个通用异构参数服务器架构

飞桨框架2.0推出了业内首个通用异构参数服务器技术,解除了传统参数服务器模式必须严格使用同一种硬件型号Trainer节点的枷锁,使训练任务对硬件型号不敏感,即可以同时使用不同的硬件进行混合异构训练,如CPU、GPU(也包括例如V100、P40、K40的混合)、AI专用加速硬件如昆仑芯片等,同时解决了搜索推荐领域大规模稀疏特征模型训练场景下,IO占比过高导致的计算资源利用率过低的问题。通过异构参数服务器架构,用户可以在硬件异构集群中部署分布式训练任务,实现对不同算力的芯片高效利用,为用户提供更高吞吐,更低资源消耗的训练能力。

图一: 异构参数服务器架构示意图

通用异构参数服务器架构之所以被称之为通用,主要在于其兼容支持三种训练模式:

  • 可兼容全部由CPU机器组成的传统参数服务器架构所支持的训练任务。
  • 可兼容全部由GPU或其他AI加速芯片对应机器组成的参数服务器,充分利用机器内部的异构设备。
  • 支持通过CPU机器和GPU或其他AI加速芯片对应机器的混布,组成机器间异构参数服务器架构。

异构参数服务器拥有非常高的性价比,如下图所示,仅用两个CPU机器加两个GPU机器就可以达到与4个GPU机器相仿的训练速度,而成本至少可以节约35%。

分布式训练教程:
https://fleet-x.readthedocs.io/en/latest/paddle_fleet_rst/distributed_introduction.html

使用飞桨框架2.0 更广泛地部署AI模型到各种硬件

全面深度适配各种人工智能硬件

AI产业的广泛应用离不开各种各样的人工智能硬件的繁荣,飞桨可以说深谙其道,持续努力打造繁荣的硬件生态。当前包括英特尔、英伟达、ARM等诸多芯片厂商纷纷开展对飞桨的支持。飞桨还跟飞腾、海光、鲲鹏、龙芯、申威等CPU进行深入适配,并结合麒麟、统信、普华操作系统,以及百度昆仑、海光DCU、寒武纪、比特大陆、瑞芯微、高通、英伟达等AI芯片深度融合,与浪潮、中科曙光等服务器厂商合作形成软硬一体的全栈AI基础设施。当前飞桨已经适配和正在适配的芯片或IP型号达到29种,处于业界领先地位。

图二:飞桨硬件生态路线图

立即体验飞桨开源框架2.0版本

飞桨框架2.0安装:
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/pip/linux-pip.html

10分钟快速上手飞桨框架2.0:
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/02_paddle2.0_develop/01_quick_start_cn.html

飞桨框架2.0使用教程:
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/index_cn.html

飞桨框架2.0应用实践:
https://www.paddlepaddle.org.cn/documentation/docs/zh/tutorial/index_cn.html

如在使用过程中有问题,可加入官方QQ群进行交流:778260830。

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

·飞桨官网地址·
https://www.paddlepaddle.org.cn/

·飞桨开源框架项目地址·
GitHub: https://github.com/PaddlePaddle/Paddle
Gitee: https://gitee.com/paddlepaddle/Paddle

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jwE9T9mb-1615880442442)(https://bce.bdstatic.com/bce-developer/uploads/developer_97553b1.webp)]

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新 的相关文章

  • 利用MATLAB做一维CNN分类 问题及解决方法

    利用MATLAB做一维数据的CNN分类 问题及解决方法 我在做一维CNN分类时参考了知乎凉拌西红柿答主的程序示例 根据其代码改编实现了CNN分类 其中遇到的问题与解决方法总结如下 1 数据维度转换问题 for i 1 1 3000 for
  • python字符识别_crnn(基于pytorch、python3) 实现不定长中文字符识别

    在六七月份参加了一个比赛 做的项目是提取图片中的文字信息 首先是接触了一些文本检测算法 如CTPN East 后研究了文本识别算法 我认为较好的是CRNN 代码实现是参考算法提出者的pytorch python3版本的crnn实现 因为py
  • Oracle 删除命令详解

    Oracle 删除表方式分为三种 第一种 drop 命令 drop table 表名 实战 drop table erms biz accep management drop table ERMS BIZ ARCH COMPANY SPEC
  • @WebServlet注解(Servlet注解)

    WebServlet注解 文章目录 WebServlet注解 前言 一 WebServlet 注解的属性 二 WebServlet 注解的使用 1 启用注解支持 2 使用 WebServlet 注解 WebServlet 注解 和 web

随机推荐

  • 香港政府活用无人机,正式应用到调研检测领域

    香港机电工程署正式用无人机来完成燃气管道的监测工作 完整的数据库将能帮助工程师识别高危煤气管道 近些年来 无人机的使用已经日趋广泛 逐步被应用到各个领域 近日 香港机电工程署目前正在利用无人机来检测燃气管道 香港电机工程署所采用的无人机有摄
  • python日志记录

    日志记录 日志 排错 程序调试 用户行为分析 python logging模块 日志等级 日志等级 数值表示 描述 DEBUG 10 最详细的日志 常用于调试 INFO 20 详细日志 记录关键节点 WARNING 30 当前有不期望的事情
  • 你真的了解宏 MIN(X,Y)吗?

    微信搜索 编程笔记本 微信搜索 编程笔记本 微信搜索 编程笔记本 点击上方蓝字关注我 我们一起学编程 欢迎小伙伴们分享 转载 私信 赞赏 今天来研究一个看似简单 实则不那么简单的问题 定义一个求两数较小值的宏 下面我将以百分制的方式为各种写
  • 是刁难?还是装B?字节面试每轮必问的算法题到底意义何在?

    最近在脉脉上看到有一个Android工程师吐槽 自己明明有着BAT的5年工作经验 却没想到在应聘Hulu时 败在了算法题上 明明有多年大厂工作经验 为什么还要在找工作跳槽时 面对算法的考题 这个话题 已经引发了不少人的关注 其中有人强烈支持
  • 软件测试基础

    什么是软件 程序 文档 服务 数据 什么是软件测试 尽快尽早的发现中软件存在错误 贯穿整个软件生命周期的确定和验证的过程 项目流程 需求分析 概要设计 详细设计 编码 测试 验收 项目的开发模型 瀑布模型 优点 规范了项目的流程 缺点 测试
  • springboot+bootstrap实现分页

    写在前面 你们好 我是小庄 很高兴能和你们一起学习SpringBoot和bootstrap 如果您对Java感兴趣的话可关注我的动态 写博文是一种习惯 在这过程中能够梳理和巩固知识 一 技术介绍 用到的技术 spring boot boot
  • 区间DP 1039. 多边形三角剖分的最低得分

    1039 多边形三角剖分的最低得分 你有一个凸的 n 边形 其每个顶点都有一个整数值 给定一个整数数组 values 其中 values i 是第 i 个顶点的值 即 顺时针顺序 假设将多边形 剖分 为 n 2 个三角形 对于每个三角形 该
  • WGS84转腾讯地理坐标系,并将经纬坐标转化为腾讯地图地址

    项目后台使用的坐标系是WGS1984 但是小程序使用的是腾讯地图 我想要将84坐标转化为具体的地址存储在数据库中 供小程序使用 就需要先将84 腾讯地图使用的坐标系 腾讯地图地址 note 在网上找了很多实现的方法 大部分都没有啥用 各种报
  • LINK : fatal error LNK1123: failure during conversion to COFF: file invalid or corrupt

    fatal error CVT1100 duplicate resource type manifest 今天初次使用VS2010版本 在coding完一个工程后 报错 LINK fatal error LNK1123 failure du
  • 《圣殿祭司的ASP.NET4.0专家技术手册》---- 1-13 ClientBuilderManager类别的编译功能...

    本节书摘来自异步社区 圣殿祭司的ASP NET4 0专家技术手册 一书中的第1章 第13节 作者 奚江华 译者 武海军 更多章节内容可以访问云栖社区 异步社区 公众号查看 1 13 ClientBuilderManager类别的编译功能 圣
  • 十岁不愁、二十不悔、三十而立、四十不惑、五十知天命、六十耳顺、七十古来稀...

    中国的先哲们喜欢用独到的视角审视人生百态 他们喜欢用概括性的表述和富有哲理性的语言指点江山 世态 比如对人从生到死的概括莫过于那句中国人都喜欢引用古训 十岁不愁 二十不悔 三十而立 四十不惑 五十知天命 六十耳顺 七十古稀 八十耄耋 九十是
  • Java 使用itextPdf7操作pdf,写入照片这一篇就够了

    Java 使用itextPdf7操作pdf 写入照片这一篇就够了 1 效果图 1 1 M N列图片 无边界 有边界 1 2 图片重叠 1 3 文字背景图片 1 4 图片与文字相邻 图片文字Rowspan样式 1 5 一个单元格多图片 多图片
  • 梦次元poi进不去了_free gv video GV

    简介 沈淇在和姐妹聚会中发现自己男友出轨后一蹶不振 姐妹们拉着沈淇去KTV唱歌 但阴差阳错间走错包厢 结识音乐才子汪柏凯 并被赏识音乐才可以 在出KTV时偶遇沈淇前男友郑勋 并引发了一场 暴打渣男大战 紧跟着出门的汪柏凯看见这场 大战 帮忙
  • Linux 系列之常用命令记录整理

    Linux一些命令可以在开发或调试过程中起到很好的帮助作用 有些可以帮助了解或优化我们的程序 有些可以帮我们定位疑难问题 本篇博客将介绍工作中常用的linux命令 记得收藏 博客不定时更新 命令 功能说明 线上查询及帮助命令 2 个 man
  • 在Ubuntu 16.04上为树莓派(RaspBerry Pi 3)编译Android 7(Nougat)

    1 环境准备和介绍 本文章的测试环境如下 软件环境 VMware Workstation Pro Ubuntu 16 04 64 bit 虚拟机的内存配置6GB 4个CPU 硬件环境 RaspBerry Pi3 16GB SD卡 测试And
  • 1a电流用多粗的线

    1 由于敷铜板铜箔厚度有限 在需要流过较大电流的条状铜箔中 应考虑铜箔的载流量问题 仍以典型的0 03mm 厚度的为例 如果将铜箔作为宽为W mm 长度为L mm 的条状导线 其电阻为0 0005 L W 欧姆 另外 铜箔的载流量还与印刷电
  • 【python学习】python import

    Python import 的搜索路径 在当前目录下搜索该模块 在环境变量 PYTHONPATH 中指定的路径列表中依次搜索 在 Python 安装路径的 lib 库中搜索 如果在编程中模块和自己写的python文件不在同一个目录下 在文件
  • ADB

    更多硬件与系统属性 设备的更多硬件与系统属性可以通过如下命令查看 adb shell cat system build prop 这会输出很多信息 包括前面几个小节提到的 型号 和 Android 系统版本 等 输出里还包括一些其它有用的信
  • Hbuilderx APP真机运行 vivo iqoo neo5 开启adb调试

    使用UNIAPP开发APP 连接安卓手机vivo iqoo neo5 已开启USB调试模式 运行到手机模拟器仍提示 未检测到手机或者模拟器 请重试 解决办法 1 进入hbuilderx安装目录下plugins launcher tools
  • 飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新

    在人工智能时代 深度学习框架下接芯片 上承各种应用 是 智能时代的操作系统 近期 我国首个自主研发 功能完备 开源开放的产业级深度学习框架飞桨发布了2 0正式版 实现了一次跨时代的升级 这次2 0版本的发布对于飞桨来说 可以说是一次 基础设