AMD yes!拿下Meta后发布新芯片,FP64性能是A100 4.9倍,面向高性能计算和机器学习...

2023-11-19

明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

AMD造势已久、面向高性能计算的MI200,终于来了!

在拿下元宇宙大客户Meta后,AMD乘势而上官宣一系列新芯片,其中就包括这张不断有消息曝出的计算加速卡。

29ad8f9eb5202823b6e8f07e24fdb305.png

它采用6nm工艺,拥有580亿个晶体管、超过14000个内核、128GB的HBM2e显存,FP32性能达到95 TFLOPs 。

官方表示,它可以加速机器学习等任务,对标英伟达A100。

没错,是要和老黄抢盘中餐的节奏。

并且该芯片之后还将被用于美国橡树岭国家实验室的超算系统中。

所以,MI200性能到底如何呢?

FP64性能是A100的4.9倍

本次发布的MI200系列中,包含Instinct MI250X和Instinct MI250两款芯片。

与120个计算单元(CU)、7689个内核的MI100相比,其性能有了大幅提升。

  • MI250X有220个计算单元 (CU) 和14080个内核。

  • MI250则有208个计算单元 (CU) 和13312个内核。

2d1eff5035445381bcab7de6557e1b31.png

它们采用了全新的CDNA™ 2 架构,可加速FP64和FP32矩阵运算,与上一代MI100相比,FP64理论峰值性能最多可高出4倍

2.5D Elevated Fanout Bridge(EFB)封装技术让MI200在内核数上较上一代增加了1.8倍,内存带宽增加了2.7倍,聚合理论峰值内存带宽也高达每秒3.2TB

与此同时,第三代AMD Infinity Fabric™ 技术可管理8条Infinity Fabric链路,让MI200计算节点可与第三代霄龙(EPYC)处理器或其他GPU相连,从而实现统一的CPU/GPU一致性、并最大限度地提升系统吞吐量。

bfd9924d40b2752ad5d171ac8695824c.png

既然说对标英伟达A100,那具体表现如何呢?

制作工艺上,A100采用7nm制程,集成超过540亿个晶体管,显存可达80GB

MI200系列则采用6nm工艺,拥有580亿个晶体管,显存达到了128GB

性能对比中,MI200的FP64性能是A100的4.9倍

4f2f1709ba827fd196addb9f6a285df6.png

在处理加速任务中,AMD也对MI200系列和A100进行了对比:

以处理分子动力任务为例,MI250的性能表现是A100的2.2倍

42fd2a93178b381aec75b2cd5e966028.png

在其他几项任务中,MI250的表现也都优于A100(具体数据可参看文末参考链接4)。

AMD愈加抢眼

此次除了发布MI200之外,AMD还发布了首款采用3D V-Cache 技术的服务器处理器产品——EPYC Milan-X

这款芯片之后将被用于微软的Azure云计算服务。

461ebb6acc7f2d31ca8a806ed253b2be.png

而在产品之外,AMD近期的财务表现也非常抢眼。

先与Meta达成合作,后又发布系列新芯片,让AMD的股价也在这周第一个交易日大涨10%以上。

上个月发布的Q3财报中显示,AMD营收同比增长54%,较老对手英特尔表现亮眼,也让不少人更加看好AMD。

这一次,AMD的这次动作更是瞄准英伟达的王炸A100发布对标产品。

而且网友表示,与Meta合作意味着AMD的卡将来可能可以移植Pytorch,英伟达在机器学习上的垄断地位或许会被撼动。

7041c7e3e02cca04e5f558c99e411cf9.png

参考链接:
[1]https://ir.amd.com/news-events/press-releases/detail/1032/new-amd-instinct-mi200-series-accelerators-bring
[2]https://www.reuters.com/technology/amd-lands-meta-customer-takes-aim-nvidia-with-new-supercomputing-chips-2021-11-08/
[3]https://www.tomshardware.com/news/amd-instinct-mi200-chiplet-datacenter-gpu
[4]https://www.amd.com/en/graphics/server-accelerators-benchmarks

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AMD yes!拿下Meta后发布新芯片,FP64性能是A100 4.9倍,面向高性能计算和机器学习... 的相关文章

  • 将 CSV 文件读入 Java 作为数据库表

    我发现了很多关于使用 Java 读取 CSV 的帖子 并且他们所指向的 API 在读取 CSV 文件时都采用了面向行的方法 就像 当你得到一行时 获取每一列的值 我希望有一个更高级别的 API 比如在 Perl 中 DBI 允许您在 CSV
  • 如何用Java创建图像

    比如说在我的程序中 我有这个paint 方法 我的愿望是创建所绘制的矩形的图像 使用 for 循环 我尝试了下面的方法 它确实给了我那些矩形 蓝色 但背景是全黑的 当我运行程序而不创建图像 仅在 JFrame 上绘制矩形时 背景为白色 我怎
  • java.lang.NoClassDefFoundError:HttpSessionListener

    我正在尝试部署一场我没有编写的战争 但我在日志中收到此错误 java lang NoClassDefFoundError HttpSessionListener 我知道 HttpSessionListener 位于servlet api j
  • 使用 Gson 序列化时如何公开类名

    我的场景非常复杂 但总结如下 我试图了解编译器的源代码 并了解每个 AST 节点代表什么 我正在生成不同程序的 AST 的 JSON 序列化 然后检查可视化的 JSON 输出 它工作得很好 除了一个问题是在 Gson 中生成的 JSON 数
  • 按对象值分组,统计后按最大对象属性设置组键

    我设法使用 Java 8 Streams API 编写了一个解决方案 该解决方案首先按对象 Route 的值对列表进行分组 然后计算每组中的对象数量 它返回一个映射 Route gt Long 这是代码 Map
  • PrintStream是有缓冲的,但是flush不会降低性能,而BufferedOutputStream会加速性能

    我预计由于 PrintStream 是缓冲的 通过在每次 print 之后添加刷新操作 速度性能应该会显着降低 但事实并非如此 如下面的代码片段所示 此外 将 PrintStream 包裹在 BufferedOutputStream 周围可
  • Java 中的本机方法

    我花了一些时间学习什么是 Java Native 方法以及它们是在平台相关代码 主要是 C 中实现的 但是我在哪里可以找到这些 Java 的本机实现呢 例如 Thread 类的 sleep long millis 方法是本机的 但它的实现代
  • (Java) 在 Mac OS X 上以编程方式访问“系统根目录”下的 SSL 证书

    我正在编写一个 Java 应用程序 它可以通过远程 Https 站点进行 REST Api 调用 远程站点由受信任的证书签名 它在 Windows 上运行良好 但由于 SSL 证书问题 在 OS X 上运行时遇到问题 我做了一些挖掘 发现原
  • 从 org.w3c.dom.Node 获取 Xpath

    我可以从 org w3c dom Node 获取完整的 xpath 吗 假设当前节点指向 xml 文档中间的某个位置 我想提取该元素的 xpath 我正在寻找的输出 xpath 是 parent child1 chiild2 child3
  • Java 泛型和数字类型

    我想创建一个通用方法来有效地执行此操作 class MyClass static
  • 在 JSON 对象中强制执行非空字段

    我们的 REST API 接收一些 JSON 对象输入 其中某些字段要求不为空 这些可以是字符串 整数 甚至可以是其他一些类实例作为参考 我们正在尝试找到一种方法来强制这些字段不为空 而不是在 API 中进行空检查的正确方法 当前的 if
  • kafka Avro 多个主题的消息反序列化器

    我正在尝试以 avro 格式反序列化 kafka 消息 我使用以下代码 https github com ivangfr springboot kafka debezium ksql blob master kafka research c
  • 如何在 Spring Boot 中创建 Apache POI Excel 视图配置

    当我想使用 Spring Boot Web 将数据导出到 Excel 时遇到问题 我使用 Thymeleaf 作为模板引擎 由 Spring Boot 自动配置 但是当我在附加配置中添加 XmlViewResolver 时 由 XmlVie
  • 日志记录在 Android 设备上实际上有什么作用?

    我一直在 Android 示例中看到这样的代码 try catch Exception e Log e Error e getMessage 什么是Log e实际上在物理设备上做什么 它进入系统日志 开发人员可以通过 SDK 工具访问该日志
  • 线程睡眠阻止我的 Swing 应用程序执行

    我的应用程序发生的事情是有道理的 但我不知道如何修复它 以下是我的应用程序功能的简要描述 计时器窗口应显示在屏幕右下角并显示实时时间 一小时后 它应该执行一些操作 我还没有决定该操作 我面临的问题是定时器 java当我刷新实时计时器的秒数时
  • 有时 Properties.load() 会跳过行

    在以下情况下 Properties load 会跳过 InputStream 的第二行 这是 Java 的错误还是正常行为 public class PropTest public static void main String args
  • Spring Boot如何加入自定义查询

    我需要创建一个端点 该端点按州返回人口普查数据以及城市列表 我目前使用两个端点来获取此数据 目前回应 自定义查询一 censusByState id 1 code 11 name Rond nia statePopulation 18152
  • 相当于 C# 中 Java 的“ByteBuffer.putType()”

    我正在尝试通过从 Java 移植代码来格式化 C 中的字节数组 在 Java 中 使用方法 buf putInt value buf putShort buf putDouble 等等 但我不知道如何将其移植到 C 我尝试过 MemoryS
  • RecyclerView 适配器的 Kotlin 泛型

    我正在尝试编写一个通用的 recyclerview 适配器 我找到了几个例子 然而 仍然无法弄清楚如何实现通用适配器 我写的代码是 open abstract class BaseAdapter
  • 如何正确使用Google Calendar API Events.Insert命令?

    所以我一直使用REST方法来调用Google的API 我需要将事件插入到我拥有 ID 的特定日历中 这是我发送的 POST 请求 地址 https www googleapis com calendar v3 calendars https

随机推荐

  • Sidetree - 去中心化身份管理协议

    身份 Identity 管理是区块链应用的核心元素 在一个不可信 匿名的分布计算生态中 要实现去中心化身份管理并不是一件容易的事情 Sidetree是一个基于现有区块链平台的第二层 L2s 协议 专门用于去中心化身份管理 微软最新开源的IO
  • 史上最全Android性能优化方案解析

    Android中的性能优分为以下几个方面 布局优化 网络优化 安装包优化 内存优化 卡顿优化 启动优化 一 布局优化 布局优化的本质就是减少View的层级 常见的布局优化方案如下 在LinearLayout和RelativeLayout都可
  • IP数据报的发送和转发过程

    IP数据报的发送和转发过程 源主机如何知道目的主机是否与自己在同一网络中 同一个网络中的主机可以直接通信 这属于直接交付 不同网络中的主机不能直接通信 需要路由器的中转 这属于间接交付 现假设主机C给主机F发送ip数据报 主机C将自己的IP
  • Spring Boot整合Spring Security并设置自定义登录页面

    准备工作 创建一个Spring Boot项目 注意选择Spring Boot的版本 选择3 0以下的版本 选择如下依赖 等待项目创建成功 项目创建成功之后 添加Mybatis plus的依赖
  • matlab中使用save保存文件, 文件名中有变量

    K 3 filenm K num2str K p num2str K mat save filenm
  • C#中 的泛型

    一 泛型类 1 定义一个泛型类 这个类中某些字段的类型是不确定的 这些类型可以在类构造的时候确定下来 类似于模板 class TestA
  • Ztree组件 支持全选 和反选不影响父级

    ztree ztree v3 3 5 46 main js import ztree ztree v3 js jquery ztree core js import ztree ztree v3 css zTreeStyle zTreeSt
  • Flutter开发之——动画-Lottie

    一 概述 Lottie是Aribnb开源的面向Android iOS等的高性能动画库 Flutter原生库不支持Lottie 但是可以通过第三方插件实现Lottie的动画效果 二 导入lottie flutter插件 2 1 插件地址 Lo
  • unity局域网开关机步骤二-c#-tcp

    using System using System Collections Generic using System Linq using System Text using System Net Sockets using System
  • Python基础知识(四):一文看懂列表、元组和字符串操作

    序列 序列是具有索引和切片能力的集合 列表 元组和字符串具有通过索引访问某个具体的值 或通过切片返回一段切片的能力 列表 元组 字符串都属于序列 1 列表 列表 List 是Python中非常重要的内置数据类型 列表由一系列元素组成 所有的
  • 设计模式——简单工厂模式

    简单工厂模式定义为 简单工厂模式又称为静态工厂方法模型 它属于类创建型模式 在简单工厂模式中 可以根据参数的不同返回不同类的实例 简单工厂专门定义一个类来负责创建其他类的实例 被创建的实例通常都具有共同的父类 简单工厂模式结构图 简单工厂模
  • Picture控件的加载图像的使用总结

    一 非动态显示图片 即图片先通过资源管理器载入 有一个固定ID 二 动态载入图片 即只需要在程序中指定图片的路径即可载入 为方便说明 我们已经建好一个基于对话框的工程 名为Ttest 对话框类为CTestDlg 一 vc picture控件
  • kettle抽取数据判断是否有数据

    kettle分为两种对象 一种是作业 另一种是转换 判断是否有数据 在作业中实现即可 第一步 文件 gt 新建 gt 作业 第二步 右边有主对象树和核心对象 选择核心对象 第三步 选择条件 gt 计算表中的记录数 第四步 双击此对象 计算表
  • 前端摸鱼日记(一)

    一会又要开周五的工作总结会 一天天真闲的 此处省略一万个草 上个月招来一个技术经理 文文雅雅的 是什么也不干 看起来什么都不会 每周五就假装来开个会 真他妈无语了 实在无聊 写个日志 自从创立武当山教学院 目前只有四个人 刘大目前在武当山自
  • 详解Arduino Uno开发板的引脚分配图及定义(重要且基础)

    详解Arduino Uno开发板的引脚分配图及定义 重要且基础 https www cnblogs com Bruce H21 p 11555605 html 首先开发板实物图如下 在本篇文章中 我们将详细介绍Arduino开发板的硬件电路
  • 解决vue路由跳转到同一页面的刷新问题

    问题描述 当我使用路由跳转页面时 如果页面跳转是同一个路由 传递的参数不同时 页面不刷新 如下图 待收定金和待收首款其实跳转的是同一个组件 只是他们传递的参数不同而已 当我使用路由进行跳转时 我发现第一次是可以正确跳转的 比如我当前在其他页
  • qt中获取窗口位置和大小

    窗口左上角的位置 含边框 qDebug lt lt this gt frameGeometry x lt lt this gt frameGeometry y lt lt 1 qDebug lt lt this gt x lt lt thi
  • Ubuntu系统下常用的新建、删除、拷贝文件命令

    常用新建 删除 拷贝命令 mkdir 目录名 新建一个文件夹 文件夹在Linux系统中叫做 目录 touch 文件名 新建一个空文件 rmdir 目录名 删除一个空文件夹 文件夹里有内容则不可用 rm rf 非空目录名 删除一个包含文件的文
  • 【C语言】_4.数组

    目录 1 一维数组 2 二维数组 3 数组越界 4 数组作为函数参数 正文 1 一维数组 1 1 数组的创建 1 数组的概念 数组是一组相同类型元素的集合 2 数组的创建方式 type t arr name const n 即数组元素类型
  • AMD yes!拿下Meta后发布新芯片,FP64性能是A100 4.9倍,面向高性能计算和机器学习...

    明敏 发自 凹非寺量子位 报道 公众号 QbitAI AMD造势已久 面向高性能计算的MI200 终于来了 在拿下元宇宙大客户Meta后 AMD乘势而上官宣一系列新芯片 其中就包括这张不断有消息曝出的计算加速卡 它采用6nm工艺 拥有580