FLOPS 什么是真正的 FLOPS

2024-02-04

我来自这个线程：FLOPS Intel 核心并使用 C 语言对其进行测试（内积） https://stackoverflow.com/questions/1536867/flops-intel-core-and-testing-it-with-c-innerproduct

当我开始编写简单的测试脚本时，我想到了一些问题。

为什么要浮点数？浮点数有什么重要之处值得我们考虑？为什么不是一个简单的 int 呢？
如果我想测量 FLOPS，假设我正在计算两个向量的内积。两个向量必须是 float[] 吗？如果我使用 int[]，测量结果会有什么不同？
我对Intel架构不熟悉。假设我有以下操作：
```
float a = 3.14159; float b = 3.14158;
for(int i = 0; i < 100; ++i) {
    a + b;
}
```
这是多少个“浮点运算”？
我有点困惑，因为我研究了简化的 32 位 MIPS 架构。对于每条指令，都有 32 位，例如操作数 1 为 5 位，操作数 2 为 5 位等。因此，对于英特尔架构（特别是与上一个线程相同的架构），我被告知寄存器可以保存 128 位。对于单精度浮点数，每个浮点数 32 位，这是否意味着对于馈送到处理器的每条指令，它可能需要 4 浮点数字？我们是否还必须考虑操作数和指令其他部分中涉及的位？我们怎么能只向CPU提供4个浮点数而没有任何具体含义呢？

我不知道我这种零碎思考一切的方法是否有意义。如果不是，我应该看什么“高度”的视角？

1.) 浮点运算代表比固定宽度整数更广泛的数学范围。此外，大量数值或科学应用程序（通常是实际测试 CPU 纯计算能力的应用程序）可能比任何东西都更依赖浮点运算。

2.) 它们都必须是浮动的。 CPU不会将整数和浮点数相加，其中之一会被隐式转换（很可能整数会转换为浮点数），因此它仍然只是浮点运算。

3.) 这将是 100 个浮点运算，以及 100 个整数运算，以及一些（100？）控制流/分支/比较运算。通常还会有加载和存储，但您似乎没有存储该值:)

4.) 我不知道如何从这个开始，你似乎对材料有一个总体的看法，但你混淆了一些细节。是的，单个指令可以分为类似于以下的部分：

|OP CODE | Operand 1 | Operand 2 | (among many, many others)

但是，操作数 1 和操作数 2 不必包含要相加的实际值。它们可以只包含要添加的寄存器。例如，采用以下 SSE 指令：

mulps      %%xmm3, %%xmm1

它告诉执行单元将寄存器xmm3的内容与xmm1的内容相乘，并将结果存储在xmm3中。由于寄存器保存 128 位值，因此我对 128 位值进行操作，这与指令的大小无关。不幸的是，x86 由于是 CISC 架构，因此没有与 MIPS 类似的指令分解。 x86 指令可以具有 1 到 16(!) 字节之间的任何位置。

至于你的问题，我认为这些都是非常有趣的知识，它可以帮助你建立对数学密集型程序速度的直觉，并让你了解优化时要实现的上限。不过，我从来没有尝试将其与程序的实际运行时间直接关联起来，因为太多其他因素会影响实际的最终性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

FLOPs

FLOPS 什么是真正的 FLOPS 的相关文章

如何在 Caliburn.Micro 中使用 Conductor 的依赖注入

我有时用Caliburn Micro http caliburnmicro com创建应用程序使用最简单的 BootStrapper 我可以像这样使用 IoC 容器 SimpleContainer private SimpleContai
为什么我应该使用内联代码？ [复制]

这个问题在这里已经有答案了我是一名 C C 开发人员这里有几个始终困扰我的问题常规代码和内联代码之间有很大区别吗主要区别是什么内联代码只是宏的一种形式吗选择内联代码时必须进行什么样的权衡 Thanks 表现正如之前的答案
C - 计算文件中的单词、字符和行数。字符数

我必须用 C 编写一段代码输出给定文件中的字符数行数和单词数任务看起来很简单但我现在真的不确定出了什么问题所以这是代码 include
将 ARGB 拆分为字节值

我有一个 ARGB 值存储为 int 类型它是通过调用 ToArgb 来存储的我现在想要来自 int 值的各个颜色通道的字节值例如 int mycolor 16744448 byte r g b a GetBytesFromColor
如何创建语法突出显示文本框[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何使用 C Net 创建语法突出显示文本框 Take 闪烁网 http scintillanet codeplex com 并采取其
C++：字符串流有什么好处？

谁能告诉我一些在 C 中使用字符串流的实际例子即使用流插入和流提取运算符输入和输出到字符串流您可以使用字符串流来转换任何实现operator lt lt 到一个字符串 include
Monitor.Pulse & Wait - 意外行为

http www codeproject com Articles 28785 Thread synchronization Wait and Pulse demystified http www codeproject com Artic
UI 线程正在阻塞调用 COM 对象的后台线程

我正在开发一个通过第三方 COM 库与外部设备通信的应用程序我试图让与设备的所有通信都通过后台线程以防止通信问题搞砸我的应用程序并消除在 UI 线程中进行通信所引入的一些其他复杂性问题是每当发生导致主 UI 线程阻塞的情况即调用
有没有办法找到dll公开的所有函数

我一直在寻找一种方法来获取映射到 dll 中函数名称的所有字符串我的意思是您可以调用 GetProcAddress 的所有字符串如果你对 dll 进行十六进制转储符号字符串就在那里但我认为必须有一个系统调用来获取这些名称如果您
为什么我收到编译错误“使用已删除的函数 'std::unique_ptr ...”

我收到一条巨大的编译错误消息 c mingw include c 6 1 0 bits predefined ops h 123 18 error use of deleted function std unique ptr lt Tp D
_MM_TRANSPOSE4_PS 在 GCC 中导致编译器错误？

我第一次在 GCC 而不是 MSVC 中编译我的数学库并经历了所有的小错误我遇到了一个根本没有意义的错误 Line 284 error lvalue required as left operand of assignment 284号
如何将输出重定向到 boost 日志？

我有一个使用boost log的C 程序我加载了用户提供的动态链接库我想将 stderr 重定向到 boost 日志以便用户的库随时执行以下操作 std cerr lt lt Some stuff 它产生相同的结果 BOOST LOG
如何在 C 语言中获取输入中的空格

我想从控制台获取字符数组它还包含空格我在 C 中知道的唯一方法是 scanf 但是一旦遇到空格它就会停止接受输入我该做什么这就是我正在做的事情 char address 100 scanf s address 尝试使用 fgets
当分配返回 0 时，具有空异常规范的运算符 new 调用构造函数

我有以下声明 void operator new size t s PersistentMemory m throw return m gt allocatePersistentMemory s 我正在测试启动时的内存耗尽这会导致m gt
NSubstitute - 测试特定的 linq 表达式

我在当前正在开发的 MVC 3 应用程序中使用存储库模式我的存储库界面如下所示 public interface IRepository
为什么我无法通过 lambda 捕获“this”指针？

考虑以下代码 class A public void foo auto functor this A a this auto functor a The compiler won t accept this instead of a a g
C++ 在预处理器 #if 中对 sizeof() 比较抛出编译错误

我有这个它不会从 Visual Studio 编译错误致命错误 C1017 无效的整数常量表达式我该怎么做 template
调用泛型类的方法

这是上下文我尝试编写一个映射器来动态地将域模型对象转换为 ViewModel 对象我遇到的问题是当我尝试通过反射调用泛型类的方法时出现此错误 System InvalidOperationException 无法对 Contains
如何从 C# 中的 Web Api 方法正确获取字节数组？

我有以下控制器方法 HttpPost Route SomeRoute public byte MyMethod FromBody string ID byte mybytearray db getmybytearray ID working
推断“x => { throw .. }”的 Lambda 与重载方法中的 Func 匹配吗？

我不明白为什么 C 最终在以下 LINQPad 代码中执行不正确的扩展方法 void Main Actual Sync Action Expected Sync Action Run x gt x Dump Actual Async Tas

随机推荐

Angular 2 / 4 / 5 - 提前编译如何

我正在尝试按照本指南引导我的 Angular 2 RC5 应用程序https angular io docs ts latest guide ngmodule html https angular io docs ts latest gui
JSF 中的 class 和 styleClass 属性有什么区别？

我发现在 JSF 中大多数标准组件都映射到 HTML 标签例如
拆分数据库是合法的安全措施吗？

当我公司以前的开发人员必须存储敏感的用户数据例如医疗记录时他们做了以下操作我怀疑它的优点有些数据被认为是不敏感用户登录个人资料信息和敏感用户医疗记录共有三个数据库中的不敏感数据A 医疗记录在B 以及之间的映射A a
使用 Web 服务将报价导入 vtiger crm

我需要将报价导入到vtiger 我发现可以使用 vtiger Web 服务 API 来完成我找到了参考手册 https wiki vtiger com archives index php vtiger510 Webservice ref
在 shell 脚本中转义单引号

我需要转义变量中的单引号 ssh command file hostname server setup date Y m d tar gz cd var tar zcvf file ini wc l xargs printf Num fil
如何在不重新启动 MySQL 的情况下刷新 Performance_schema 统计信息？

我知道性能模式中的统计数据在 MySQL 重新启动后不会持续存在我想在不重新启动 MySQL 的情况下刷新所有统计信息有什么办法可以做到吗 Thanks 截断每个单独的表更容易的是调用以下过程 CALL sys ps truncate
如何编写可读的 JavaScript

在 JavaScript 中代码格式化的标准规则似乎并没有解决这个问题你最终还是会陷入混乱到处都是我不相信我什至不知道正确缩进声明为其他函数的参数的匿名函数的既定规则简而言之我在阅读自己的 JavaScript 时遇到了困难而
如何在 Oracle 包中执行私有过程？

这是我第一次尝试创建一个包所以我一定错过了一些非常明显的东西我在谷歌上搜索过的东西似乎都不认为值得一提显然如果包体中有未包含在规范部分中的过程那么这些过程就是私有的我遇到的问题是我似乎不知道如何参考那些私人包裹一旦我做好了而且
实体包装器 - 自定义

我想找到一种解决方法来完成一个简单的解决方案以便通过 EF 自动执行某些操作我需要的是在保存和检索过程中接管以修改查询结果但此类将能够使其适用于任何类型的实体示例我有一个 MyTestDb 因此在我的 C 项目中我创建了一个新
无法更改 Android 中的导航抽屉图标颜色

好吧我知道这是一个微不足道的问题但由于某种原因它对我不起作用我已经做了很多其他答案中建议的事情但都是徒劳的我的可绘制文件夹有白色图标我什至尝试从 styles xml 更改它但这也不起作用我正在我的棒棒糖设备上测试它任何帮
使用 `` 或 `@import` 包含 CSS - 哪个更好？

我有一个网站并且有多个用于打印电视屏幕手持设备等的 css 样式表我想知道这些方法中哪一种更好用性能可用性等 or
正则表达式问题组名称重新定义？

所以我有这个正则表达式 s P
线串长度（以英里为单位）

我将运行数据表示为 Shapely LineStrings 其中 LineString 中的每个点都是一个坐标我试图计算出以英里为单位的 LineString 长度我知道 LineString 有一个length方法但我不知道结果是什
从 Spring Boot jar 文件运行非主类

我有一个 spring boot jar 文件里面有一个清单文件如下所示 Manifest Version 1 0 Implementation Title myApp Implementation Version 0 1 Built
delphi中如何分割字符串

我只需要分割一个字符串例如 STANS Payment chk 1 1210 000进入一个基于数组字符串列表中的结果将是 STANS Payment chk 1 1210 000 创建一个TStringList并将逗号分隔的字符串分配
从订单示例构建订单簿[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在寻找从订单构造订单簿的代码例如如果订单是 side price quantity buy 100 1 buy 101 10 buy
gcc中有128位整数吗？

我想要一个 128 位整数因为我想存储两个 64 位数字相乘的结果 gcc 4 4及以上版本有这样的东西吗对于 C23 之前的 GCC 原始 128 位整数类型是仅在 64 位目标上可用因此即使您已经检测到最新的 GCC 版本您也需
在事件处理程序中调用自定义挂钩

我有一个名为的自定义钩子useFetchMyApi将 fetch 调用包装到 API 端点函数钩子接受一个参数并将其包含在帖子正文中数据数组输出取决于钩子参数在UI上 App组件调用useFetchMyApi一次按钮单击处理程序将
包含相同对象列表的对象的实体框架映射

目前在我的代码中我正在做这样的事情 public class Subject private List
FLOPS 什么是真正的 FLOPS

我来自这个线程 FLOPS Intel 核心并使用 C 语言对其进行测试内积 https stackoverflow com questions 1536867 flops intel core and testing it with c

FLOPS 什么是真正的 FLOPS

FLOPS 什么是真正的 FLOPS 的相关文章

随机推荐

热门标签