为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？

2024-01-07

I have written programs in C++, Python and Java for matrix multiplication and tested their speed for multiplying two 2000 x 2000 matrices (see post http://martin-thoma.com/matrix-multiplication-python-java-cpp/). The standard ikj-implentation - which is in enter image description here - took:

C++： 15 秒（Source https://github.com/MartinThoma/matrix-multiplication/blob/master/C++/ikj-algorithm.cpp)
Python：6分13秒（Source https://github.com/MartinThoma/matrix-multiplication/blob/master/Python/psyco-ikj-multiplication.py)

Now I have implemented the Strassen algorithm for matrix multiplication http://en.wikipedia.org/wiki/Strassen_algorithm#Source_code_of_the_Strassen_algorithm_in_C_language - which is in enter image description here - in Python and C++ as it was on wikipedia. These are the times I've got:

C++： 45分钟（Source https://github.com/MartinThoma/matrix-multiplication/blob/master/C++/strassen.cpp)
Python：10小时后被杀死（Source https://github.com/MartinThoma/matrix-multiplication/blob/master/Python/strassen-algorithm.py)

为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？

Ideas:

一些缓存效果
Implementation:
- 错误（生成的 2000 x 2000 矩阵是正确的）
- 空乘（对于 2000 x 2000 -> 2048 x 2048 来说应该不那么重要）

这尤其令人惊讶，因为它似乎与其他人的经历相矛盾：

为什么我的 Strassen 矩阵乘法器如此快？ https://stackoverflow.com/q/7827737/562769
矩阵乘法：Strassen 与标准 https://stackoverflow.com/q/4304600/562769- 施特拉森对他来说也慢一些，但至少是在同一个数量级上。

编辑：在我的例子中施特拉森矩阵乘法较慢的原因是：

我使它完全递归（参见 tam）
我有两个功能strassen and strassenRecursive。如果需要，第一个将矩阵大小调整为 2 的幂，并调用第二个。但strassenRecursive没有递归调用自身，但是strassen.

基本问题是，您使用 strassen 实现将叶子大小递归到 1。 Strassen的算法具有更好的Big O复杂度，但常量do现实中很重要，这意味着实际上对于较小的问题规模，您最好使用标准的 n^3 矩阵乘法。

因此，要大大改进您的程序，而不是这样做：

if (tam == 1) {
        C[0][0] = A[0][0] * B[0][0];
        return;
    }

use if (tam == LEAF_SIZE) // iterative solution here. LEAF_SIZE应该是一个常数，您必须针对给定的架构通过实验确定该常数。根据架构的不同，它可能更大或更小——在某些架构中，strassen 的常数因子太大，以至于对于合理的矩阵大小来说，它基本上总是比更简单的 n^3 实现更糟糕。这一切都取决于。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？的相关文章

如何进行带有偏差的浮点舍入（始终向上或向下舍入）？

我想以偏置舍入浮动要么总是向下要么总是向上代码中有一个特定的点我需要这个程序的其余部分应该像往常一样四舍五入到最接近的值例如我想四舍五入到最接近的 1 10 倍数最接近 7 10 的浮点数约为 0 69999998807 但
当我单击 C# 中的“取消”按钮时重定向到新页面（Web 部分）

Cancel button tc new TableCell btnCancel new Button btnCancel Text Cancel btnCancel Click new EventHandler btnCanel Clic
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
Guid 应包含 32 位数字和 4 个破折号

我有一个包含 createuserwizard 控件的网站创建帐户后验证电子邮件及其验证 URL 将发送到用户的电子邮件地址但是当我进行测试运行时单击电子邮件中的 URL 时会出现以下错误 Guid should contain
ZLIB 解压缩

我编写了一个小型应用程序该应用程序应该解压缩以 gzip deflate 格式编码的数据为了实现这一点我使用 ZLIB 库使用解压缩功能问题是这个功能不起作用换句话说数据不是未压缩的我在这里发布代码 int decompre
如何在 VS 中键入时显示方法的完整文档？

标题非常具有描述性是否有任何扩展可以让我看到我正在输入的方法的完整文档我想查看文档因为我可以在对象浏览器中看到它其中包含参数的描述和所有内容而不仅仅是一些摘要当然可以选择查看所有覆盖它可能是智能感知的一部分或者我不知道它并
是否有与 C++11 emplace/emplace_back 函数类似的 C# 函数？

从 C 11 开始可以写类似的东西 include
范围和临时初始化列表

我试图将我认为是纯右值的内容传递到范围适配器闭包对象中除非我将名称绑定到初始值设定项列表并使其成为左值否则它不会编译这里发生了什么 include
两组点之间的最佳匹配

I ve got two lists of points let s call them L1 P1 x1 y1 Pn xn yn and L2 P 1 x 1 y 1 P n x n y n 我的任务是找到它们点之间的最佳匹配以最小化它
C# 编译器如何决定发出可重定向的程序集引用？

NET Compact Framework 引入了可重定向程序集引用现在用于支持可移植类库基本上编译器会发出以下 MSIL assembly extern retargetable mscorlib publickeytoken 7C
std::bind 重载解析

下面的代码工作正常 include
C# using 语句、SQL 和 SqlConnection

使用 using 语句 C SQL 可以吗 private static void CreateCommand string queryString string connectionString using SqlConnection c
在 C 中复制两个相邻字节的最快方法是什么？

好吧让我们从最明显的解决方案开始 memcpy Ptr const char a b 2 调用库函数的开销相当大编译器有时不会优化它我不会依赖编译器优化但即使 GCC 很聪明如果我将程序移植到带有垃圾编译器的更奇特的平台上我也不
Qt - 设置不可编辑的QComboBox的显示文本

我想将 QComboBox 的文本设置为某些自定义文本不在 QComboBox 的列表中而不将此文本添加为 QComboBox 的项目此行为可以在可编辑的 QComboBox 上实现QComboBox setEditText cons
是否有一个 C++ 库可以从 PDF 文件中提取文本，例如 PDFBox for Java？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案去年我使用 PDFBox 在 Java 中创建了一个应用程序来获取某些 PDF 文件中的原始文本现在
为什么我使用google'smtp'无法发送电子邮件？

我有以下程序使用 smtp gmail com 587 发送电子邮件 namespace TestMailServer class Program static void Main string args MailMessage mail
哪些属性有助于运行时 .Net 性能？

我正在寻找可用于通过向加载器 JIT 编译器或 ngen 提供提示来确保 Net 应用程序获得最佳运行时性能的属性例如我们有可调试属性 http msdn microsoft com en us library k2wxda47 aspx
以编程方式使用自定义元素创建网格

我正在尝试以编程方式创建一个网格并将自定义控件作为子项附加到网格中作为 2x2 矩阵中的第 0 行第 0 列为了让事情变得更棘手我使用了 MVVM 设计模式下面是一些代码可以帮助大家理解这个想法应用程序 xaml cs base
文件修改时间检查的成本

对于Linux下包含少量字节的文件我只需要处理自上次处理以来发生更改的时间我通过调用 PHP 检查文件是否被更改clearstatcache filemtime 定期由于整个文件总是很小因此删除对 filemtime 的调用并通过将

随机推荐

创建/编辑 PNG 图像的免费工具？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有可用于创建和编辑 PNG 图像的免费工具画图网 http getpaint net 会充满热情
Laravel：与数组的额外字段同步

我试图将数据保存在数据透视表中并使用一个名为数据的额外字段当我保存时我有这个数组 5 gt files 4 gt pictures 3 gt tags 1 gt thumbs 我的桌子看起来像这样项目ID 选项 ID name 上
带有多重选择的 kivy spinner 小部件

我正在寻找 Spinner 类型或类似的东西的 kivy 小部件最好在 python kv 文件中例如我可以在其中通过复选框选择多个项目所选项目应在元组中可用在图片 start png 中您将找到起始情况表单中有一个标签和
应用程序进入前台后 viewDidAppear 不会再次触发

我在 iPhone 应用程序代码中发现了一个问题即 viewDidAppear 方法并不总是触发当您启动应用程序时事件将按预期触发但是如果我使用能够进行多任务处理的手机关闭应用程序并重新打开我的 viewDidAppear 事件
Angular js ng 重复条件 ng 类不应用 css 类

我有一个 ng 重复它的 ng 类在我的 css 类名称中包含连字符的情况下不应用 css 类 li item name li 我做错了什么吗如果我将 css 类名更改为 isomeclass 它就可以工作 AngularJS v1 0
将参数传递给 MVC Ajax.ActionLink

如何将 TextBox 的值作为 ActionLink 的参数发送我需要使用 Html TextBoxFor 控制器操作如下所示 public class MyController public ActionRes
Microsoft 是否有关于不同 Windows 平台上应用程序数据与用户数据存储的最佳实践文档？

创建面向多个 Windows 版本的应用程序时确定应用程序特定数据应存储在何处的最佳实践是什么具体来说应用程序特定数据例如应用程序配置数据用户特定数据设置例如我知道在 Windows Vista 上有可以使用的环境变量例如
return 语句中的 C++ constexpr 函数

为什么 constexpr 函数不在编译时计算而是在运行时在 main 函数的 return 语句中计算它尝试过 template
在带有 ES 模块的 Node.js 中使用相对路径导入

过去我用过app module path每当我想在 Node js 应用程序中使用相对路径时如果我通过以下方式使用 ES 模块 mjs格式如何在某个目录路径变得相对的情况下具有相同的功能以另一种方式我是否能够为目录分配一个别名以便
如何在solr中搜索多个方面？

我需要在 solr 中搜索方面如下所示 fq 国家美国 fq 国家加拿大 fq 主题工业 fq 主题政治现在我需要搜索具有上述方面逻辑与和逻辑或的文章假设我有以下文章国家美国法国主题英思科国家美国加拿大主
Java 奇怪的程序输出中的移位运算符

我遇到了以下程序它的行为方式出乎意料 public class ShiftProgram public static void main String args int i 0 while 1 lt lt i 0 i System out
尽管进程已终止，为什么 os.kill(pid, 0) 返回 None ？

这个问题涉及到这个答案 https stackoverflow com a 13402639 1125413我的其他问题之一在这个答案中我被告知可以使用os kill pid 0 检查子进程是否已终止如果它还在运行 None被返回如果
C# 文件关联的正确方法

我一直在寻找一种正确的方法来使文件关联在 WinXP 及更高版本上工作如果该关联已存在则应将其替换我开发的应用程序始终在管理模式下运行因此权限应该不成问题我遇到过一些旧帖子其中有一些示例代码但其中一些工作得不够好有些则根本不
更新到 macOS 13.3 无法编译 cpp

更新到 Ventura 13 3 安装最新的 Xcode 和命令行工具后我在编译任何 cpp 文件时收到此错误 Applications Xcode app Contents Developer Platforms MacOSX plat
为什么默认参数不能依赖于非默认参数？ [复制]

这个问题在这里已经有答案了考虑以下构造函数 class MyClass MyClass unsigned int dimension std vector vector unitaryVector dimension where unit
如何根据日历模式创建事件？

我正在尝试为某人创建一个轮班日历我知道该模式从哪一天开始并且我知道该模式的断断续续的日期但我在将其翻译成代码时遇到了麻烦他们工作4天休息3天工作4天休息3天工作4天休息2天如此循环我需要创建一些逻辑来基于此为日历创
Material SearchView 实现错误

我正在开发一个 Android 应用程序现在一切都很好但是当尝试使用 Google 指南实现 Material SearchView 并逐步遵循一些教程时我无法弄清楚这个错误菜单 main xml menu menu
在 git repo 上工作，无需 cd 进入目录

当我还没有在存储库上运行 git 命令时我将如何运行cd进入那个目录 IE 我想跑git branch repos myrepo git 从 git 1 8 5 开始使用 C option git C Users michael Dev
如何在 C++ 中使用 XCode 4.2 设置 OpenGL 项目？

我正在尝试使用 C 来了解一些图形我认为最好从功能最强大的图形框架开始因此我将使用 Lion 中包含的 OpenGL 基本上我在 XCode 4 2 中启动了一个 C 命令行工具这就是我所做的一切我需要以某种方式将 OpenGL 与
为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？

I have written programs in C Python and Java for matrix multiplication and tested their speed for multiplying two 2000 x

为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？

为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？ 的相关文章

随机推荐

热门标签

为什么施特拉森矩阵乘法比标准矩阵乘法慢得多？的相关文章