为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？

2023-12-29

在 0.5 和 0.6 中索引大型矩阵似乎比 0.4.7 花费的时间要长得多。

例如：

x = rand(10,10,100,4,4,1000)   #Dummy array

tic()
r = squeeze(mean(x[:,:,1:80,:,:,56:800],(1,2,3,4,5)),(1,2,3,4,5))
toc()

朱莉娅 0.5.0 -> 经过时间：176.357068283 秒

朱莉娅 0.4.7 -> 经过时间：1.19991952 秒

编辑：根据要求，我已经更新了要使用的基准BenchmarkTools.jl并将代码包装在函数中：

using BenchmarkTools
function testf(x)
    r = squeeze(mean(x[:,:,1:80,:,:,56:800],(1,2,3,4,5)),(1,2,3,4,5));
end

x = rand(10,10,100,4,4,1000)   #Dummy array
@benchmark testf(x)

在 0.5.0 中，我得到以下结果（内存使用量很大）：

BenchmarkTools.Trial: 
  samples:          1
  evals/sample:     1
  time tolerance:   5.00%
  memory tolerance: 1.00%
  memory estimate:  23.36 gb
  allocs estimate:  1043200022
  minimum time:     177.94 s (1.34% GC)
  median time:      177.94 s (1.34% GC)
  mean time:        177.94 s (1.34% GC)
  maximum time:     177.94 s (1.34% GC)

在 0.4.7 中我得到：

BenchmarkTools.Trial: 
  samples:          11
  evals/sample:     1
  time tolerance:   5.00%
  memory tolerance: 1.00%
  memory estimate:  727.55 mb
  allocs estimate:  79
  minimum time:     425.82 ms (0.06% GC)
  median time:      485.95 ms (11.31% GC)
  mean time:        482.67 ms (10.37% GC)
  maximum time:     503.27 ms (11.22% GC)

编辑：更新以使用sub在 0.4.7 和view在0.5.0中

using BenchmarkTools
function testf(x)
    r = mean(sub(x, :, :, 1:80, :, :, 56:800));
end

x = rand(10,10,100,4,4,1000)   #Dummy array
@benchmark testf(x)

在 0.5.0 中，它运行了 >20 分钟并给出：

BenchmarkTools.Trial: 
  samples:          1
  evals/sample:     1
  time tolerance:   5.00%
  memory tolerance: 1.00%
  memory estimate:  53.75 gb
  allocs estimate:  2271872022
  minimum time:     407.64 s (1.32% GC)
  median time:      407.64 s (1.32% GC)
  mean time:        407.64 s (1.32% GC)
  maximum time:     407.64 s (1.32% GC)

在 0.4.7 中我得到：

BenchmarkTools.Trial: 
  samples:          5
  evals/sample:     1
  time tolerance:   5.00%
  memory tolerance: 1.00%
  memory estimate:  1.28 kb
  allocs estimate:  34
  minimum time:     1.15 s (0.00% GC)
  median time:      1.16 s (0.00% GC)
  mean time:        1.16 s (0.00% GC)
  maximum time:     1.18 s (0.00% GC)

这似乎在其他机器上可以重复，因此出现了一个问题：https://github.com/JuliaLang/julia/issues/19174 https://github.com/JuliaLang/julia/issues/19174

编辑 2017 年 3 月 17 日此回归已在 Julia v0.6.0 中修复。如果使用旧版本的 Julia，该讨论仍然适用。

尝试在 Julia v0.4.7 和 v0.5.0 中运行这个粗略的脚本（更改sub to view):

using BenchmarkTools

function testf()
    # set seed
    srand(2016)

    # test array
    x = rand(10,10,100,4,4,1000)

    # extract array view
    y = sub(x, :, :, 1:80, :, :, 56:800)   # julia v0.4
    #y = view(x, :, :, 1:80, :, :, 56:800)  # julia v0.5

    # wrap mean(y) into a function
    z() = mean(y)

    # benchmark array mean
    @time z() 
    @time z() 
end

testf()

我的机器：

julia> versioninfo() 
Julia Version 0.4.7 
Commit ae26b25 (2016-09-18 16:17 UTC) 
Platform Info: 
  System: Darwin (x86_64-apple-darwin13.4.0) 
  CPU: Intel(R) Core(TM) i7-4870HQ CPU @ 2.50GHz 
  WORD_SIZE: 64 
  BLAS: libopenblas (USE64BITINT DYNAMIC_ARCH NO_AFFINITY Haswell) 
  LAPACK: libopenblas64_ 
  LIBM: libopenlibm 
  LLVM: libLLVM-3.3

我的输出，朱莉娅 v0.4.7:

1.314966 seconds (246.43 k allocations: 11.589 MB)
1.017073 seconds (1 allocation: 16 bytes)

我的输出，朱莉娅 v0.5.0:

417.608056 seconds (2.27 G allocations: 53.749 GB, 0.75% gc time)
410.918933 seconds (2.27 G allocations: 53.747 GB, 0.72% gc time)

您似乎已经发现了性能下降。考虑提交一份issue https://github.com/JuliaLang/julia/issues.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

matrix

Julia

为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？的相关文章

如何在 Julia `DataFrame` 中折叠具有重复时间戳的数据

我有一个DataFrame对象如下所示 Row timestamp price volume 1 2011 08 14T14 14 40 10 40 0 779 2 2011 08 14T15 15 17 10 40 0 101 3 201
当 Jupyter 单元包含函数、循环或其他块时，是否可以将其拆分为多个单元？

Jupyter 的一项功能是能够一次执行一个单元如果一个单元格有很多语句通常可以希望将其拆分为更小的单语句单元格除非涉及块例如 if for def 等这个问题之前以不同的方式提出过在Jupyter中逐步执行算法 https
为什么 Julia 中的“where”语法对换行符敏感？

在 Stack Overflow 上的另一个问题中答案包括以下函数 julia gt function nzcols b SubArray T 2 P Tuple UnitRange Int64 UnitRange Int64 where
使用 OpenGL 着色器进行数学计算 (C++)

我有一个矩阵例如 100x100 尺寸我需要对每个元素进行计算 matrix i j tt 8 5例如我有一个巨大的矩阵我想使用 OpenGL 着色器来实现该算法我想使用着色器例如 uniform float val unifo
R：邻接表到邻接矩阵

Bonjour 我想将邻接列表 3 列转换为邻接矩阵在这个论坛中我找到了多个有关如何将边列表转换为邻接矩阵的示例我成功地为两列列表做到了这一点我已经尝试了在网上可以找到的所有解决方案但似乎我错过了一小步我尝试过的我的变量是用
如何在 Julia 中保存文件

在某些时候我认为 Julia v0 7 你可以做 save savepath thingtosave为了使用 Julia 保存文件我尝试在 v0 7 上运行它看看是否收到弃用警告但即使在 0 7 上它也说 save未定义如何使用
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
指向特征矩阵的指针数组

我在代码中使用 Eigen 的 MatrixXd 矩阵在某个时刻我需要一个 3D 矩阵由于 Eigen 没有三维矩阵类型因为它仅针对线性代数进行了优化因此我创建了一个 MatrixXd 类型的指针数组 Eigen MatrixXd
numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
通过多次合并相同的行向量来构建矩阵

有没有一个matlab函数可以让我执行以下操作 x 1 2 2 3 然后基于x我想建立矩阵m 1 2 2 3 1 2 2 3 1 2 2 3 1 2 2 3 您正在寻找REPMAT http www mathworks com help t
MATLAB - 通过垂直连接子矩阵重新排列矩阵

我在执行以下任务时遇到问题假设一个 3x6 矩阵 A 0 2787 0 2948 0 4635 0 8388 0 0627 0 0435 0 6917 0 1185 0 3660 0 1867 0 2383 0 7577 0 6179 0
如何在 MATLAB 中将矩阵元素除以列总和？

有没有一种简单的方法可以将每个矩阵元素除以列和例如 input 1 4 4 10 output 1 5 4 14 4 5 10 14 以下是执行此操作的不同方法的列表使用bsxfun https www mathworks com he
scipy 将一个稀疏矩阵的所有行附加到另一个稀疏矩阵

我有一个 numpy 矩阵想在其中附加另一个矩阵这两个矩阵的形状为 m1 shape 2777 5902 m2 shape 695 5902 我想将 m2 附加到 m1 以便新矩阵的形状为 m new shape 3472 5902 当
如何使用合并或替换来更新 R 中具有多列的表

我想做一些与这个问题非常相似的事情如何使用 merge 更新 R 中的表 https stackoverflow com questions 3190118 how to use merge to update a table in r
将 OpenCV Mat 转换为数组（可能是 NSArray）

我的 C C 技能很生疏 OpenCV 的文档也相当晦涩难懂有没有办法获得cv Mat data属性转换为数组 NSArray 我想将其序列化为 JSON 我知道我可以使用 FileStorage 实用程序转换为 YAML XML 但这不
在 Julia 中保存和检索字典的正确方法是什么？

我已经看到 Julia 充分解释了 MAT 文件这些文件中的结构可以毫无问题地作为字典读取现在我创建了自己的字典其结构如下 String String gt Int Int Int 在每个条目上我可以保存它writedlm它产生了一
使用 Pkg.add 时出现 julia 错误

我刚刚在ubuntu中安装了julia 在添加包时发现了一些问题 julia gt Pkg Add Gadfly ERROR UndefVarError Add not defined 我也尝试更新 julia 但弹出错误 julia gt
如何识别数据集中其他列之和的列

我想编写一个函数最好用 R 语言但也欢迎其他语言它可以识别数据集中列之间的关系仅限于加法减法其实际应用是在大型多列财务数据集上运行它其中某些列是其他列的小计并识别此类小计理想情况下我希望允许一些小的差异例如允许舍入问题
如何在 Julia 中转置字符串数组？

它适用于数字但不适用于字符串 The 1 2 有效但是 a b 没有为什么以及如何做到这一点 Why a b 不起作用因为运算符实际上计算矩阵的惰性伴随请注意如文档中所述 adjoint https docs julia
如何终止 Julia 中的任务/协程？

using HttpServer http HttpHandler do request Request response Response show request Response Hello there end http events

随机推荐

如何使用 jQuery 选择文本节点？

我想获取一个元素的所有后代文本节点作为 jQuery 集合最好的方法是什么 jQuery 没有为此提供方便的函数你需要结合contents 它将只给出子节点但包括文本节点其中find 它给出所有后代元素但不给出文本节点这是我想
$(document).keydown 不起作用

Edit 感谢大家的帮助但我将我的问题跟踪为代替请投票关闭知道为什么吗 function document keydown function evt alert Hello 不管用我在用Firefox 3 6 13在 Ubuntu
什么时候需要 pygame.init() ？

我正在学习 pygame 在绝大多数教程中据说应该运行pygame init 在做任何事情之前我正在做一个特定的教程并像一个人那样输入代码并注意到在一个又一个的示例中没有pygame init 并且没有任何模块的其他显式初始化例如以
使用角度过滤来过滤角度材料表中的特定列？

我在用垫子表 https run stackblitz com api angular v1 file app 2Ftable filtering example ts 它有一个过滤器工作正常针对以下数据进行过滤所有列 const E
每个用户表都应该有聚集索引吗？

最近我在数据库中发现了几个没有定义聚集索引的表但定义了非聚集索引因此它们位于 HEAP 上经过分析我发现 select 语句对非聚集索引中定义的列使用过滤器这些表上没有聚集索引会影响性能吗很难比 SQL Server MVP
Matplotlib event_handling 线选择器

This example http matplotlib org examples event handling legend picking html可以单击图例从而更改绘图我想做类似的事情但不是通过单击图例而是通过单击图中的线我
Android 检查 SharedPreferences 的值类型

我有一些键值对SharedPreferences 有整数浮点数字符串等有没有办法检查给定的键是否属于特定类型 EDIT 我研究了文档和可用的方法可悲的是在我看来我需要使其成为一种肮脏的方式只需尝试每个 get 方法直到我
Autofac 无法解析模块中的依赖关系

我是 AutoFac 的新手我认为应该是一个简单的场景 var builder new ContainerBuilder builder Register c gt new EventLogLogger As
Selenium WebDriver JS - 显式等待

我正在使用 selenium webdriverjs 我想等待显示某个元素我已为其创建了显式等待如下所示它工作得很好 var displayed false driver wait function driver findElemen
圆形 LinearGradient 上的 ContextMenu 在 SwiftUI 中产生锐边

我有以下观点 struct ContentView View var body some View LinearGradient gradient Gradient colors blue red startPoint topTrailin
Python + BeautifulSoup：如何从基于文本的 HTML 中获取包装器？

想要获得关键文本的包装例如在 HTML 中 div class target chicken div div class not target apple div 并根据文本鸡想要返回 div class target chicke
当removeAll()时TreeSet中出现NullPointerException

从文档Collection removeAll https docs oracle com javase 7 docs api java util Collection html removeAll java util Collection
jQuery 1.9 .live() 不是一个函数

我最近将 jQuery 从 1 8 更新到 2 1 我突然发现 live 停止工作我收到错误TypeError live is not a function 有什么方法可以代替 live jQuery live 从1 9版本开始已被删除
如何将一组函数存储到 Fortran 数组中

我们知道函数名可以作为参数被其他子程序传入传出我想知道我们是否有任何技巧可以将函数列表保存到数组中该数组将被传入和传出以进行处理例如在某个地方我们设置任何数组 type Idonotknow Farray N 然后设置值 Farr
plotly.js 轴“锚点”属性

我正在尝试自定义一些子图但我不明白轴锚点属性的含义使用此属性的一些示例如下 https plot ly javascript subplots https plot ly javascript subplots 什么是yaxis2
如何在新的 Google Analytics 代码中放置自定义变量

我想将自定义变量放入 Google Analytics 但我对语法有点困惑这是 Google 让我在我的网站上放置的内容 function i s o g r a m i GoogleAnalyticsObject r i r i r f
如何从 Google 的 api 获取更大的 favicon？

是否可以从 Google 的 api 或其他地方获取更大版本的 favicon 这是网址 http www google com s2 favicons domain google com http www google com s2 fa
选项卡布局实现上的 NullPointerException

我已经实现了选项卡布局但我的应用程序未启动我在这一行得到 NullPointerException actionBar setNavigationMode ActionBar NAVIGATION MODE TABS 我认为一切都做得很
如何让 Azure 数据工厂循环访问文件夹中的文件

我正在看下面的链接 https azure microsoft com en us updates data factory supports wildcard file filter for copy activity https azu
为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？

在 0 5 和 0 6 中索引大型矩阵似乎比 0 4 7 花费的时间要长得多例如 x rand 10 10 100 4 4 1000 Dummy array tic r squeeze mean x 1 80 56 800 1 2 3 4

为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？

为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？ 的相关文章

随机推荐

热门标签

为什么 Julia 0.5.0 中索引大矩阵的速度比 0.4.7 慢 170 倍？的相关文章