在 Fortran 中传递不连续的数组部分

2024-01-07

我正在使用 intel fortran 编译器和 intel mkl 进行性能检查。我将一些数组部分传递给 Fortran 77 接口，调用如下

call dgemm( transa,transb,sz_s,P,P,&
            a, Ts_tilde,&
            sz_s,R_alpha,P,b,tr(:sz_s,:),sz_s)

显然，tr(:sz_s,:) 在内存中不是连续的，Fortran 77 接口期望一个连续的块并为此创建一个临时块。

我想知道的是，如果我在 tr 的代码中显式创建临时数组并在操作之前和之后从该临时数组中来回复制信息，是否会有所不同，或者与编译器本身创建临时数组相同从性能的角度来看？我想编译器总是会更有效率。

当然，欢迎提出更多消除这些临时文件的建议。

还有一点，如果我显然使用该库的 Fortran 95 接口，并对更简单的测试问题进行类似的调用，则不会针对创建临时对象发出警告。然后我在 mkl 手册中读到 Fortran 95 接口使用假定的形状数组，这解释了为什么不创建临时数组。

然而，在这一点上，我似乎无法使用一些支持功能，例如计时例程。也就是说，intel mkl 有一些计时支持函数，但如果我将它们与下面的 mkl_service 例程一起使用，那么我会收到 dsecnd 的“此名称没有类型，并且必须具有显式类型”错误。也欢迎对此问题的任何想法。一个简单的例子如下

program dgemm95_test
! some modules for Fortran 95 interface
use mkl_service
use mkl95_precision
use mkl95_blas
!
implicit none
!
double precision, dimension(4,3) :: a
double precision, dimension(6,4) :: b
double precision, dimension(5,5) :: r ! result array
double precision, dimension(3,2) :: dummy_b
!
character(len=1) :: transa
character(len=1) :: transb
!
double precision :: alpha, beta, t1, t2, t
integer :: sz1, sz2

! initialize some variables
alpha = 1.0
beta = 0.0
a = 2.3
b = 4.5
r = 0.0
transa = 'n'
transb = 'n'
dummy_b = 0.0
! Fortran 95 interface
t1 = dsecnd()
call gemm( a, b(4:6,1:3:2), r(2:5,3:4),&
 transa, transb, alpha, beta )
t2 = dsecnd()
!
write(*,*) r
dummy_b  = r(2:4,4:5)
!
end program dgemm95_test

当将数组部分传递给旧例程使用的假定大小的数组虚拟参数时，临时参数是绝对必要的，因为数组部分在内存中不是连续的。

您当然可以制作自己的临时数组。是否会更快取决于很多因素。其中重要的是临时数据是分配在堆栈上还是堆上。英特尔 Fortran 编译器能够同时执行这两种操作，有编译器开关来控制行为（-heap-arrays n）并且它可以取决于数组大小。堆栈分配速度要快得多，并且通常是默认分配。默认情况下，您可以将其用于自己的临时数组的自动数组也分配在堆栈上。小心堆栈上的大数组，很容易溢出并导致崩溃。

我建议您进行性能测试并使用更简单的变体（如果它不是太慢的话）。可能是 Fortran 95 界面，但您确实应该测量时间。

至于时间，MKL手册页为second()/dsecnd()说明您必须包括mkl_lapack.fi并且没有谈论任何 Fortran95 接口。您也可以将其声明为外部双精度，但我会使用 include。或者使用system_clock()作为可移植标准 Fortran 95。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Fortran 中传递不连续的数组部分的相关文章

Fortran 小数和千位分隔符

有没有办法更改逗号的句点小数分隔符另外如何使输出数字具有千位分隔符这可以是逗号句号空格打开文件时使用参数 DECIMAL COMMA open 100 file logfile status unknown DECIMAL CO
Intel x86 与 AMD x86 CPU 上的访问性能不一致

我已经实现了一个带有结构内存布局数组的简单线性探测哈希图该结构包含键值和指示条目是否有效的标志默认情况下该结构体由编译器填充因为键和值是 64 位整数但该条目仅占用 8 个布尔值因此我也尝试以未对齐访问为代价来打包结构由于
Intel Fortran 错误 #6633：实际参数的类型与虚拟参数的类型不同

对于可能在这里提出这样一个基本问题我深表歉意我是使用英特尔 Fortran 编程的新手所以我认为在这种情况下我不知道有一些东西丢失或组织错误如果有人能在这方面帮助我我将不胜感激问题是我在编译代码时看到以下错误而我相信我已经声
从接口访问参数 (Fortran)

我正在使用参数来修复所用类型的精度在我尝试在接口中使用相同类型之前这种方法工作得很好考虑这个小例子 module Hello implicit none save integer parameter K selected real k
fortran 中的多重定义链接错误（ifort - gfortran）

嗯我有这个问题描述很长但我认为很容易解决我有三个文件 nrtype f90 它有一些愚蠢的定义但它被以下文件使用 module nrtype integer parameter I4B SELECTED INT KIND 9 in
在 Fortran 95 中按值传递参数

如何在调用函数参数时保留其值而不创建新变量这就是如何按值传递参数在此示例代码中 program what implicit none integer a b c d a 1 b 2 c 3 print a b c d f val a
Skylake 中干净缓存行的写回？

我观察到 Skylake SP 在真实硬件上对干净的缓存行进行写回 Leeor 对这篇文章的回答对于 Intel Core i3 i7 数据从缓存集中逐出后的去向 https stackoverflow com questions 1941
英特尔 SGX 开发者许可和开源软件

是否可以获得许可的开发人员证书用于在生产模式下签署经过安全审查社区开发的开源 SGX 软件二进制文件并将其发布到 apt 或 rpm 等开源存储库上我刚刚询问了Intel SGX团队他们说只有经过验证的供应商才能获得证书并在生产模
使用 Fortran (CLFORTRAN) 在 OpenCL 中将两个选项作为参数传递

当我的主机程序采用 C 语言时我可以传递两个选项作为 OpenCL 函数的参数例如我可以通过两个标志到clCreateBuffer像这样的函数 clCreateBuffer context CL MEM READ ONLY CL M
在 Core i7 Mac 上禁用睿频加速？

有没有什么方法可以在运行 Mac OS X 的 Core i7 mac 上以编程方式禁用 Turbo Boost 我需要能够在代码优化等过程中出于基准测试目的执行此操作如果做不到这一点任何可以禁用启用 Turbo Boost 的实用程
Fortran：向文件添加列（即跳过不同数量的水平空格）

我是 Fortran f90 的初学者一些看似简单的问题结果却导致严重头痛感谢您帮助我解决这个问题我的代码运行一个循环处理数据并将它们写入文件我希望将这些数据写入同一文件的列中直到循环完成 OPEN unit 11 file f
时间数组在建模中超出范围？

这些天我正在尝试使用新的气象数据以 netcdf 格式而不是旧的 cray 格式给出运行我的气候模型模型编译顺利但是当进行模拟时模型在第一天运行良好但在模拟的第二天就停止了总是在同一时间步长无论我使用哪个开始日期错误是 f
C#：TurboBoost 激活时如何获取 Intel i 系列 CPU 的当前时钟速度

我知道有可能获得此信息 Intel 自己的 TurboBoost 侧边栏小工具似乎使用 ActiveX 控件来确定 TurboBoost 处于活动状态时 i3 i5 i7 CPU 的当前时钟速度但是我想在 C 中以编程方式执行此操作从
Fortran 03/08（gfortran 编译器）中使用无限多态类型进行数组操作

我想通过以下方式实现有用的数组操作添加元素删除元素通过可分配指针二叉树结构实现不同的实现 class 特征无限多态性我使用 gfortran 5 0 应该可以处理这样的功能我需要它以免为我使用的每种类型重复相同的代码这应
使用 mkl_malloc 进行内存对齐

这个问题可能只是表明我还没有理解 C 中的一些重要内容 Intel Math Kernel 库提供了一种在分配内存时设置内存对齐的方法另一方面我只是通过引用将数组传递给 mkl lapack 例程那么 lapack 例程如何知道数组的
Fortran PURE 函数可以使用全局参数吗？

在我看来 Fortran 中所谓的纯函数对于那些使用函数式编程的人来说似乎不够纯粹这是我的问题假设我有以下代码 MODULE basics IMPLICIT NONE INTEGER PARAMETER dp kind 1 0d0 RE
Enthought Python 中的线程 FFT

Numpy SciPy 中的快速傅立叶变换 FFT 不是线程化的 Enthought Python 附带 Intel MKL 数值库该库能够进行线程 FFT 如何获得这些例程以下代码适用于 Windows 7 Ultimate 64 位
纯 Fortran 过程中的 I/O

我正在尝试将错误检查合并到我正在编写的纯过程中我想要这样的东西 pure real function func1 output unit a implicit none integer a output unit if a lt 0 th
Fortran 中的数组第一个索引

我认为 Fortran 中数组的第一个索引是 1 但是为什么这段代码可以工作呢代码是 Wavewatch 的修改部分 http polar ncep noaa gov waves wavewatch http polar ncep noa
指定 gfortran 应该在其中查找模块的目录

我目前基于模块来编译程序例如主程序foo这取决于模块bar 如下 gfortran c bar f90 gfortran o foo exe foo f90 bar o 当foo f90 and bar f90位于同一目录中如何指定 g

随机推荐

是什么原因导致“java.lang.IllegalArgumentException：没有为键提供值”？

我有形状代码 let foo foo make foo 这段代码偶尔会发出一个java lang IllegalArgumentException No value supplied for key foo foo other other
如何在 ASP.NET Web 应用程序上使用表单身份验证最好地处理基于角色的权限？

我正在使用ASP NET 登录控件 http msdn microsoft com en us library ms178329 aspx and 表单验证 http msdn microsoft com en us library aa4
在java中动态改变TitledBorder颜色

我创建了一个 TitledBorder 并将其设置为 JPanel JPanel panel new JPanel panel setBorder javax swing BorderFactory createTitledBorder n
为什么 Debian/Ubuntu 上仅提供过时版本的 NPM？

我正在使用基于 Debian Ubuntu 的发行版特别是 AWS Ubuntu 16 04 并尝试通过安装 NPMapt get 我的 Angular 2 应用程序需要高于 3 9 x 的 NPM 版本但安装的默认版本是 3 5 2s
Anaconda Python Conda pipbuild 因 WindowsError 找不到文件而失败

我最近切换到 Anaconda Python 发行版并且正在尝试掌握其中的窍门我想安装这个yaml相关的包 https pypi python org pypi layered yaml attrdict config 14 06 7由
OpenCV 3D Mat 到 Vector

我有 3D Mat 想将其转换为 Vector 我尝试了 opencv 的 reshape 函数但它似乎不适用于维度超过 2 的矩阵如何将 3D Mat 转换为 Vector 我可以通过访问 Mat 中的所有元素来做到这一点有什么有效
根据值过滤对象属性

是否有一些优雅的方法可以使用 lodash 下划线从该对象中过滤掉错误属性类似于如何 compact array 从数组中删除错误元素 so from propA true propB true propC false propD tru
正则表达式匹配指定分隔符之间的文本？（我自己就是拿不到）

我一直在谷歌搜索并试图自己得到这个但无法完全得到它问题可以使用什么正则表达式来选择分隔符文本之间但不包括的文本举个例子 Start Marker ABC Stop Marker XYZ input This is the fir
将一个 Markdown 文档嵌入到另一个 Markdown 文档中

有没有办法将一个 markdown 或其子风味我正在使用 PanDoc 文档嵌入到另一个文档中除了使用jQuery load url 我想要一份包含例如的文件 main md chapter1 md chapter2 md with m
Jsoup解析-同时解析多个链接

我有一个程序能够从网站列表中一一获取html文档然后解析它 ArrayList
java 原子操作

下列说法正确的是 int v j as 读取j值原子读取的值加 1 NON 原子可能的干扰其他线程将相加结果写入i 原子将 i 写入 v 原子 Yes int 或更小的数据类型读写算术操作是原子的引用读写也是原子的
反转 WPF GridView 将项目绑定到列而不是行

有没有一种简单的方法来反转 WPFGridView http msdn microsoft com en us library system windows controls gridview aspx这样项目就绑定到列而不是行或者是否有
在 ASP.NET 5 / MVC 6 上运行 Selenium 测试之前启动 IIS Express

我有一个带有 web 项目 ASP NET v5 和 web Tests 项目 xunit net 2 1beta 的VS解决方案其中一个测试是检查渲染的页面我正在尝试让测试自动启动该站点因此我不需要单独手动运行它 namespac
尝试与此设备通信时遇到错误

我在新版本的 XCode9 和 iOS11 中使用通过网络连接选项时收到此错误我选中了通过网络连接框几秒钟后 XCode 给出了这个错误尝试与此设备通信时遇到错误有人面临同样的问题吗配置 XCode 版本 9 0 beta
Snow Leopard 上的 Python，如何打开 >255 个套接字？

考虑这段代码 import socket store scount 0 while True scount 1 print Creating socket d scount s socket socket socket AF INET so
如何使用新的 Graph API 添加 Facebook 事件

我正在尝试使用 Facebook api 创建一个事件来自 django 应用程序有人使用新的图形 API 创建了事件吗检查这里 http developers facebook com docs api publishing htt
禁用 git EOL 转换

我试图让 git 不更改任何操作的任何行结尾不幸的是这样做似乎无关紧要我已将其简化为以下测试用例该测试用例具有尽可能多的不同机制来禁用此行为从两台机器开始 Windows 计算机 A Linux 计算机 B 在两台机器上 git
如何获取 app.config 中所有连接字符串的列表

需要创建一个小型控制台应用程序它需要两个参数文件位置为app config file 密钥我的问题是控制台应用程序需要读取connectionStrings并对其进行加密然后将加密文本保存到配置文件中我已经看过但没有找到任何解决
使用 PHP 调整图像大小

我有一个不太确定的问题我在其他地方看到过例子但没有什么特别像我的情况我想使用 PHP 调整图像大小以便它们可读而不仅仅是像使用 HTML 那样奇怪地拉伸如果它们不是 250 像素宽或 160 像素高我如何调整图片大小使其成比
在 Fortran 中传递不连续的数组部分

我正在使用 intel fortran 编译器和 intel mkl 进行性能检查我将一些数组部分传递给 Fortran 77 接口调用如下 call dgemm transa transb sz s P P a Ts tilde sz

在 Fortran 中传递不连续的数组部分

在 Fortran 中传递不连续的数组部分 的相关文章

随机推荐

热门标签

在 Fortran 中传递不连续的数组部分的相关文章