为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？

2024-01-04

我正在尝试通过矢量化 for 循环来改进 Fortran 77 代码。我对矢量化相当陌生，虽然我可以获得矢量化代码，但优化报告告诉我，我的一些数组具有未对齐的访问权限。据我了解，这使得矢量化效率较低。我已手动向数组添加填充，以便对齐数据，这似乎适用于我的大多数数组，但不适用于所有数组（请参阅示例代码）。

      SUBROUTINE SOURCE
      PARAMETER(NLINES=8)
      PARAMETER(NLM=NLINES-1)
      PARAMETER(NZ=18)
      
      COMMON/TEST/h(-nlines:nlines+15,-nlines:nlines)
     &,hr(-nlines:nlines+15,-nlines:nlines)
      COMMON/PRO/P2(-nlm:nlm+1,-nlm:nlm)

      dimension SNT(-nlm:nlm+1,-nlm:nlm,0:NZ+1)

      DO iy=-nlm,nlm
       DO ix=-nlm,nlm
        H(ix,iy)=SNT(ix,iy,1)
     &  +SNT(ix,iy,0)
     &  +SNT(ix,iy,2)

        HR(ix,iy)=P2(ix,iy)*H(ix,iy)
       enddo
      enddo      
      END

以及优化报告的相关部分：

   LOOP BEGIN at SOURCE.FPP(13,8)
      remark #15389: vectorization support: reference h(ix,iy) has unaligned access   [ SOURCE.FPP(14,9) ]
      remark #15388: vectorization support: reference snt(ix,iy,1) has aligned access   [ SOURCE.FPP(14,9) ]
      remark #15388: vectorization support: reference snt(ix,iy,0) has aligned access   [ SOURCE.FPP(14,9) ]
      remark #15388: vectorization support: reference snt(ix,iy,2) has aligned access   [ SOURCE.FPP(15,9) ]
      remark #15389: vectorization support: reference hr(ix,iy) has unaligned access   [ SOURCE.FPP(18,9) ]
      remark #15388: vectorization support: reference p2(ix,iy) has aligned access   [ SOURCE.FPP(18,9) ]
      remark #15389: vectorization support: reference h(ix,iy) has unaligned access   [ SOURCE.FPP(18,9) ]
      remark #15381: vectorization support: unaligned access used inside loop body
      remark #15305: vectorization support: vector length 4
      remark #15399: vectorization support: unroll factor set to 3
      remark #15300: LOOP WAS VECTORIZED
      remark #15448: unmasked aligned unit stride loads: 4 
      remark #15450: unmasked unaligned unit stride loads: 1 
      remark #15451: unmasked unaligned unit stride stores: 2 
      remark #15475: --- begin vector cost summary ---
      remark #15476: scalar cost: 15 
      remark #15477: vector cost: 4.250 
      remark #15478: estimated potential speedup: 2.340 
      remark #15488: --- end vector cost summary ---
      remark #25456: Number of Array Refs Scalar Replaced In Loop: 3
      remark #25015: Estimate of max trip count of loop=1
   LOOP END

为什么 h(ix,iy) 和 hr(ix,iy) 没有对齐访问权限？如何对齐它们以实现更好的矢量化？

大概还有相关信息：

Intel(R) Fortran Intel(R) 64 Compiler for applications running on Intel(R) 64, Version 19.0.0.117 Build 20180804

Compiler options: -qopt-report=5 -c -DLINUX -O3 -w -assume nounderscore -xCORE-AVX2 -o SOURCE.o193

预先感谢您的时间和帮助！

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Arrays

Fortran

Alignment

vectorization

memoryalignment

为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？的相关文章

对象数组的数组（二维数组）JNI

我正在努力创建自定义对象类型 ShareStruct 的二维数组 jobjectArray ret jobjectArray ins jobjectArray outs jclass myClass env gt FindClass env
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
F# 中的数组初始化

如何根据给定的记录类型在 F 中创建和初始化数组假设我想创建一个包含 100 个 record1 记录的数组 e g type record1 value1 string value2 string let myArray Array i
如何在 Swift 中使用未知密钥解码 JSON 响应？

我想将数据拆分为https blockchain info ticker https blockchain info ticker这样每一行都是它自己的String在一个数组中我正在制作一个获取所选货币价格的应用程序因此如果有人想要澳
给定一个具有多个重复条目的数组，找到一个重复条目 O(N) 时间和常数空间

我们得到了一个大小为 N 的数组其中包含 0 到 N 2 范围内的整数包括 0 和 N 2 该数组可以有多个重复的条目我们需要在 O N 时间和常量空间中找到重复条目之一我正在考虑取数组中所有条目的乘积和总和以及 0 到 N 2
获取向量幂的有效方法

我编写了一个代码在数值上使用勒让德多项式直至某个高 n 阶例如 case 8 p 6435 x 8 12012 x 6 6930 x 4 1260 x 2 35 128 return case 9 如果向量x太长这会变得很慢我发现说之
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
将 MySQL 结果作为 PHP 数组

mysql 表 config name config value allow autologin 1 allow md5 0 当前的 php 代码 sth mysql query SELECT rows array while r mysq
泛型、数组和 ClassCastException

我想这里一定发生了一些我不知道的微妙事情考虑以下 public class Foo
如何在 Smarty 中打印 json

我从 api 获取 json 如何使用 Smarty 打印 json Json格式 first name jinu last name mk loginid email protected cdn cgi l email protectio
Java-如何将黑白图像加载到二进制中？

我在 FSE 模式下使用 Java 和 swing 我想将完全黑白图像加载为二进制格式最好是二维数组并将其用于基于掩码的每像素碰撞检测我什至不知道从哪里开始过去一个小时我一直在研究但没有找到任何相关的东西只需将其读入Buffer
将按钮文本放在一行上

我的按钮文本在 safari 中显示在一行上即使在初次单击后但是在 google chrome 上当您第一次到达该按钮时我的按钮将显示在一行上但是当您浏览更多帖子并再次遇到加载更多按钮时文本搞砸了这只发生在谷歌浏览器上
如何将一个变量的字符串分配给另一变量？

这是我在这个网站上的第一个问题如何将一个变量的字符串分配给另一变量我在这里做错了什么 include
如何释放字符指针数组？

我使用此方法将列表中的值转换为数组以便在 execvp 系统调用中使用 char list2argarray struct shellvalue values int count char array char malloc count
删除二维数组C++[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案这两种释放二维数组的方法是否相似 int M new int 5 for int i 0 i lt 5 i M i new int 3 fo
Numpy vectorize() 正在展平整个数组

我的输入是一个 numpy 元组数组 values np array 4 5 2 18 4 7 3 8 我的功能如下 def outerFunc values print values def innerFunc values print
合并 2 个数组并合并数字键的结果

我有 2 个数组我希望通过每个数字键将其中合并分组在一起例如 Array1 2009 gt 131 2008 gt 940 2007 gt 176 2006 gt 1 Array2 2008 gt 9 2007 gt 3 我希望输出是
Redim Preserve 给出“下标超出范围”

我想要Redim Preserve一个数组我不断收到错误下标超出范围我知道只有最后一个维度的大小可以更改这正是我正在做的事情这里出了什么问题数组的类型是Variant BmMatrix Sheets BENCH Range a60
JNI 将 Char* 2D 数组传递给 JAVA 代码

我想从 C 代码通过 JNI 层传递以下指针数组 char result MAXTEST MAXRESPONSE 12 12 8 3 29 70 5 2 42 42 在java代码中我写了以下声明 public static native
使用正则表达式搜索 Ruby 数组

你好我有一个小的 ruby 函数它可以分割出一个 Ruby 数组如下所示 def rearrange arr from to sidx arr index from eidx arr index to arr sidx arr sid

随机推荐

iOS：com.apple.root.default-overcommit-priority

我收到来自 Crashlytics 的崩溃消息 Crashed com apple root default overcommit priority EXC BAD ACCESS KERN INVALID ADDRESS at 0x8b2b
当我使用构建命令时，Docker compose 会忽略我的 Dockerfile

我有这个文件夹结构 home 我 composetest home me composetest mywildflyimage 在复合材料内部我有这个 docker compose yml web image test mywildfly
html 中 img 标签的 webp 后备

我知道解决方案是
使用python语言将像{1:23,2:45,3:17}这样的小字典插入Postgres中SQL数据库表的列中

我有一个表其中包含一个 varchar 类型列和 2 个 json 类型列我使用以下方法创建了该表 create table global records cattle id varchar 255 not null primary k
根据一个 SQL 表中的数据更新另一表中的数据

我正在运行 Microsoft SQL Server 2008 R2 并从两个表中提取信息来创建一个新表表 A 包含具有唯一导联编号和其他信息的导联表 B 包含具有唯一销售编号的销售额以及与其关联的销售线索编号两个表中的数据都被拉入
如何导入语义 ui 的小部分？

我想使用来自的特定模块semantic ui https semantic ui com modules sticky html https semantic ui com modules sticky html 假设我还主要使用其他框架
安装R包时出错

请帮助我我无法安装 MASS 包 gt library MASS Error in library MASS there is no package called MASS 我尝试从本地安装 MASS 包 gt utils menuIns
我如何在Prolog中实现“我是我自己的爷爷”？

以下故事摘自 N Wirth 的 1976 算法数据结构程序我娶了一个寡妇我们暂且称她为W吧谁有一个已经成年的女儿叫她 D 我的父亲 F 来拜访我们很多时候爱上了我的继女并娶了她因此我的父亲成了我的女婿我的继女成了
PHP 致命错误：找不到类“Memcached”

php v PHP 5 5 10 1 deb sury org precise 1 cli built Mar 27 2014 16 18 01 Copyright c 1997 2014 The PHP Group Zend Engine
HTML5 视频播放器阻止搜索

我正在创建一系列视频教程并希望防止用户向前查找和跳过部分我将使用将用于桌面和 iPad 浏览器的 HTML5 视频播放器理想情况下我希望它也能在 iPhone 上运行但我意识到你无法控制手机上的视频因为它使用 iPhone 视频
如何在训练期间切换 tf.train.Optimizers？

我想从Adam https www tensorflow org api docs python tf train AdamOptimizer to SGD https www tensorflow org api docs python
Qt 如何连接到 Android 操作系统中现有的 SQLite 文件？

我正在尝试连接到我的 qt 5 2 项目在 Android 操作系统中中的现有 SQLite 数据库文件我应该在哪里保存此文件以使用以下代码加载它 QSqlDatabase addDatabase myfile sqlite 首先您
c++ GetPrivateProfileString 从当前目录读取ini文件

我正在 C 上创建一个 dll 这是一个 Visual Studio 项目 dll从ini文件中读取一些数据我决定使用 GetPrivateProfileString 函数它几乎完全有效它在当前目录中看不到文件我如何提供这个参数称
为什么我的 WordPress 博客中的页面重定向到本地主机？

这是我的网站网址http www weblogicsol com http www weblogicsol com 这里我安装了一个WordPress 主题有网址http www weblogicsol com blog http www
selenium 2 无法连接到主机

我在 facebook php webdriver 上工作我在 Ubuntu 上工作 selenium 独立服务器与 webdriver 库位于同一目录中我使用本地 IP 地址 192 168 x x 连接到 linux 当我执行以下代
在 TypeScript 中使用类型元素剔除可观察数组

我目前正在考虑将我们的项目迁移到 TypeScript 我发现了this https github com borisyankov DefinitelyTyped一组很棒的定义文件我目前正在尝试使用该文件Knockout http kno
Angular订阅表单组中表单数组中的值变化

我是 angular8 我在表单组内有一个表单数组但我想检测某个输入的新更改 ngOnInit void this makeForm this fb group year Validators required amount Valida
使用 CSS 删除焦点选项卡的发光边框

我正在尝试删除蓝色发光边框当窗格聚焦于我的 javaFX 应用程序中选项卡窗格中的选项卡时会出现该边框关于如何在 css 中执行此操作有任何想法吗这是我当前的CSS tab fx background radius 0 fx bac
为什么只有ListView.builder()中的内容不滚动？

我有一个带有文本小部件和 ListView 的屏幕当我尝试在 ListView 内滚动时它不允许我滚动我的主体是 SingleChildScrollView 但不为 ListView builder 提供滚动视图我尝试将 ListV
为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？

我正在尝试通过矢量化 for 循环来改进 Fortran 77 代码我对矢量化相当陌生虽然我可以获得矢量化代码但优化报告告诉我我的一些数组具有未对齐的访问权限据我了解这使得矢量化效率较低我已手动向数组添加填充以便对齐数据这

为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？

为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？ 的相关文章

随机推荐

热门标签

为什么在 Fortran 中某些数组没有正确对齐以进行矢量化？的相关文章