如何判断内存是否对齐？

2023-12-28

我是使用 SSE/SSE2 指令优化代码的新手，到目前为止我还没有走得太远。据我所知，常见的 SSE 优化函数如下所示：

void sse_func(const float* const ptr, int len){
    if( ptr is aligned )
    {
        for( ... ){
            // unroll loop by 4 or 2 elements
        }
        for( ....){
            // handle the rest
            // (non-optimized code)
        }
    } else {
        for( ....){
            // regular C code to handle non-aligned memory
        }
    }
}

但是，如何正确判断内存是否ptr指向的位置通过例如对齐16字节？我认为我必须包含非对齐内存的常规 C 代码路径，因为我无法确保传递给此函数的每个内存都会对齐。使用内在函数将数据从未对齐的内存加载到 SSE 寄存器似乎非常慢（甚至比常规 C 代码慢）。

先感谢您...

#define is_aligned(POINTER, BYTE_COUNT) \
    (((uintptr_t)(const void *)(POINTER)) % (BYTE_COUNT) == 0)

演员阵容void *（或同等学历，char *）是必要的，因为该标准仅保证可逆转换为uintptr_t for void *.

如果您想要类型安全，请考虑使用内联函数：

static inline _Bool is_aligned(const void *restrict pointer, size_t byte_count)
{ return (uintptr_t)pointer % byte_count == 0; }

并希望编译器优化如果byte_count是一个编译时常数。

为什么我们需要转换为 void * ?

C 语言允许不同的指针类型有不同的表示，例如你可以有一个 64 位的void *类型（整个地址空间）和 32 位foo *类型（一段）。

转换foo * -> void *可能涉及实际计算，例如添加偏移量。该标准还将（任意）指针转换为整数时发生的情况留给实现，但我怀疑它通常被实现为 noop。

对于这样的实现，foo * -> uintptr_t -> foo *会起作用，但是foo * -> uintptr_t -> void * and void * -> uintptr_t -> foo *不会。对齐计算也不会可靠地工作，因为您只检查相对于段偏移的对齐，这可能是也可能不是您想要的。

结论：始终使用void *获得与实现无关的行为。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何判断内存是否对齐？的相关文章

为什么在 lambda 内部引发异常是 C# 7 的一项功能？ [复制]

这个问题在这里已经有答案了该语句在 VS2015 中无法编译但在 VS2017 中可以编译 var example new Action gt throw new Exception 为了支持在 lambda 表达式内抛出异常必须对
是否保证 sizeof(T[N]) == N * sizeof(T) ？

我一直假设 N 个元素类型的数组的大小T 由返回sizeof保证正好是N次sizeof T The 对这个问题的评论 https stackoverflow com questions 46457449 is it always the c
C - 计算文件中的单词、字符和行数。字符数

我必须用 C 编写一段代码输出给定文件中的字符数行数和单词数任务看起来很简单但我现在真的不确定出了什么问题所以这是代码 include
表达式访问者仅为某些 lambda 表达式调用 VisitParameter

我希望能够使用嵌套扩展方法将 EF 中的实体投影到相应的视图模型参见我之前的问题使用扩展方法在 EF 中投影单个实体 https stackoverflow com questions 39585427 projection of sin
OpenCV SVM 给出奇怪的预测结果

我对 OpenCV 和支持向量机都很陌生我想使用 SVM 训练具有两个标签的数据集然后预测给定集合的标签我当前的集合包含大约 600 行具有相等的类分布 1 为 300 行 1 为 300 行包含 34 列这是我当前用于设置 O
如何用另一个静态变量初始化一个静态变量？

静态1 hpp include
更改图像颜色与透明背景

我需要使用 c System Drawings 将透明背景上带有绿色圆圈的图像加载到位图图像中这是最简单的部分但是我需要在将其添加到更大的图像之前更改圆圈的颜色而不影响周围的透明度就我而言我需要将圆圈颜色更改为黄色并将其添加为太
错误：“运行所选代码生成器时出错：包恢复失败”

我正在尝试将控制器添加到 ASP NET Core 项目中的解决方案中当我尝试这样做时我收到此错误我收到相同的消息为控制器添加最小依赖项和完整依赖项我也有这个问题使用实体框架添加控制器 gt 带有操作的 API 控制器将给出
Monitor.Pulse & Wait - 意外行为

http www codeproject com Articles 28785 Thread synchronization Wait and Pulse demystified http www codeproject com Artic
提取单花括号内的值

我想要一个收藏 value 一个字符串使用正则表达式例如 lorem ipsum field1 lorem ipsum field2 lorem ipsum field1 lorem ipsum field2 field3 我会得到 fi
C 中的 '\0' 和 printf()

在 C 入门课程中我了解到在存储字符串时存储空字符 0在它的最后但是如果我想打印一个字符串怎么办 printf hello 虽然我发现它并没有结束 0通过以下声明 printf d printf hello Output 5 但这似乎不
微软怎么能说WinAPI中一个字的大小是16位呢？

我刚刚开始学习WinAPI 在MSDN中对WORD数据类型提供了以下解释 WORD16 位无符号整数范围是十进制 0 到 65535 该类型在 WinDef h 中声明如下 typedef 无符号短 WORD 很简单而且它与我一直在使
用 OpenCL C 编写快速线性系统求解器

我正在编写一个 OpenCL 内核它将涉及求解线性系统目前我的内核太慢了提高线性系统部分的性能似乎是一个不错的起点我还应该注意我并没有尝试使我的线性求解器并行我正在研究的问题在宏观层面上已经是令人尴尬的并行以下是我编写的 C
将 std::pair const 转换为 std::pair const 安全吗？

理论上或实践上安全吗reinterpret cast a std pair
Web浏览器控件：如何捕获文档事件？

我正在使用 WPF 的 WebBrowser 控件加载一个简单的网页在这个页面上我有一个锚点或一个按钮我想在我的应用程序后面的代码中即在 C 中捕获该按钮的单击事件 WebBrowser 控件是否有办法捕获加载页面元素上的单击事件
将旧的 Unity 代码升级到 Unity 5

在触发按钮上播放动画的代码似乎不起作用我在 Youtube 上看到了一个视频内容很简单animation Play 它可以在该视频上运行但我无法让它在我的计算机上运行我做错了什么还是团结改变了它请帮助我在网上找不到解决方案所有
“DeploymentItem”属性是什么意思？

假设我们有一个简短的程序 namespace ConsoleTryIt static class Program static void Main string args var sum Add 1 2 private static int
NSubstitute - 测试特定的 linq 表达式

我在当前正在开发的 MVC 3 应用程序中使用存储库模式我的存储库界面如下所示 public interface IRepository
Selenium - 模式对话框存在 - 如何接受信息？

我有以下问题在页面上提交一些日期后我有一个如图所示的模式对话框我想单击 ENTER 来浏览该模式但它不起作用我有以下代码 driver FindElement By CssSelector input submit Click A
从其对象获取结构体字段的名称和类型

例如我有一个类似这样的结构 struct Test int i float f char ch 10 我有一个该结构的对象例如 Test obj 现在我想以编程方式获取字段名称和类型obj 是否可以顺便说一句这是 C 你正在要求C

随机推荐

将键/值字符串转换为关联数组[重复]

这个问题在这里已经有答案了例如我的字符串可能如下所示 first name Tom last name Jones email email protected cdn cgi l email protection 我希望我的数组如下所示
我可以将 Windows 应用商店应用程序嵌入到经典 Windows 应用程序中吗？

我想将通用 Windows 应用程序嵌入到 Windows 10 上的经典 Windows 应用程序中这可能吗最简洁的答案是不但是根据您想要做什么以下信息可能会对您有所帮助如果您只想获得桌面应用程序的外观和感觉则应该注意 Wi
“空”发布什么时候准备好？

服务器上有以下代码 Meteor publish null function Return some cursors 根据文档将产生以下效果记录集会自动发送到所有连接的客户端客户端如何判断该功能发布的文档是否全部收到如果我使用订阅它
如何防止 SSIS 上的 CAST 错误？

问题是否可以要求SSIS投射一个值 and 返回空值如果不允许演员阵容而不是抛出错误我的环境我在 Windows Server 2003 上使用 Visual Studio 2005 和 Sql Server 2005 一般背景以防
Scala 字符串变量替换

我有用 scala 编写的 Spark 代码 Spark 读取存储要执行的 SQL 的元表已在 Spark 中作为临时表我面临的问题是我们有使用变量的查询在 scala 代码中定义我尝试了不同的方法但无法用值替换变量 var be
超出存储分配。服务器响应为： 4.3.1 消息大小超过固定最大消息大小

我正在使用 SMTPclient 发送带有附件的邮件当附件超过2mb时我收到以下错误超出存储分配服务器响应为 4 3 1 消息大小超出固定最大消息大小 1 我可以使用 smtpclient 发送附件大小 gt 2mb 的电子邮件吗
如何在 Graphics 方法 drawImage() 中使用 ImageObserver

我尝试使用的方法是 drawImage 图像 int int int int ImageObserver 方法这样我就可以缩放我的图像在我见过的所有示例中 ImageObserver 应该是这样但这似乎不起作用即我见过的唯一方法是
从 C 文件中读取字符串并将其作为 lc3 反汇编程序进行操作时遇到问题

我想制作一个程序来扫描包含以下内容的文件 1283 5105 lc3 中两条指令的十六进制代码添加 r1 r2 r3 和 r0 r4 r5 我希望我的程序读取这个文件并在屏幕上打印两个相应的指令有人可以告诉我它出了什么问题吗 includ
Blazor 服务器 - 电路无法初始化

我已将 VS2019 Blazor 模板创建的 BlazorApp1 应用程序发布到生产服务器由于它是一个子站点我做了3处更改 in Host cshtml将基本标签替换为 in Startup cs added app UsePath
需要帮助将 (CFPropertyListRef *)nsdictionary 转换为 swift

我需要一些帮助来转换这个 MIDIDeviceRef midiDevice MIDIGetDevice i NSDictionary midiProperties MIDIObjectGetProperties midiDevice CFP
将 JSON 转换为 QGIS GeoJSON：同时具有多种功能和不同类型

目前我有一个程序从特定的 API 请求 JSONS API 的创建者声称该数据是 GeoJSON 格式但 QGIS 无法读取它因此我想扩展我的 Python 脚本以可读格式将 JSON 转换为 GEOJSON 以便进入 QGIS 并
如何在运行“cover -test”时收集子进程的覆盖率，而不是其他情况？（开发::封面）

我想我已经看到了这个问题的答案但我找不到了我遇到的最接近的是这个问题 https stackoverflow com q 24420346 2877364 我正在黑客攻击prt https metacpan org pod distri
如何设置理想的协作存储库设置？

我目前正在使用 subversion 和tourtiseSVN 我正在寻求改进我的网络开发团队的工作方式我们致力于内部网站的内部开发我们不外包我们希望增加从事特定产品单独开发的团队成员数量目前我们的设置仅允许 1 名成员同时从事一
Google 对话框流 PERMISSION_DENIED 异常

我正在尝试从 Windows Java 应用程序访问 Google DialogFlow 我有环境变量 GOOGLE APPLICATION CREDENTIALS 正确设置后我可以调用其他 Google API 但是当我打电话时 Det
Windows 上有类似 autotest-fsevent 的实现吗？

基本上它是自动测试的扩展它侦听来自操作系统的通知并允许自动测试在仅测试必要的更改时不永久扫描文件更改它节省了 CPU 和磁盘的使用 Windows 提供了一个名为 FindFirstChangeNotification 的文件更改通
导航控制器上的后退按钮位置

我目前正在尝试为 iOS 应用程序开发自定义搜索我已经设法让搜索控制器出现并且搜索栏正确显示尽管我唯一的问题是我需要后退按钮出现在导航栏的右侧而不是左侧请参见下文正如你所看到的后退按钮位于左侧但我需要它位于右侧 https i
使用 ssl 和客户端证书上传大文件 (uploadReadAheadSize) 但不希望预读所有数据

我尝试搜索互联网堆栈溢出但找不到任何适合我的相关答案我有一个 asp net web api2 应用程序仅使用 ssl 我试图允许大文件上传最多 36mb 但除非我将 uploadReadAheadSize 更改为预读此大小否则
Pandas：用第二列中出现次数之间的 obs 计数填充一列

假设我有以下 DataFrame 其中有一个 0 1 条目具体取决于某个月份内是否发生未发生某事 Y 0 0 1 1 0 0 0 0 1 1 1 X pd date range start 2010 freq MS periods le
为什么 ErrorCollector 在声明时要求赋值？

检查许多 XML 字符串时我经常使用 ErrorCollector 构造但我仍然不明白它是如何工作的当我声明 ErrorCollector 时我必须立即分配它 Rule public ErrorCollector collector
如何判断内存是否对齐？

我是使用 SSE SSE2 指令优化代码的新手到目前为止我还没有走得太远据我所知常见的 SSE 优化函数如下所示 void sse func const float const ptr int len if ptr is aligne

如何判断内存是否对齐？

如何判断内存是否对齐？ 的相关文章

随机推荐

热门标签

如何判断内存是否对齐？的相关文章