未对齐的内存访问

2024-06-22

我正在开发不支持未对齐内存访问的嵌入式设备。

对于视频解码器，我必须处理 8x8 像素块中的像素（每个像素一个字节）。该设备具有一些 SIMD 处理功能，使我能够并行处理 4 个字节。

问题是，8x8 像素块不能保证从对齐的地址开始，并且函数需要读/写最多三个 8x8 块。

如果您想要非常好的性能，您会如何处理这个问题？经过一番思考，我得出了以下三个想法：

所有内存访问均以字节形式进行。这是最简单的方法，但速度很慢，而且不能很好地使用 SIMD 功能（这就是我目前在参考 C 代码中所做的）。
编写四个复制函数（每个对齐情况一个），通过两次 32 位读取加载像素数据，将这些位移动到正确的位置，并将数据写入临时内存的某个对齐块。然后视频处理功能可以使用 32 位访问和 SIMD。缺点：CPU 没有机会隐藏处理背后的内存延迟。
与上面的想法相同，但不是将像素写入临时内存，而是进行视频处理。这可能是最快的方法，但我必须为此方法编写的函数数量很多（我猜大约 60 个）。

顺便说一句：我必须用汇编程序编写所有函数，因为编译器在涉及 SIMD 扩展时会生成可怕的代码。

您会走哪条路，或者您有其他想法如何解决这个问题？

您可以使用memcpy（如果我记得的话，如果可能的话，可以优化以执行字复制）复制到对齐的数据结构（例如，在堆栈上分配的东西或从malloc）。然后对对齐的数据结构执行处理。

不过，最有可能的是，您希望处理处理器寄存器中的内容，而不是内存中的内容。您如何处理任务取决于硬件的功能（例如，一个 32 位寄存器可以拆分为四个 8 位寄存器吗？SIMD 操作在哪些寄存器上运行？）如果您采用简单的路线，您可以调用一个小的加载器函数来为您执行未对齐的读取。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

video

Assembly

Embedded

Alignment

Decoding

未对齐的内存访问的相关文章

如何在视频在后台播放时在android中加载活动布局

当视频在 Android 模拟器后台播放时如何在 Android 中加载活动布局您可以在此处观看视频演示示例视频 http youtu be XTE6Yln4yAQ 到目前为止我只对布局进行了动画处理但我无法像视频中的那样进行操作
了解近调用指令编码

通过反汇编一些二进制代码我发现了近调用指令call 0x8ae编码为e8 97 08 00 00 查看指令集参考我发现这些指令被编码为 call XX XX XX XX lt gt e8 XX XX XX XX being XX XX
在 Flash 中动态更改视频播放速率

我正在寻找一种方法让 Flash 视频能够平滑地改变速度从比原始帧速率慢到快它只需要在Windows PC上运行并且可以使用最新版本的Flash 10 2 with Stage Video Flash Media Server 提供
Python 视频框架

我正在寻找一个 Python 框架它将使我能够播放视频并在该视频上绘图用于标记目的我尝试过 Pyglet 但这似乎效果不是特别好在现有视频上绘图时会出现闪烁即使使用双缓冲和所有这些好东西而且似乎没有办法在每帧回调期间获取视频中
如何在 directshow 中使用 x264 编码器

我不知道如何使用x264与直接表演我安装了很多认为假装有的东西x264编码器没有用我下载了videoLAN x264二进制文件当我运行它时它显示控制台窗口的速度非常快之后什么也没有发生这些是我拥有的编码器我正在 Windows
原始 SQL 是用汇编语言还是 C 语言编写的？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何检查用户在 html5 视频播放器中观看了完整视频

有谁知道如何检查视频是否已完全观看我正在使用 html5 视频播放器
Linux 在崩溃时自动重新启动应用程序 - 守护进程

我有一个运行嵌入式 Linux 的系统它的持续运行至关重要基本上它是一个与传感器通信并将数据中继到数据库和 Web 客户端的过程如果发生崩溃如何自动重启应用程序此外还有多个线程进行轮询例如套接字和 uart 通信如何确保没
JE/JNE 和 JZ/JNZ 之间的区别

在 x86 汇编代码中有JE and JNE完全一样JZ and JNZ JE and JZ只是完全相同的事物的不同名称条件跳转时ZF 零标志等于 1 相似地 JNE and JNZ只是条件跳转的不同名称什么时候ZF等于 0 Yo
深入了解事物如何打印到屏幕上（cout、printf）以及我在教科书上似乎找不到的真正复杂内容的起源

我一直想知道这个问题但至今还没有找到答案每当我们使用 cout 或 printf 时它们到底是如何打印在屏幕上的文本是如何显示出来的这里可能是一个相当模糊的问题无论你给我什么我都会工作那么基本上这些功能是如何制作的是汇编吗
Excel 单元格对齐：例如数值xlLeft、xlRight 还是 xlCenter？

我一直在尝试对齐 Excel 单元格文本值我尝试过更常见的xlLeft xlRight但这似乎不起作用错误是xlLeft没有宣布我正在使用 Visual Studios 并使用 VB 创建一个 aspx 页面这是我的代码示例 Dim
如何在 gdb 中给定地址处的汇编指令上中断？

0x0000000000400448
您可以播放 iPod 库中的视频吗？

iOS4 中是否可以播放 iPod 库中的视频或者仍然仅限于音频我找不到任何明确的答案但 SDK 似乎不允许视频不你不能那样做检查 iPod Library Access 编程指南它说 iPod 库访问仅适用于基于音频的媒体项
如何在 Linux 64 位上用 C 编写简单的内联 asm 指令？

我正在编写一个简单的 C 程序我的要求是从程序的某些函数中打印 RIP 指令指针我不想使用 ptrace 我用内联汇编尝试的一件事是 asm movl rip 0 r val 这应该将我的 rip 寄存器值复制到变量 val 但我收到编
java - 如何使列表彼此并排（水平）而不是向下（垂直）。

如何使列表彼此并排水平而不是向下垂直 Example 一月这是我不断得到的 SMTWTFS 1 2 3 4 5 一月这是我想要得到的 SMTWTFS 1 2 3 4 5 6 7 8 9 谢谢任何帮助我将不胜感激我是新手我无法
了解使用内存源操作数和 x87 fcomi / fcmov 的 GCC 内联汇编代码

我正在阅读研究论文Privado 实用且安全的 DNN 推理用于隐藏依赖于输入的分支 https arxiv org pdf 1810 00602 pdf 我试图理解该论文中的以下 GCC 汇编代码 float temp asm vola
使用javascript检测MP4视频是否有音轨

我正在网页上为 MP4 视频创建自定义控制器控制器包括音量滑块一些要播放的视频没有音轨最好禁用这些视频的音量滑块这样用户在更改音量滑块的位置没有效果时就不会感到困惑是否有检查 MP4 文件是否有音轨的属性或技巧 jQuery 是一
Safari 无法从缓存中检索 mp4 视频，并且有时在下载相同资源时超时

我正在运行一个显示全屏视频故事的 VueJS 应用程序我不会在故事中创建与媒体数量一样多的标签我只是在每次播放新视频时更改组件视频源但看起来 Safari 桌面版和移动版在加载后仍然不会缓存 HTML 视频当我再次播放以前的媒体时
为什么在Java中读取易失性和写入字段成员是不可扩展的？

观察以下用 Java 编写的程序完整的可运行版本如下但程序的重要部分在下面的代码片段中 import java util ArrayList A not easy to explain benchmark class MultiVola
为什么 mp4 视频在 iPad 上可以正常播放，而在 iPhone 上却不行？

我对这个问题很困惑我有一个大型 H 264 mp4 视频文件库需要在 iOS 上播放最初我只针对 iPad 但要求发生了变化现在我需要包括 iPhone 但我注意到我的 iPod Touch 与我的 iPad 具有完全相同的操作

随机推荐

MongoDB 的优点和缺点？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Gradle 升级到 Android Studio 3.0 Beta 1 时出错

注意这似乎是 Android 插件的问题请参阅相关问题的评论构建项目时出现以下 gradle 错误 Gradle sync failed Cause java lang NullPointerException at sun nio
如何在 Win32 中的两个子进程之间设置管道？

对于我的一生我无法弄清楚为什么这不起作用基本上我创建了继承位设置为 true 的管道并创建了两个子进程并使用 STARTUPINFO 结构根据需要设置输入和输出句柄但管道似乎已损坏第二个进程没有向其中写入任何输出控制台即使
WPF 和 Silverlight 应用程序有什么区别？

WPF 和 Silverlight 应用程序有什么区别它们是一样的吗 WPF 基于桌面 CLR 即fullCLR 的版本 Silverlight 基于更小更紧凑的 CLR 它提供了出色的体验但不具备 CLR 的全部功能它还有一个小得
在 href <%= xx %> 中使用带有 runat=server 的服务器变量

当我在 aspx 页面上使用锚标记时如下所示 a href test a 它将获得正确分配给 id 的变量值但不会正确路由页面因为如果 a 标签上没有 runat server 属性则不会评估但是一旦我添加了 runat 服务器属
无法连接到 mongodb 错误：无法连接到服务器 127.0.0.1:27017 at src/mongo/shell/mongo.js:L112

当我尝试连接到 mongo db 时我总是收到如下错误 MongoDB shell 版本 2 4 3 连接到测试 4 月 26 日星期五 14 31 46 941 JavaScript 执行失败错误无法连接到服务器 127 0 0
写入大量txt文件（90个），每个文件5MB，最多需要1400s

我是一名电气工程专业的学生作为一项作业我需要实现医学成像中使用的反投影算法来形成图像为了计算最终图像需要计算大量信息并将其保存在向量中在最终图像的某个所需分辨率 256 256 像素下程序因 RAM 耗尽而崩溃因此我决定将此
ASP.net MVC 中的 ASP.net AJAX 有什么意义？

因此 ASP net MVC 默认情况下附带 JQuery 和 ASP net Ajax 虽然 JQuery 的用例很明显而且很多但我只是想知道 ASP net Ajax 的意义是什么如果我只是让我的控制器操作返回 JSON 我不需要它
“git”无法可见，因为它的所有子项都位于不可用的操作集中

我有这个问题我不知道如何获取工具栏上的 Git 部分下图显示了具体的错误感谢您的所有回答在操作集可用性中勾选 Git 和 Git 导航操作然后在工具栏可见性中勾选 Git
C++：使用声明和重载范例

我在看这一页 https www cppstories com 2018 09 visit variants 关于 C 17 的新功能特别是我理解几乎所有以下代码 include
Android 完成活动不起作用

一旦用户从我的 ListView 中选择了产品它就会将该 ListView 中选定的文本放入 EditText 中我遇到的问题是当用户从列表中选择一个产品然后按返回时它会再次显示该列表而不是返回到 EditText 活动我尝试
为什么 Android Studio 无法识别 .jar 库导入？

我正在尝试在我的 Android Studio 项目中使用一些 jar 文件作为库我一直在寻找如何做到这一点常规方法是将 jar 文件复制到 libs 文件夹中然后将其添加为库我知道 libs 文件夹必须位于项目视图中的 app
切换到heroku cedar-14导致内存消耗持续增加

Heroku 最近宣布今年 11 月之后将不再支持 cedar 10 切换到 cedar 14 导致内存消耗增加直到我遇到 R14 内存配额超出错误并不得不重新启动 heroku 在我开始使用 unicorn worker killer
使用 Javascript 将变量传递给弹出窗口

我需要将一些文本从当前页面传递到弹出窗口而不需要服务器点击该信息此处用 90 表示已在父表单中可用它就像存储在隐藏变量中的一段长文本我只需要将其显示为弹出窗口这是我尝试过的这在某种程度上有效但如果我传递文本而不是数字则不
Java 错误“未使用局部变量的值”

我对java真的很陌生 2天前开始学习抱歉如果这是一个愚蠢的问题我正在尝试学习如何使用 rt exec 和类似的方法因此我尝试制作一个运行 calc exe 的非常简单的程序这是代码 public class main try R
如何重新启动模拟器进入恢复模式

有什么办法可以将模拟器重新启动到恢复模式吗 Android模拟器不支持恢复模式只支持正常启动模式 Android 模拟器接受 Android 映像包括内核和 ramdisk 映像作为其命令行界面上的独立映像它们不会被编译为一个大映像
Spring Boot 安全性和设置 security.basic.path

我正在尝试使用 Spring Boot 它是自动配置 Spring Security 的自动配置未来我按照教程操作http spring io guides gs secure web http spring io guides gs s
如何将多个复选框值插入到表中？

我似乎无法找到或弄清楚将多个复选框值从表单插入到表中的工作解决方案我的结束是将仅一个复选框值的值插入到表中请指出我如何插入多个复选框值而不仅仅是一个在下面找到我到目前为止所拥有的 My form
如何突出显示页面上与单词数组匹配的所有单词？

我想找到我的网页上与 Javascript 数组中的任何单词匹配的所有单词并突出显示它们将它们包装在特殊的 span 标签中做到这一点最简单的方法是什么我用jquery 不完美但简单并且可能有效 var regex Hello G
未对齐的内存访问

我正在开发不支持未对齐内存访问的嵌入式设备对于视频解码器我必须处理 8x8 像素块中的像素每个像素一个字节该设备具有一些 SIMD 处理功能使我能够并行处理 4 个字节问题是 8x8 像素块不能保证从对齐的地址开始并且函数需要

未对齐的内存访问

未对齐的内存访问 的相关文章

随机推荐

热门标签

未对齐的内存访问的相关文章