在C中使用memset()有什么好处

2023-11-24

我很好奇在类似于下面的情况下使用 memset() 在效率方面是否有任何优势。

鉴于以下缓冲区声明...

struct More_Buffer_Info
{
    unsigned char a[10];
    unsigned char b[10];
    unsigned char c[10];
};

struct My_Buffer_Type
{
    struct More_Buffer_Info buffer_info[100];
};

struct My_Buffer_Type my_buffer[5];

unsigned char *p;
p = (unsigned char *)my_buffer;

除了代码行数较少之外，使用它还有一个优点：

memset((void *)p, 0, sizeof(my_buffer));

对此：

for (i = 0; i < sizeof(my_buffer); i++)
{
    *p++ = 0;
}

这适用于两者memset() and memcpy():

更少的代码：正如您已经提到的，它更短，代码行更少。
更具可读性：较短通常也使其更具可读性。 (memset()比那个循环更具可读性）
它可以更快：有时它可以允许更积极的编译器优化。（所以可能会更快）
错位：在某些情况下，当您在不支持未对齐访问的处理器上处理未对齐的数据时，memset() and memcpy()可能是唯一干净的解决方案。

对第3点进行扩展，memset()编译器可以使用 SIMD 等进行大量优化。如果您编写一个循环，则编译器首先需要“弄清楚”它的作用，然后才能尝试优化它。

这里的基本思想是memset()和类似的库函数，在某种意义上，“告诉”编译器你的意图。

正如 @Oli 在评论中提到的，有一些缺点。我将在这里扩展它们：

你需要确保memset()实际上做你想做的事。该标准并未规定各种数据类型的零在内存中必然为零。
对于非零数据，memset()仅限于 1 字节内容。所以你不能使用memset()如果你想设置一个数组ints 为零以外的值（或0x01010101或者其他的东西...）。
尽管很少见，但在某些极端情况下，实际上可以使用自己的循环在性能上击败编译器。*

*我将根据我的经验举一个例子：

虽然memset() and memcpy()通常是经过编译器特殊处理的编译器内在函数，它们仍然是generic功能。他们没有提及数据类型，包括数据的对齐方式。

因此，在少数（尽管罕见）情况下，编译器无法确定内存区域的对齐方式，因此必须生成额外的代码来处理未对齐情况。然而，如果您是程序员，100% 确定对齐，那么使用循环实际上可能会更快。

一个常见的例子是使用 SSE/AVX 内在函数。（例如复制一个 16/32 字节对齐的数组floats) 如果编译器无法确定 16/32 字节对齐，则需要使用未对齐的加载/存储和/或处理代码。如果您只是使用 SSE/AVX 对齐的加载/存储内在函数编写一个循环，您可以probably做得更好。

float *ptrA = ...  //  some unknown source, guaranteed to be 32-byte aligned
float *ptrB = ...  //  some unknown source, guaranteed to be 32-byte aligned
int length = ...   //  some unknown source, guaranteed to be multiple of 8

//  memcopy() - Compiler can't read comments. It doesn't know the data is 32-byte
//  aligned. So it may generate unnecessary misalignment handling code.
memcpy(ptrA, ptrB, length * sizeof(float));

//  This loop could potentially be faster because it "uses" the fact that
//  the pointers are aligned. The compiler can also further optimize this.
for (int c = 0; c < length; c += 8){
    _mm256_store_ps(ptrA + c, _mm256_load_ps(ptrB + c));
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Embedded

memset

在C中使用memset()有什么好处的相关文章

C++ 中的软（不是：弱）引用 - 这可能吗？有实施吗？

在 C 中我正在使用boost shared ptr and boost weak ptr自动删除不再需要的对象我知道这些与引用计数一起工作在 Java 中内存由垃圾收集器管理它将内置对象引用视为strong WeakReferen
MEX 文件中的断言导致 Matlab 崩溃

我正在使用mxAssert 宏定义为matrix h在我的 C 代码中 mex 可以完美编译当我调用的 mex 代码中违反断言时该断言不会导致我的程序崩溃而是导致 Matlab 本身崩溃我错过了什么吗这是有意的行为吗当我查看 M
添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
为什么基类必须有一个带有 0 个参数的构造函数？

这不会编译 namespace Constructor0Args class Base public Base int x class Derived Base class Program static void Main string a
在 C++11 中省略返回类型

我最近发现自己在 C 11 模式下的 gcc 4 5 中使用了以下宏 define RETURN x gt decltype x return x 并编写这样的函数 template
ASP .NET MVC，创建类似路由配置的永久链接

我需要帮助在 MVC 网站中创建类似 URL 路由的永久链接 Slug 已设置为 www xyz com profile slug 代码为 routes MapRoute name Profile url profile slug defa
TextBox 焦点的 WinForms 事件？

我想添加一个偶数TextBox当它有焦点时我知道我可以用一个简单的方法来做到这一点textbox1 Focus并检查布尔值但我不想那样做我想这样做 this tGID Focus new System EventHandler thi
获取从属性构造函数内部应用到哪个属性的成员？

我有一个自定义属性在自定义属性的构造函数内我想将属性的属性值设置为属性所应用到的属性的类型是否有某种方式可以访问该属性所应用到的成员从我的属性类内部可以从 NET 4 5 using CallerMemberName Somethi
VS30063：您无权访问 https://dev.azure.com

我正在尝试在 asp net core 2 1 mvc 应用程序中使用以下代码连接 Azure DevOps Uri orgUrl new Uri https dev azure com xxxxx String personalAcces
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
为什么 std::allocator 在 C++17 中丢失成员类型/函数？

一边看着std 分配器 http en cppreference com w cpp memory allocator 我看到成员 value type pointer const pointer reference const refer
两组点之间的最佳匹配

I ve got two lists of points let s call them L1 P1 x1 y1 Pn xn yn and L2 P 1 x 1 y 1 P n x n y n 我的任务是找到它们点之间的最佳匹配以最小化它
通过不同 DLL 或 EXE 中的指针或引用访问 STL 对象时发生访问冲突

我在使用旧版 VC6 时遇到以下问题我只是无法切换到现代编译器因为我正在处理遗留代码库 http support microsoft com kb 172396 http support microsoft com kb 172396
C# 创建数组的数组

我正在尝试创建一个将使用重复数据的数组数组如下所示 int list1 new int 4 1 2 3 4 int list2 new int 4 5 6 7 8 int list3 new int 4 1 3 2 1 int list4
UWP 无法在两个应用程序之间创建本地主机连接

我正在尝试在两个 UWP 应用程序之间设置 TCP 连接当服务器和客户端在同一个应用程序中运行时它可以正常工作但是当我将服务器部分移动到一个应用程序并将客户端部分移动到另一个应用程序时 ConnectAsync 会引发异常服务器未
32位PPC rlwinm指令

我在理解上有点困难rlwinmPPC 汇编指令旋转左字立即然后与掩码我正在尝试反转函数的这一部分 rlwinm r3 r3 0 28 28 我已经知道什么了r3 is r3在本例中是一个 4 字节整数但我不确定这条指令到底是什么rlw
Fluent NHibernate 日期时间 UTC

我想创建一个流畅的 nhibernate 映射来通过以下方式映射 DateTime 字段保存时保存 UTC 值读取时调整为本地时区值实现此映射的最佳方法是什么就我个人而言我会将日期存储在 UTC 格式的对象中然后在读写时在
为什么 Ajax.BeginForm 在 Chrome 中不起作用？

我正在使用 c NET MVC2 并尝试创建一个 ajax 表单来调用删除数据库记录 RemoveRelation 的方法删除记录的过程正在按预期进行删除记录后表单应调用一个 JavaScript 函数从视觉效果中删除该记录 Rem
如何使用 std::array 模拟 C 数组初始化“int arr[] = { e1, e2, e3, ... }”行为？

注意这个问题是关于不必指定元素数量并且仍然允许直接初始化嵌套类型这个问题 https stackoverflow com questions 6111565 now that we have stdarray what uses are
如何创建向后兼容 Windows 7 的缩放和尺寸更改每显示器 DPI 感知应用程序？

我是 WPF 和 DPI 感知 API 的新手正在编写一个在 Windows 7 8 1 和 10 中运行的应用程序我使用具有不同每个显示器 DPI 设置的多个显示器并且有兴趣将我的应用程序制作为跨桌面配置尽可能兼容我已经知道可以将

随机推荐

Chrome：播放通过 fetch/XHR 下载的视频

我想要实现的是让 Chrome 将视频文件作为数据加载通过 Fetch API XHR 等并使用
Sigaction 并将 Linux 代码移植到 Windows

我正在尝试移植caffe 针对Linux开发源代码到Windows环境问题在于sigaction结构在signal handler cpp and signal handler h 源代码如下所示我的疑问是可以替换哪个库或代码来实现此
JSON 解析错误：未终止的字符串

在 JSON 解析函数中转义引号时我遇到了一个常见问题如果存在转义引号在本例中为 test 则会导致以下错误 SyntaxError JSON 解析错误未终止的字符串 var information JSON parse 1 24
仅回形针处理图像

我想对多种格式使用单个文件字段据我了解 Paperclip 足够智能只能缩放图像并保留其他格式但这似乎不适用于 flv 它返回 imagemagick identify errors 有没有什么方法可以帮助 Paperclip 并明确
Youtube 获取上传的视频列表。文件未找到错误

我正在尝试使用以下方法获取在我的 YouTube 频道上上传的视频列表 MY CHANNEL ID maxResults 50 key MY APP ID 我已经在 Google App Console 中创建了应用程序并为其生成了 APP
使用 pytest 进行测试时，如何使用 >= 2 的工作人员干净地终止 Uvicorn + FastAPI 应用程序

我有一个用 Uvicorn FastAPI 编写的应用程序我正在使用 PyTest 测试响应时间参考使用 PyTest 进行测试时如何在后台启动 Uvicorn FastAPI 我写了测试然而当工人 gt 2时我在完成测试后发现应
neo4j cypher - 如何查找与节点列表有关系的所有节点

我有名为选项的节点用户选择这些选项我需要一个像这样工作的 chpher 查询检索选择了列表中给出的所有选项的用户 MATCH option Option lt CHOSE user User WHERE option Key I
YouTube 意图，错误 400

我发现我可以通过以下方式在 Stock YouTube 播放器中启动 YouTube 视频 Intent i new Intent Intent ACTION VIEW Uri parse vnd youtube U79wVTdnMpw s
jQuery Tooltip UI - x 秒后触发工具提示

这是我到目前为止所拥有的
如何检测 Google 即搜即得页面已完全加载？

我正在开发一个浏览器扩展想想SEOQuake 我需要显示一些有关所显示的搜索结果的数据问题如果在加载过程中向 Google Instant 结果页面添加任何内容它将覆盖所有添加内容我发现自己在写一些非常奇怪的 setInterva
使用 new 表达式进行非静态数据成员初始化

考虑以下代码 include
Jquery ajax 随机错误仅在 Chrome 中出现

问题总结通过表单身份验证使用 Chrome 登录后作为 returnUrl 的登陆页面将在我的 jQuery ajax 中出错而不会影响服务器这status code 0和message error 几乎没有用在尝试使用 Fire
如何使用 javascript 将 json 值转换为逗号分隔的字符串

我有以下 JSON 字符串 name Marine Lines location id 3 name Ghatkopar location id 2 我想要 location id 作为 3 2 Simple var data name M
如何在 SwiftUI 中制作路径动画

由于不熟悉 SwiftUI 而且关于这个新框架的文档还很少我想知道是否有人熟悉如何制作动画Path在 SwiftUI 中例如给定一个视图让我们说这个简单的RingView struct RingView View var body
如何以编程方式检查 JMX MBean 操作和属性？

假设我们有一个具有以下属性和操作的 MBean 属性姓名尺寸运营获取名称获取大小有没有办法以编程方式检查属性和操作我一直在使用 IBM WebSphere MBeans 但他们的文档不是很好例如如果您去IBM 信息中心并导
如何捕获 RCurl 详细输出

我有以下请求 library RCurl res getURL http www google com search hl en lr ie ISO 8859 1 q RCurl btnG Search opts list verbose
使用 PHP 将 mm/dd/yyyy 格式转换为纪元

我有一个 mysql 表它依赖于相当于条目日期的 unix 纪元时间戳来对网站的各个部分进行排序和过滤我正在尝试实现一个日期选择器它将以 mm dd yyyy 格式将日期输入表单字段我一直在努力将该日期转换为 unix 纪元格式以
更新 DOM 而不重新加载 Django 中的页面

我在 DOM 中有两个选项列表第一个填充了对视图的初始调用即加载页面第二个选项列表的内容取决于用户在第一个选项中选择的内容假设选项列表是 list of events list of rooms 每次第一个选项列表的状态发生变化用
用 C++ 将所有程序输出写入 txt 文件

我需要将所有程序输出写入文本文件我相信事情是这样完成的 sOutFile lt lt stdout 其中 sOutFile 是创建文件的 ofstream 对象如下所示 sOutFile CreateAFile txt CreateAF
在C中使用memset()有什么好处

我很好奇在类似于下面的情况下使用 memset 在效率方面是否有任何优势鉴于以下缓冲区声明 struct More Buffer Info unsigned char a 10 unsigned char b 10 unsigned ch

在C中使用memset()有什么好处

在C中使用memset()有什么好处 的相关文章

随机推荐

热门标签

在C中使用memset()有什么好处的相关文章