将8个16位SSE寄存器转换为8位数据

2024-02-17

假设我有一个包含 16 位数据的 SSE 数组：

{1,2,3,4,5,6,7,8}

现在我需要通过在前 8 个字节中仅存储 16 位数据的低字节来将此 SSE 数组转换为 8 位数据，如下所示：

{1,2,3,4,5,6,7,8,0,0,0,0,0,0,0,0}.

有没有SSE指令来执行这个操作？

As @harold https://stackoverflow.com/users/555045/harold在上面的评论中说，你可以很容易地做到这一点, e.g.

#include <stdio.h>
#include <tmmintrin.h>

static __m128i pack_16_to_8(const __m128i v)
{
    const __m128i vperm = _mm_setr_epi8(0, 2, 4, 6, 8, 10, 12, 14, -1, -1, -1, -1, -1, -1, -1, -1);

    return _mm_shuffle_epi8(v, vperm);
}

int main(void)
{
    const __m128i v = _mm_setr_epi16(1, 2, 3, 4, 5, 6, 7, 8);

    printf("%vhd -> %vd\n", v, pack_16_to_8(v));
    return 0;
}

编译并运行：

$ gcc -Wall -mssse3 pack_16_to_8.c && ./a.out

1 2 3 4 5 6 7 8 -> 1 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

x86

intel

SSE

SIMD

将8个16位SSE寄存器转换为8位数据的相关文章

C++ 错误：“_mm_sin_ps”未在此范围内声明

我正在尝试对将函数应用于数组的不同方法进行基准测试 why is mm sin ps在我的范围内不知道但是 mm sqrt ps is 我怎样才能让它知道并且编译没有错误 include
SSE，行主要与列主要性能问题

出于个人和娱乐目的我正在使用 SSE 4 1 编写一个 geom 库我花了最后 12 个小时试图理解处理行主要与列主要存储矩阵时的性能问题我知道 Dirext OpenGL 矩阵是以行主顺序存储的因此对我来说将矩阵按行主顺序存储会
链接描述文件未按预期跳过字节

因此我有这个汇编文件我使用 GNU as 进行汇编并使用链接器脚本与 GNU ld 进行链接链接描述文件 boot ld INPUT boot o OUTPUT boot out ENTRY boot start SECTIONS
用于读/写 XMM 和 YMM 寄存器的内联汇编代码？

我有 2 个变量来模拟 X86 XMM 和 YMM 如下所示 uint64 t xmm value 2 uint64 t ymm value 4 现在我想使用内联汇编来读取和写入 XMM YMM 寄存器如何编写GCC内联汇编来复制xmm
分配内存空间的宏

我需要让一个汇编程序员来计算帕斯卡三角形 https en wikipedia org wiki Pascal 27s triangle 这样帕斯卡三角形的每一行都与其他行分开存储在内存中我想做一个但我不知道如何使用宏在汇编中做到这一点
现代 x86 硬件不能将单个字节存储到内存中吗？

说到 C 的并发内存模型 Stroustrup 的C 编程语言第 4 版第 1 节 41 2 1 说就像大多数现代硬件一样机器无法加载或存储小于单词的任何内容然而我的 x86 处理器已经有几年的历史了它可以并且确实存储小于单词
获取比较指令的值

据我了解 cmp 指令将设置标志寄存器中的一些位然后您可以使用 jle jnp 等指令基于这些指令进行分支我想知道如何从比较中恢复整数值示例以下是有效的 c 语法 y x a gt 13 因此 a 与 13 进行比较得到 tru
如何禁用浮点单元（FPU）？

我想在 x86 系统中禁用 FPU MMX SSE 指令并且我将为设备不可用异常实现一个处理程序我已经提到过控制寄存器 wiki 页面 http en wikipedia org wiki Control register 看来我必须在
x86 平台中的 KVM 影子页表处理

据我了解在没有硬件支持来宾虚拟到主机物理地址转换的处理器上 KVM 使用影子页表当来宾操作系统修改其页表时会构建和更新影子页表硬件中有没有专门的指令以x86为参考来修改页表除非有特殊说明否则不会对VMM 造成陷阱 Linux
为什么这个“std::atomic_thread_fence”起作用

首先我想谈一下我对此的一些理解如有错误请指正 a MFENCE在x86中可以保证全屏障顺序一致性可防止 STORE STORE STORE LOAD LOAD STORE 和 LOAD LOAD 重新排序这是根据维基百科 https
一条指令可以同时处于两种寻址模式吗？

我在书中读到了以下内容从头开始编程处理器有多种不同的访问数据的方式称为寻址模式最简单的模式是立即模式其中要访问的数据嵌入在指令本身中例如如果我们想将寄存器初始化为 0 而不是给出计算机要从中读取 0 的地址我们将指定立即
为什么 SSE 对齐读取 + 随机播放在某些 CPU 上比未对齐读取慢，而在其他 CPU 上则不然？

在尝试优化有限差分代码所需的未对齐读取时我更改了未对齐的负载如下所示 m128 pm1 mm loadu ps H k 1 进入这个对齐的读取随机播放代码 m128 p0 mm load ps H k m128 pm4 mm load
Visual Studio 2017 上的简单装配程序

386 model flat c stack 100h printf PROTO arg1 Ptr Byte data msg1 byte Hello World 0Ah 0 code main proc INVOKE printf ADD
减法进位标志

我正在使用 MASM32 有了这个代码 mov eax 5 sub eax 10 CF 状态标志将被设置但使用我的铅笔和纸我实际上看到 MSB 没有任何进位是的我知道从较少的数字中减去大的数字集CF 但我想知道为什么因为使用这段代
从汇编程序获取命令行参数

通读专业汇编语言书籍似乎它提供了用于读取命令行参数的错误代码我纠正了一点现在它从段错误变成了读取参数计数然后是段错误这是完整的代码 data output1 asciz There are d params n output2
为什么x86分页没有特权环的概念？

早在 1982 年当 Intel 发布 80286 时他们在分段方案中添加了 4 个特权级别环 0 3 由全局描述符表 GDT 和局部描述符表 LDT 中的 2 位指定在 80386 处理器中 Intel 添加了分页功能但令人惊讶
用于预乘 ARGB 的 SSE alpha 混合

我正在尝试编写一个支持 SSE 的 alpha 合成器这就是我想出的首先混合两个 4 像素向量的代码 alpha blend two 128 bit 16 byte SSE vectors containing 4 pre multi
使用 (float&)int 进行类型双关可以正常工作，(float const&)int 会像 (float)int 一样转换吗？

VS2019 发布 x86 template
CPU寄存器和多任务处理

我目前正在学习汇编我很困惑 CPU 寄存器如何与多任务一起工作所以在多任务系统中 CPU可以随时暂停某个程序的执行并运行另一个程序那么在这一步中寄存器值是如何保存的呢寄存器是压入堆栈还是以其他方式 CPU 寄存器如何与多任务一起工作
什么是“矢量化”？

现在好几次了我在 matlab fortran 其他一些中遇到这个术语但我从来没有找到解释它是什么意思它有什么作用所以我在这里问什么是矢量化例如循环矢量化是什么意思许多CPU具有向量或 SIMD 指令集它们同时对两

随机推荐

保存单个核心数据实体（而不是整个上下文），同时保留 NSFetchedResultsController 功能

唷抱歉标题太长了我有一个托管对象上下文其中存储来自两个不同位置的歌曲我从手机上的持久存储中获取一些歌曲使用 Core Data 并从在线数据库中提取一些歌曲这两首歌曲都属于同一 ManagedObject 子类我希望这两首歌都
迁移 COBOL 代码

我的任务是将 COBOL 代码转换为 NET 有可用的转换器吗我正在尝试高层次地理解 COBOL 代码我无法理解 COBOL 代码有没有流程图生成器我很感激任何帮助谢谢将软件系统从一种语言或操作环境迁移到另一种语言或操作环境始终
如何在Fauxton中使用reduce

我一直在关注一些 Couch 培训但无法弄清楚如何在 Fauxton 中使用reduce 选择地图区域下方的 count 本身不会执行任何操作我尝试将其添加到地图代码下方但我想我需要以某种方式集成它在我的示例中我试图计算每个标签在
git create stash 无需配置 user.email 和 user.name (git stash --author ?)

IN SHORT 是否有可能创建一个存储使用git stash create without需要配置user email and user name 类似的东西git commit author选项一些背景我有几台构建机器上面有一个
如何在内核程序（内核上下文）中访问用户程序创建的bpf映射？

假设有两个程序用户程序和内核程序用户程序通过api制作bpf图bpf create map name 返回 fd 有了这个 fd 我可以通过系统调用访问地图例如 bpf map update FD 但我只能在用户空间程序中执行此操作
在 Rails 和 PostgreSQL 中完全忽略时区

我正在处理 Rails 和 Postgres 中的日期和时间并遇到这个问题数据库采用 UTC 时间用户在 Rails 应用程序中设置选择的时区但仅在获取用户本地时间以比较时间时使用用户存储一个时间比如 2012 年 3 月 17
为什么 unset() 在 PHP 三元运算符中不起作用

所以这有一个问题但我对此视而不见即使阅读文档两次 PHP 比较运算符 http us php net manual en language operators comparison php isset items blog unset
jquery 回调函数仅在最后一个循环中工作

for var i 0 i lt barValues length i actualBarHeight Math floor barValues i chartMaxY barchartHeight var barChartID barCh
Mongodb 连接 _id 字段从 String 到 ObjectId

我有两个收藏 User id ObjectId 584aac38686860d502929b8b name John Role id ObjectId 584aaca6686860d502929b8d role Admin userId 5
在这种情况下，“日期”对于类型查找不明确

在此上下文中日期对于类型查找来说不明确 1 找到该候选人基金会日期 2 找到该候选者 DocuSignESign Date extension Date func isGreaterThanDate dateToCompare Da
String 类型中的方法 format(String, Object[]) 不适用于参数 (...)

这是我的代码 int hoursFormat 1 minsFormat 2 secsFormat 3 String timeFormat String format 02d 02d 02d hoursFormat minsFormat se
读取 jenkins groovy 脚本中的配置文件以获取构建参数

我有一个参数的选择列表选择列表中的值基于登录 jenkins 的用户例如学生选择数学科学和商业科目他应该能够在选择下拉列表中看到自己的科目我将每个学生及其注册科目的映射存储在 json 文件中我用了配置文件提供程序插件 htt
jqGrid 'clearToolbar' 无需重新加载网格

我需要清除toolbar无需重新加载我的网格jqgrid 它应该只是将工具栏重置为其默认值我尝试使用 TransactionsGrid 0 clearToolbar My grid datatype local我不使用loadonce t
如何使用WebClient而不阻塞UI？

有人可以给我指一个教程或提供一些示例代码来调用System Net WebClient DownloadString url 在等待结果时不冻结 UI 的方法我认为这需要用线程来完成是否有一个简单的实现可以使用而不需要太多的开销代码 T
反转字符串的词序，不允许使用 str.split()

执行此操作的 pythonic 方法是什么从这个这是一个要尝试的字符串到这个尝试字符串 a is This 我的第一个猜测是 for w in This is a string to try split 1 print w but
如何使 AWS Data Pipeline ShellCommandActivity 脚本执行 python 文件

我正在使用一个 AWS Data Pipeline 它有一个 ShellCommandActivity 它将脚本 uri 设置为位于 s3 存储桶中的 bash 文件 bash 文件将位于同一 s3 存储桶中的 python 脚本复制到 E
Google 云消息接收器 Intent 未启动（广播 Intent 回调：result=CANCELLED forIntent）

我正在尝试制作一个GCM客户端注册就可以了我也成功从服务器发送消息然而客户端并没有启动意图它说 09 30 08 39 59 795 W GTalkService 4667 DataMsgMgr 广播意图回调 result CAN
从字符串而不是文件渲染 Blade

如何渲染包含刀片语法的字符串 View make directory file name gt with var var Usual usage View render var gt with var var Like this for E
异常调用堆栈被截断，没有任何重新抛出

我有一个不寻常的情况我有一个非常简单的异常被抛出并在同一方法中捕获它不会被重新抛出天真的程序员通常会遇到这样的问题然而它的 StackFrame 只包含一个当前方法它看起来是这样的 at my class MyMethod in
将8个16位SSE寄存器转换为8位数据

假设我有一个包含 16 位数据的 SSE 数组 1 2 3 4 5 6 7 8 现在我需要通过在前 8 个字节中仅存储 16 位数据的低字节来将此 SSE 数组转换为 8 位数据如下所示 1 2 3 4 5 6 7 8 0 0 0 0 0

将8个16位SSE寄存器转换为8位数据

将8个16位SSE寄存器转换为8位数据 的相关文章

随机推荐

热门标签

将8个16位SSE寄存器转换为8位数据的相关文章