SIMD编程语言[关闭]

2023-11-24

在过去的几年中，我进行了大量的 SIMD 编程，大部分时间我都依赖编译器内部函数（例如用于 SSE 编程的函数）或编程汇编来实现真正漂亮的功能。东西。然而，到目前为止，我几乎找不到任何内置支持 SIMD 的编程语言。

现在显然有诸如 HLSL、Cg 和 GLSL 之类的着色器语言对此类内容具有本机支持，但是，我正在寻找至少能够编译为 SSE 而不需要自动矢量化但具有对矢量运算的内置支持的语言。这样的语言存在吗？

这是一个 Cg 着色器（的一部分）的示例，它执行聚光灯，就语法而言，这可能是最接近我正在寻找的内容。

float4 pixelfunction(
    output_vs IN, 
    uniform sampler2D texture : TEX0, 
    uniform sampler2D normals : TEX1, 
    uniform float3 light, 
    uniform float3 eye ) : COLOR
{
    float4 color    = tex2D( texture, IN.uv );
    float4 normal   = tex2D( normals, IN.uv ) * 2 - 1;

    float3 T = normalize(IN.T);
    float3 B = normalize(IN.B);

    float3 N = 
        normal.b * normalize(IN.normal) +
        normal.r * T +
        normal.g * B;

    float3 V = normalize(eye - IN.pos.xyz);
    float3 L = normalize(light - IN.pos);
    float3 H = normalize(L + V);

    float4 diffuse  = color * saturate( dot(N, L) );
    float4 specular = color * pow(saturate(dot(N, H)), 15);
    float falloff   = dot(L, normalize(light));

    return pow(falloff, 5) * (diffuse + specular);
}

这种语言中真正必须的东西是：

内置 swizzle 运算符
向量运算（点、交叉、归一化、饱和、反射等）
支持自定义数据类型（结构）
动态分支会很好（for 循环、if 语句）

所以最近英特尔发布了ISPC这正是我在问这个问题时所寻找的。它是一种可以与普通 C 代码链接的语言，具有隐式执行模型，并支持开始帖子中提到的所有功能（混合运算符、分支、数据结构、向量操作、着色器等）并针对 SSE2、SSE4 进行编译， AVX、AVX2 和 Xeon Phi 矢量指令。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SIMD编程语言[关闭] 的相关文章

高效的 4x4 矩阵乘法（C 与汇编）

我正在寻找一种更快更棘手的方法来用 C 语言将两个 4x4 矩阵相乘我目前的研究重点是具有 SIMD 扩展的 x86 64 汇编到目前为止我已经创建了一个比简单的 C 实现快大约 6 倍的函数这超出了我对性能改进的预期不幸的是
使用 x64 SIMD 进行半字节改组

我知道字节改组 https www felixcloutier com x86 pshufb指令但我想对半字节 4 位值做同样的事情具体来说我想在 64 位字中混洗 16 个半字节我的洗牌索引也存储为 16 个半字节最有效的实施
F# 中的非类型化/类型化代码引用与宏卫生之间是否存在关系？

我想知道 F 中的非类型类型代码引用与宏系统的卫生之间是否存在关系他们是否用各自的语言解决相同的问题或者它们是不同的关注点元编程方面是唯一的相似之处即使在这方面也存在很大的差异您可以将宏的转换器视为从语法到语法的函数就像您可
如何开发像 Coffee Script 这样的编程语言？

要开发像咖啡脚本这样的编程语言我需要知道的初始要求是什么它基本上有自己的语法但在编译后会更改为另一种语言我对此进行了谷歌搜索但找不到正确的答案使用基本语言指定您的语言形式语法 http en wikipedia org wiki
对于Intel Haswell上的XMM/YMM FP操作，可以使用FMA代替ADD吗？

这个问题适用于 Haswell 上带有 XMM YMM 寄存器的打包单精度浮点运算所以根据awesome awesome table http www agner org optimize instruction tables pdf由
SSE加载和添加

假设我有两个由两个类型数组表示的向量double 每个尺寸为2 我想添加相应的位置所以假设向量i0 and i1 我想补充一下i0 0 i1 0 and i0 1 i1 1 一起由于类型是double 我需要两个寄存器诀窍是把i0 0
我用带有垃圾收集器的语言构建了一个解释器。我需要一个用于解释器的垃圾收集器吗？

这是一个幼稚的问题但在我迄今为止看到的教程中并没有拼写清楚如果我在一种高级语言不是 C C 等之上构建一个解释器并且它有一个垃圾收集器是否有必要为解释器本身制作一个如果答案是肯定的那一定是同一类宿主吧即如果主机是标记清
编程语言中的协变和逆变有什么区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案谁能解释一下协变和逆变的概念编程语言理论协方差非常简单最好从某个集合类的角度来思考List 我们可以参数化 the List具有
用于读/写 XMM 和 YMM 寄存器的内联汇编代码？

我有 2 个变量来模拟 X86 XMM 和 YMM 如下所示 uint64 t xmm value 2 uint64 t ymm value 4 现在我想使用内联汇编来读取和写入 XMM YMM 寄存器如何编写GCC内联汇编来复制xmm
无意中使用 = 而不是 ==

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动看起来 if x y 代替 if x y 是许多罪恶的根源为什么不all编译器将其标记
SSE、内在函数和对齐

我使用大量 SSE 编译器内在函数编写了一个 3D 矢量类一切都工作正常直到我开始使用 new 来实例化具有 3D 向量作为成员的类我在发布模式下经历了奇怪的崩溃但在调试模式下却没有反之亦然因此我阅读了一些文章并认为我需要将
如何使用 Neon SIMD 将无符号字符转换为有符号整数

如何转换变量的数据类型uint8 t to int32 t使用霓虹灯我找不到执行此操作的任何内在因素假设您想要将 16 x 8 位整数的向量转换为 4 个 4 x 32 位整数的向量您可以通过首先解压缩为 16 位然后再次解压缩为
排列 SSE __m128i 寄存器内的字节

我有以下问题 In m128i寄存器有 16 个 8bit 值顺序如下 1 5 9 13 2 6 10 14 3 7 11 15 4 8 12 16 我想要实现的是有效地洗牌字节以获得此排序 1 2 3 4 5 6 7 8 9 10 11
特定领域语言与函数库

这可能是主观的我不知道我有这个问题我有点等同于这个项目用什么语言问题因为我似乎无法解决它我受委托为一个非常精通技术的社区但不是程序员写一本关于某个领域比如说物理学的一个非常具体的分支的书这是一本关于他们日复一日使用的
用于预乘 ARGB 的 SSE alpha 混合

我正在尝试编写一个支持 SSE 的 alpha 合成器这就是我想出的首先混合两个 4 像素向量的代码 alpha blend two 128 bit 16 byte SSE vectors containing 4 pre multi
什么是 __ext_vector_type__ 和 simd？

我正在使用 Apple Metal API 以及所谓的simd图书馆标题中有这样的代码 typedef attribute ext vector type 3 float vector float3 我很好奇它实际上做了什么以及为什么编译
语言是如何以及为何形成的/是否有任何正在发展的语言表现出希望？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
按字节数对向量进行混洗

有什么办法可以左移 v 0 gt v 1 a m128i by n字节其中n仅在运行时才知道我目前仅限于 AVX1 但如果 AVX2 512 使这变得更容易我非常感兴趣 I found mm bslli si128 m128i imm
在 C# 中按元素相乘数组具有意想不到的性能

我想找到按元素相乘两个数组的最佳方法这是更广泛项目的一部分其中性能而不是唯一的考虑因素我今天开始用 C Linqpad 编写一些函数因此它还没有以任何方式进行优化下面代码的输出如下 Environment ProcessorCou
如何使用 javascript 更改文件扩展名

有谁知道在 Javascript 中更改文件扩展名的简单方法吗例如我有一个带有 first docx 的变量但我需要将其更改为 first html 这将改变字符串包含文件名 let file first docx file file

随机推荐

Bash - 计算输入数字的平均值

需要有关 Linux Bash 脚本的帮助本质上运行脚本时会要求用户提供三组数字然后计算输入的数字并得出平均值 bin bash echo Enter a number read a while a do echo Enter a s
如何解决 Bash 命令替换中的错误“bash: !d': event not found”[重复]

这个问题在这里已经有答案了我正在尝试解析 VNC 服务器启动事件的输出但在命令替换中使用 sed 进行解析时遇到了问题具体地远程VNC服务器的启动方式如下 address1 email protected VNCServerResp
MySQL LAST_INSERT_ID() 与多记录 INSERT 语句一起使用

如果我使用执行单个记录插入的循环插入多个记录则返回的最后一个插入 ID 正如预期的那样是最后一个但是如果我执行多条记录插入语句 INSERT INTO people name age VALUES William 25 Bart 15
弱分类器

我正在尝试实现一个使用 AdaBoost 算法的应用程序我知道 AdaBoost 使用一组弱分类器但我不知道这些弱分类器是什么你能用一个例子向我解释一下并告诉我是否必须创建自己的弱分类器或者我应该使用某种算法吗弱分类器或弱学习器
在 C++ 中不使用指针和使用常规对象可以进行动态绑定吗

include
如何在本地测试 Chromium/Chrome 扩展的内联安装？

我正在尝试按照本文档测试 Chrome 网上应用店的内联安装功能 https developers google com chrome web store docs inline installation 我正在本地开发此程序以进行测试并
如何在 Oracle SQL 中选择直到特定字符的子字符串？

假设我有一个表列其结果如下 ABC blahblahblah DEFGH moreblahblahblah IJKLMNOP moremoremoremore 我希望能够编写一个查询从所述表中选择此列但仅返回到下划线字符的子字符串
使用语言环境设置将西班牙日期转换为 python pandas datetime 对象

我有 2 个问题如何使用以下命令将西班牙语日期时间 ago122010 转换为 2010 08 12pandas 使用的格式是strptime正确的我尝试过以下方法 import locale locale setlocale loca
使用 C# 检查进程是否正在远程系统上运行

我正在尝试检查进程是否正在远程系统上运行我正在使用以下代码 string procSearc notepad string remoteSystem remoteSystemName Process proce System Diagno
使用 maven 制作 fat jar 时出现“无法找到数据源：parquet”

我正在使用 Maven 组装插件组装 fat jar 并遇到以下问题 Exception in thread main java lang ClassNotFoundException Failed to find data source
Application Insights 报告每个服务器请求的重复事件

我有一个在 Azure 应用服务下运行的 API 应用程序安装了 Application Insights 以跟踪 API 调用的服务器端遥测在 Azure 门户中查看 Application Insights 时我看到每个服务器调用
Npgsql 提供程序是否支持 TransactionScope？

我正在尝试将 TransactionScope 与 Npgsql 提供程序一起使用我在一个老问题中发现 net 中 PostgreSQL 的提供程序支持 TransactionScope Npgsql 还不支持它现在大约 5 年后
保存和加载模型优化器状态

我正在训练一组相当复杂的模型并且正在寻找一种保存和加载模型优化器状态的方法训练模型由其他几个权重模型的不同组合组成其中有些模型具有共享权重有些模型根据训练模型而冻结权重等等这个例子有点太复杂了无法分享但总之我无法使用
如何使用 Elastic Beanstalk 创建“tmp”目录？

我正在使用 Node js 需要将文件保存到我的应用程序中的 tmp 目录问题在于 Elastic Beanstalk 未将应用程序目录设置为可由应用程序写入因此当我尝试创建临时目录时出现此错误 fs js 653 return b
在 Highcharts 中绘制直方图

众所周知直方图和条形图是两个不同的东西我有很多不同的方法在 highcharts 中绘制条形图但我没有得到任何在 highcharts 中绘制直方图的示例是否可以使用 highcharts 绘制直方图如果可以如何绘制您可以使用
元素必须没有字符或元素信息项[children]，因为该类型的内容类型为空

当我从事这个项目时我不断收到一条错误消息元素客户必须没有字符或元素信息项 children 因为该类型的内容类型为空我不确定为什么这不起作用因为我遵循了注释它看起来像这样
我可以在没有 Google Glass 的情况下测试 Google Glass 程序吗？

我可以在没有实际拥有 Google Glass 的情况下编写和测试 Google Glass 的 Hello World 程序吗有可以用来测试应用程序的模拟器吗我看过一个视频显示我们可以在 Nexus 平板电脑上运行它查看链接htt
Fluent IOC 配置/模块的最佳位置（当前正在尝试 Ninject）

我正在努力寻找放置 Ninject 配置模块的最佳位置指定类型绑定的位置我希望我只是错过了一些明显的技巧因为这开始成为我使用流畅配置以及 Ninject 的一个障碍在一个简单的 Web 堆栈中包含三个独立的项目 Web 业务
Android 中的 javax.mail.AuthenticationFailedException

尝试使用 JavaMail API 从我的 Gmail 帐户发送电子邮件时我在 LogCat 中收到以下错误消息 11 09 11 04 14 385 W System err 18443 javax mail Authenticatio
SIMD编程语言[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案在过去的几年中我进行了大量的 SIMD 编程大部分时间我都依赖编译器内部函数例如用于 SSE 编程的函数或编程汇编来实现真正漂亮的功能东西

SIMD编程语言[关闭]

SIMD编程语言[关闭] 的相关文章

随机推荐

热门标签