在渲染脚本中,我使用绑定指针来迭代大图像。
问题在于数组访问性能。
...
for(int i=0; i < channels; i++) {
sum += (input[i*input_size]) * mulValue;
}
...
例如,当 input_size 为 12288 时,完成脚本需要 1.5 秒,但当 input_size 为 12280 时,需要约 0.5 秒。
是什么导致了如此神秘的行为?
理解在 RenderScript(或 openCL)中编写的内容对性能的影响是很复杂的。
仅在 RendersScript 中编写并不能保证性能。
很多时候,当内存访问跳跃时,您会遇到缓存一致性问题。
通常,最好将代码构建为一系列以缓存友好方式处理的内核。
抱歉,如果这含糊不清。您的询问没有足够的详细信息。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)