Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常

2024-02-08

我正在开发 macOS 项目，该项目使用 Swift 和 Metal 在 GPU 上进行图像处理。上周，我收到了新的 15 英寸 MacBook Pro（2016 年末），并注意到我的代码有一些奇怪的地方：应该写入纹理的内核似乎没有这样做......

经过大量挖掘，我发现问题与 Metal 使用哪个 GPU（AMD Radeon Pro 455 或 Intel(R) HD Graphics 530）进行计算有关。

初始化MTLDevice using MTLCopyAllDevices()返回代表 Radeon 和 Intel GPU 的设备数组（同时MTLCreateSystemDefaultDevice()返回默认设备，即 Radeon）。无论如何，代码在 Intel GPU 上都能按预期工作，但在 Radeon GPU 上却并非如此。

让我给你举个例子。

首先，这是一个简单的内核，它接受输入纹理并将其颜色复制到输出纹理：

    kernel void passthrough(texture2d<uint, access::read> inTexture [[texture(0)]],
                            texture2d<uint, access::write> outTexture [[texture(1)]],
                            uint2 gid [[thread_position_in_grid]])
    {
        uint4 out = inTexture.read(gid);
        outTexture.write(out, gid);
    }

我为了使用这个内核，我使用这段代码：

    let devices = MTLCopyAllDevices()
    for device in devices {
        print(device.name!) // [0] -> "AMD Radeon Pro 455", [1] -> "Intel(R) HD Graphics 530"
    }

    let device = devices[0] 
    let library = device.newDefaultLibrary()
    let commandQueue = device.makeCommandQueue()

    let passthroughKernelFunction = library!.makeFunction(name: "passthrough")

    let cps = try! device.makeComputePipelineState(function: passthroughKernelFunction!)

    let commandBuffer = commandQueue.makeCommandBuffer()
    let commandEncoder = commandBuffer.makeComputeCommandEncoder()

    commandEncoder.setComputePipelineState(cps)

    // Texture setup
    let width = 16
    let height = 16
    let byteCount = height*width*4
    let bytesPerRow = width*4
    let region = MTLRegionMake2D(0, 0, width, height)
    let textureDescriptor = MTLTextureDescriptor.texture2DDescriptor(pixelFormat: .rgba8Uint, width: width, height: height, mipmapped: false)

    // inTexture
    var inData = [UInt8](repeating: 255, count: Int(byteCount))
    let inTexture = device.makeTexture(descriptor: textureDescriptor)
    inTexture.replace(region: region, mipmapLevel: 0, withBytes: &inData, bytesPerRow: bytesPerRow)

    // outTexture
    var outData = [UInt8](repeating: 128, count: Int(byteCount))
    let outTexture = device.makeTexture(descriptor: textureDescriptor)
    outTexture.replace(region: region, mipmapLevel: 0, withBytes: &outData, bytesPerRow: bytesPerRow)

    commandEncoder.setTexture(inTexture, at: 0)
    commandEncoder.setTexture(outTexture, at: 1)
    commandEncoder.dispatchThreadgroups(MTLSize(width: 1,height: 1,depth: 1), threadsPerThreadgroup: MTLSize(width: width, height: height, depth: 1))

    commandEncoder.endEncoding()
    commandBuffer.commit()
    commandBuffer.waitUntilCompleted()

    // Get the data back from the GPU
    outTexture.getBytes(&outData, bytesPerRow: bytesPerRow, from: region , mipmapLevel: 0)

    // Validation
    // outData should be exactly the same as inData 
    for (i,outElement) in outData.enumerated() {
        if outElement != inData[i] {
            print("Dest: \(outElement) != Src: \(inData[i]) at \(i))")
        }
    }

当运行此代码时let device = devices[0]（Radeon GPU），outTexture 永远不会被写入（我的假设），因此 outData 保持不变。另一方面，当运行此代码时let device = devices[1]（Intel GPU），一切都按预期工作，并且 outData 使用 inData 中的值进行更新。

我认为每当 GPU 写入MTLStorageModeManaged诸如纹理之类的资源，然后您想要从 CPU 读取该资源（例如使用getBytes()），你需要使用 blit 编码器来同步它。尝试将以下内容放在上面commandBuffer.commit() line:

let blitEncoder = commandBuffer.makeBlitCommandEncoder()
blitEncoder.synchronize(outTexture)
blitEncoder.endEncoding()

在集成 GPU 上，如果没有此功能，您可能会成功，因为 GPU 正在使用系统内存作为资源，并且没有任何内容可以同步。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常的相关文章

在您的应用程序 Swift 代码上启动 Youtube 频道

我花了几天时间找到从我的应用程序打开 youtube 频道的 Swift 代码但我根本找不到有人可以帮助我吗我需要 Swift 中的代码 Swift 3 和 iOS 10 的更新好的下面是如何在 Swift 3 中做到这一点基本
如何在 iOS 故事板中使用自定义字体来支持动态类型辅助功能大小

我怎样才能使用动态类型文本样式 https developer apple com library ios documentation StringsTextFonts Conceptual TextAndWebiPhoneOS Custo
有什么方法可以判断我的 iPhone 应用程序在运行时是否在调试器下运行？

如果我的错误处理代码在调试器下运行我希望它的行为有所不同具体来说如果我在手机上运行未连接到调试器并且断言失败我想将错误发送到我的服务器当我在gdb下时我想闯入调试器虽然我可以想象苹果将如何编写代码但我找不到任何关于测试调试
Xcode10 - dyld：未加载框架中安装的 pod 的库

我有一个带有目标框架的项目主应用程序目标框架A FrameworkA 是唯一使用某个 pod 的框架因此在我的 pod 文件中我有类似的内容 target MainAppTarget do end target FrameworkA
在完全自动反转重复周期之间延迟 SwiftUI 中的重复动画

我正在 SwiftUI 中构建一个 Apple Watch 应用它可以读取用户的心率并将其显示在心形符号旁边我有一个动画可以让心形符号反复跳动由于我知道实际用户的心率因此我希望使其以与用户心率相同的速率跳动并在每次速率变化时更新动
如何从元组数组创建字典？

假设我有可以识别的对象数组并且我想从中创建字典我可以轻松地从数组中获取元组如下所示 let tuples myArray map return 0 id 0 但我看不到字典的初始化程序来获取元组数组我错过了什么吗我是否已经为此功能
在 Mac OS X 中创建虚拟 USB 设备

我尝试以编程方式在 Mac OS 中添加带有驱动程序的虚拟 USB 设备 IOKit 文档说传统上虚拟设备的驱动程序在 IOResources 上匹配因为虚拟设备不发布自己的 nub 此类驱动程序的另一个示例是 HelloIOKit
可以在 swift 中创建静态分配的数组吗？

我想在 swift 中创建一个结构体它有少量固定数量的值比如 16 个浮点数作为实例数据要求该结构体不将这些值存储在堆上以便结构体实例的地址就是实例变量的地址还要求这些值可以通过下标在结构内部访问就像数组一样在 C 语言中
如何在 Windows 中拦截 DNS 查询

我正在研究如何在 Windows 中拦截 DNS 查询以一种不需要将 DLL 注入到每个进程中的方式并且理想情况下能够根据发出查询的进程做出决策因此简单的 DNS 代理服务器是不够的从表面上看 DNS 查询所采用的路径如下所示某些
Swift：扩展 [?] 来生成 [?] 可能吗？

在 Swift 中我有一个具有以下基本前提的自定义结构一个包装结构体可以包含符合以下条件的任何类型BinaryInteger如Int UInt8 Int16等 protocol SomeTypeProtocol associatedt
Xcode 12 问题 - 找不到目标“arm64-apple-ios-simulator”的模块“FrameworkName”；找到：x86_64-apple-ios-模拟器，x86_64

更新到 Xcode 12 后项目在模拟器上构建时出现此错误 Could not find module FrameworkName for target arm64 apple ios simulator found x86 64 app
如何追加到 Swift 字典中的值数组

假设我有一个字典它接受字符串作为键和数组作为值 var d String Int d k Int 现在我想append 到下面的数组 k 我怎么做 Int d k append 1 error d k as Int append 1 er
如何在 Swift 中将 CMutablePointer 设置为 false？

基本上我在 Swift 中使用 AssetsLibrary 框架如何将停止指针的值修改为 NO False 0 我什至不知道它应该除外什么值 self library enumerateGroupsWithTypes ALAssetsGr
Alamofire 的响应序列化失败

import UIKit import Alamofire import SwiftyJSON class LoginViewController UIViewController IBOutlet weak var urlTextFile
Swift 中不区分大小写的字典

Given a Dictionary whose Key属于类型String 有没有办法以不区分大小写的方式访问该值例如 let dict name John location Chicago 有办法打电话吗dict NAME dict
Java OS X Lion 关于菜单

我正在尝试覆盖 OS X Lion 上的 Java 应用程序或 Leopard 及以上版本中的任何内容中的关于菜单我怎么做到目前为止我读过的教程似乎不是最新的一些类不再在 Java Mac SDK 中其他类的事件也没有被触发
如何在 OSX .pkg 中设置背景图像？

我正在为我的 OSX 应用程序创建一个 pkg 安装程序但我无法弄清楚如何设置背景图像我在构建脚本中创建安装程序如下所示 pkgbuild root APP FOLDER identifier com company product
DirectX 世界视图矩阵乘法 - GPU 或 CPU 的地方

我是 directx 的新手但令我惊讶的是我看到的大多数示例中世界矩阵和视图矩阵都是作为顶点着色器的一部分相乘而不是与 CPU 相乘并将结果传递给着色器对于刚性对象这意味着您为对象的每个顶点将相同的两个矩阵相乘一次我知道 GP
在 Mac Sierra 上，如何授予 ssh 会话对显示器的访问权限？

这是后续的使用 Jenkins 运行 ios sim https stackoverflow com questions 13518532 running ios sim with jenkins 当 Jenkins 从机通过 ssh 运行
Swift NSSet 和 CoreData

我正在尝试将目标 C 和 CoreData 应用程序移动到 Swift 和 iOS 但在迭代 NSSet 对象时遇到了困难 Xcode 已生成这些类 class Response NSManagedObject NSManaged var

随机推荐

JavaScript 中的 .trim() 在 IE 中不起作用

我尝试申请 trim https developer mozilla org en JavaScript Reference Global Objects String trim到我的一个 JavaScript 程序中的一个字符串它在 M
具有多个表和关系的复杂 SQL 查询

在此查询中我必须列出为完全相同的球队效力的一对球员及其球员 ID 和球员姓名如果一名球员为 3 支球队效力则另一个球员必须为完全相同的 3 支球队效力不多也不少如果两名球员目前没有为任何球队效力他们也应该被包括在内查询应返回
为什么我会收到“clang：错误：链接器命令失败，退出代码为 1”？

Doing 使用 Xcode 在功能我部分输入了幂函数示例的代码如下所示 include
FrameLayout 与 NestedScrollView 的高度不匹配

我在 NestedScrollView 中有一个 FrameLayout 如下所示
如何在 git 中使用单个命令取消暂存和丢弃

In git 取消暂存文件git reset HEAD
[] 和 $ 之间逻辑语句的差异

我正在处理一个数据框 df temp 其中包含两列客户 ID Custid 和收入 Income Custid Income
.includes() 检查prompt()中的关键字

我正在创建一种聊天机器人它将在存储在数组中的嵌入关键字上运行在这个例子中我有数组x正在办理登机手续y 这返回true每当我准确输入时Hello in the prompt 但是如果我要说的话哦你好在提示中它返回 false 如何
如何避免“优化掉”我的 javascript 测试用例？

我有一个jsperf测试用例 http jsperf com multiplication vs division lars 结果非常令人困惑我有三个片段乘法 division 控制都不进行任何操作大多数时候它们的速度都相同甚
为什么 std::future 与 std::packaged_task 和 std::async 返回的不同？

我知道了原因future从返回std async有一些特殊的共享状态wait on returned future发生在 future 的析构函数中但是当我们使用std pakaged task 其未来不会表现出相同的行为要完成打包任务
查找图像内容并在其周围绘制矩形

About 我在用着WinForms 在我的表格中我有一个picturebox The picturebox尺寸模式设置为zoom 我用picturebox查看 TIF 图像 TIF 图像是灰度图像仅黑白我的应用程序做什么我的应用程
使用 hasError() 进行验证的表单生成器会抛出 ERROR TypeError: Cannot read property 'hasError' of undefined 错误

您好我正在使用 Form Builder 在 Angular 2 中实现一个表单在 component ts 中我使用 formGroup 实现了我的表单下面是我的代码 public myForm FormGroup constru
我无法使用 driver.findElement(By.xpath()); 找到带有 xpath 的 Web 元素

我尝试在页面上找到要单击的链接 a class js folder icon wrap icon wrap left menu item link menu item link act menu item link unread href
向 dplyr 中的列添加噪声

相关于上一个问题 https stackoverflow com questions 65395072 non finite value supplied in ggstatsplot 65395399 65395399 我想向 dplyr
将 32 位和 64 位 DLL 合并到一个程序中

我需要加载 dll 文件中提供的不同硬件驱动程序问题似乎是一个设备的驱动程序是在 64 位 dll 中给出的而另一个设备相当旧显然依赖于 32 位 dll 中给出的驱动程序我想通过一个用 C 编写的程序来控制它们该程序将通过 p
如何为 Elastic Beanstalk 上的特定容器设置文件夹权限

我在为 Elastic Beanstalk 上的 Web 文件夹设置权限时遇到问题我在一个实例中使用自定义 docker 映像运行多个容器 apache php mysql memcached 等对于容器 apache php 我将包含
是否可以在 UIScrollView 内部放大和缩小 UIImageView，但使用自动布局保持居中？

长话短说我正在尝试构建类似于 Photos app 的功能我有一个 UIScrollView 其中有一个 UIImageView 设置在 Storyboard 中缩放可以工作但我无法使其保持居中在我所有基于框架的滚动视图实现中我
.NET Core 捕获中间件中的 Json 反序列化错误

我确信我错过了一些明显的东西是否可以在 NET Core的默认中间件反序列化器中处理JSON反序列化错误我需要确保特定值是 JSON 原语而不是对象数组如果它不是原语我想在请求到达控制器之前终止请求并返回适当的状态代码控制器
Django CharField 没有空字符串

有没有办法制作一个不接受空字符串的 CharField 或 TextField 我正在尝试使用blank False但它不工作 class Foo models Model title models CharField max length
iOS VoiceOver 在更改到下一个元素之前等待元素完成阅读

我有一个按钮可以切换显示的标签 class ViewController UIViewController IBOutlet weak var label UILabel IBOutlet weak var button UIButton
Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常

我正在开发 macOS 项目该项目使用 Swift 和 Metal 在 GPU 上进行图像处理上周我收到了新的 15 英寸 MacBook Pro 2016 年末并注意到我的代码有一些奇怪的地方应该写入纹理的内核似乎没有这样做经

Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常

Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常 的相关文章

随机推荐

热门标签

Metal 内核在新款 MacBook Pro（2016 年末）GPU 上运行不正常的相关文章