优化 Swift 中的嵌套 for 循环

2024-01-10

我得到了这个方法来计算白色像素UIImage，我需要遍历所有像素来增加我找到的每个白色像素的计数器。我正在尝试提高它的性能，但我找不到更好的方法。有任何想法吗？

func whitePixelCount() -> Int {
    let width = Int(image.size.width)
    let height = Int(image.size.height)
    var counter = 0
    for x in 0..<(width*scale) {
        for y in 0..<(height*scale) {
            // We multiply per 4 because of the 4 channels, RGBA, but later we just use the Alpha
            let pixelIndex = (width * y + x) * 4

            if pointer[pixelIndex + Component.alpha.rawValue] == 255 {
                counter += 1
            }
        }
    }
    return counter
}

Component.alpha.rawValue等于3
scale is Int(image.scale)

pointer来自：

guard let cfdata = self.image.cgImage?.dataProvider?.data,
    let pointer = CFDataGetBytePtr(cfdata) else {
        return nil
}

一些观察结果：

确保您使用的是优化/发布版本，而不是未优化的调试版本。在我的设备上，调试版本大约需要 4 秒才能处理 12 兆像素的图像，而发布版本则需要 0.3 秒。
当你有一个for循环，您可以将其并行化以利用 CPU 上的所有内核。通过使用跨步算法，for循环速度几乎快了 4 倍。

听起来不错，但不幸的是，问题在于处理图像的 0.3 秒，其中大部分是图像缓冲区的准备。（现在，在您的示例中，您没有将其重新渲染到预定义的像素缓冲区中，恕我直言，这有点危险，所以也许您没有这种开销。但是，无论如何，10+ 毫秒的差异通常是不可观察到的除非您正在处理数百张图像。）for循环仅占经过时间的 16 毫秒。因此，虽然将其减少到 4 毫秒几乎快了 4 倍，但从用户的角度来看，这并不重要。

无论如何，请随意在我原来的答案中查看下面的跨步并行算法。

一种非常简单的改进方法for循环性能是使用concurrentPerform并行化例程：

例如，这是一个非并行例程：

var total = 0

for x in 0..<maxX {
    for y in 0..<maxY {
        if ... {
            total += 1
        }
    }
}

print(total)

您可以通过以下方式并行化它

翻转x and y循环，因为我们希望外层循环成为图像中的一行。这个想法是为了确保每个线程不仅应该使用连续的内存块，而且我们希望最大限度地减少重叠量以避免“缓存晃动”。因此考虑：
```
for y in 0..<maxY {
    for x in 0..<maxX {
        if ... {
            total += 1
        }
    }
}
```
我们实际上不会使用上面的内容，但我们将在下一步中将其用作模型；

更换外层for循环（现在y坐标）与concurrentPerform:

var total = 0

let syncQueue = DispatchQueue(label: "...")

DispatchQueue.concurrentPerform(iterations: maxY) { y in
    var subTotal = 0
    for x in 0..<maxX {
        if ... {
            subTotal += 1
        }
    }
    syncQueue.sync {
        total += subTotal
    }
}

print(total)

所以，想法是：

更换外层for循环与concurrentPerform;
而不是尝试更新total对于每次迭代x，有一个subTotal每个线程的变量并且仅更新total最后（最大限度地减少多个线程对此共享资源的争用）；和
使用某种同步机制（我在这里使用了串行队列，但任何同步机制都可以）来更新total以确保线程安全。

我试图使示例尽可能简单，但甚至还可以进行其他优化：

不同的同步技术提供不同的性能。例如。您可以使用NSLock（传统观点认为速度较慢，但我最近的基准测试表明，在许多情况下性能可以比 GCD 更好）通过定义sync协议扩展中的方法（提供一种良好、安全的使用锁的方式），如下所示：
```
// Adapted from Apple’s `withCriticalSection` code sample

extension NSLocking {
    func sync<T>(_ closure: () throws -> T) rethrows -> T {
        lock()
        defer { unlock() }
        return try closure()
    }
}
```
然后你可以做类似的事情：
```
let lock = NSLock()

DispatchQueue.concurrentPerform(iterations: maxY) { y in
    var subTotal = 0
    for x in 0..<maxX {
        if ... {
            subTotal += 1
        }
    }
    lock.sync {
        total += subTotal
    }
}

print(total)
```
请随意尝试您想要的任何同步机制。但我们的想法是，如果你要访问total从多个线程，请确保以线程安全的方式执行此操作。如果您想检查线程安全性，请暂时打开“Thread Sanitizer”。

如果每个线程上没有足够的工作（例如maxX不是很大，或者在本例中，算法非常快），并行例程的开销可能会开始抵消让多个核心参与计算的好处。所以你可以“跨过”多行y在每次迭代中。例如：

let lock = NSLock()

let stride = maxY / 20
let iterations = Int((Double(height) / Double(stride)).rounded(.up))

DispatchQueue.concurrentPerform(iterations: iterations) { i in
    var subTotal = 0
    let range = i * stride ..< min(maxY, (i + 1) * stride)
    for y in range {
        for x in 0 ..< maxX {
            if ... {
                subTotal += 1
            }
        }
    }

    lock.sync { count += subTotal }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ios

swift

forloop

UIImage

优化 Swift 中的嵌套 for 循环的相关文章

iOS 中系统日期更改后如何更改带有日期的标签？

我有一个简单的查询但不知道该怎么做这就是我想要实现的目标 1 我有一个带有今天日期的 UILabel 即 29 04 12 2 在午夜我希望该标签自行更新为 30 04 12 而无需更改视图或按任何内容这是第2步我不知道该怎么做
定位精度定义 - iOS

iOS 上返回的准确性或不确定性的统计意图是什么即使是近似值例如 Android 文档对其返回的精度数字进行了解释从这个意义上讲它大约是一个标准差我们将准确度定义为 68 置信度的半径换句话说如果您以该位置的纬度和经
Swift 中的 @autoreleasepool 相当于什么？

在 Swift 中我注意到没有 autoreleasepool 构造尽管 Swift 确实使用了 ARC 在 Swift 中管理自动释放池的正确方法是什么或者它是否因某种原因被删除语法如下 autoreleasepool code
为什么允许在 for 循环中使用列表订阅？ [复制]

这个问题在这里已经有答案了 Python 如何接受以下构造 l 1 2 3 4 for i l i in enumerate l print l i 似乎没有任何抱怨愉快地打印出来1 2 3 4 这是如何被允许的以及它到底有什么作用 Th
如何使用群组在 iPhone 和 Apple Watch 之间共享数据？

我是 Watchkit 开发新手无法找到在 iPhone 和 iWatch 之间共享数据的解决方案请帮助我我希望使用组来共享数据我们可以使用组在 iPhone 和 iWatch 之间传递数据基本上iWatch不能做任何处理我们需
SKScene和SKView的paused属性之间的区别

我使用以下代码暂停 SKScene self paused YES 然而根据这个answer https stackoverflow com a 21593852 2043580 by 安德烈戈尔杰耶夫 https stackoverf
在 UITableViewCell 内动态更改标签宽度

我正在尝试建立一个自定义表格视图正如您在图片中看到的我在故事板一侧将标签的宽度默认设置为 160 磅并在加载表格时动态更改宽度我通过修改 cellForRowAtIndexPath 委托方法来实现此目的因此根据日期的长度我设置
如何为所有整数类型创建通用整数到十六进制函数？

我想为所有整数类型创建一个整数到十六进制函数对于1字节的Int8 它返回两个字母例如0A 对于2字节的Int16 它返回四个字母例如0A0B 对于8字节的Int64 它返回16个字母例如0102030405060708 func h
添加 AFNetworking 后出现 APPLE MACH-O 链接错误

只是将 AFNetworking 添加到我的项目中在 B R 后我收到如下错误 Undefined symbols for architecture i386 SecCertificateCopyData referenced from
UIAlertAction 处理程序在延迟后运行

我正在尝试将 UIAlertViews 更改为 UIAlertControllers 我为此设置了这个操作 UIAlertAction undoStopAction UIAlertAction actionWithTitle Undo St
致命错误：在 flutter 中找不到“Flutter/Flutter.h”文件

这是错误在文件中包含来自 Users chetan pub cache hosted pub dartlang org webview flutter 1 0 7 ios Classes JavaScriptChannelHandler
解析迁移到 mLabs 和 Heroku 的错误

我至少一年前将解析数据库迁移到 Mlabs 从那时起我就一直在开发该应用程序解析仪表板表示我已成功迁移 Mlab 和 Parse 都收到了数据库的更新然而在过去一两周内该应用程序不再经过登录页面没有调整代码这是服务器问题以下是
如何使用呼叫目录扩展来识别应用程序中的来电？

我正在研究callKit框架我发现通过使用呼叫目录扩展我们可以识别来电电话号码我的问题是如何在 iOS 应用程序中实现呼叫目录扩展来识别来电详细信息我在 Objective C 工作让一个数 919876xxxxx 使用此方法添加
如何让位置音频在 SceneKit 中工作？

我在使位置音频在 SceneKit 中工作时遇到问题从 Xcode 生成的 SceneKit 游戏模板开始我将以下代码添加到handleTap 方法的末尾 let ship scnView scene rootNode childNod
如何在 iOS 应用程序中检测所有可用的 Wifi 网络并连接到其中之一

在我的 iOS 应用程序中我想检测所有可用的 wifi 网络然后从列表中选择一个网络并连接到它目标是不打开应用程序内置的设置来连接 Wi Fi 而是在我的应用程序中完成这一切首先这可能吗如果可能的话请指出要使用哪些框架和方法
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
UNTimeIntervalNotificationTrigger nextTriggerDate() 是否给出了错误的日期？

我正在更新本地通知以与 iOS 10 配合使用但遇到了一个问题我认为 nextTrigger 函数返回的不是满足触发条件的下一个日期而是返回当前日期时间加上您最初设置 UNTimeInvervalNotificationTrigge
共享扩展程序未出现在能够在 iPhone 上共享照片的应用程序列表中

我正在尝试创建一个共享应用程序扩展并按照以下来源的教程进行操作 http www technetexperts com mobile share extension in ios application overview with exa
使用自定义格式将字符串转换为 NSDate [重复]

这个问题在这里已经有答案了可能的重复 NSString 到 NSDate https stackoverflow com questions 1353081 nsstring to nsdate iPhone 如何将 yyyyMMddTh
GCD 与自定义队列

我想知道这两者的性能有什么区别 dispatch async dispatch get global queue DISPATCH QUEUE PRIORITY HIGH 0 perform complex operation dispat

随机推荐

用 Ninject 拦截。无法加载 IProxyRequestFactory

我正在学习使用 Ninject 和 Interceptor 模式我有以下拦截器 public class MyInterceptor IInterceptor public void Intercept IInvocation invoc
什么是好的头像电子邮件示例？

在 Ember js 文档中看到类似的演示后我刚刚做了一个演示该演示根据您的电子邮件获取您的头像我目前正在使用电子邮件受保护 cdn cgi l email protection作为默认值但这似乎是错误的因为它是一个 React
ruby 的 3D 引擎是什么

我正在寻找用于开发 ruby 游戏的 3D 引擎我发现了一些像 G3Druby 或 ogrerb 的东西哪一个更好用并且功能更好还有其他发动机比这些更好吗两者似乎都是 G3D 和 Ogre 的包装因此您实际上应该比较 G3D 或
使用最小起订量测试对私有方法的调用

我有以下方法需要用最小起订量进行测试问题是 switch 语句中调用的每个方法都是私有的包括最后的 PublishMessage 但这个方法 ProcessMessage 是公共的我如何测试这一点以便确保根据参数进行调用请注意我
如何顺序调用延迟函数？

My code
导航器路线清除 flutter 堆栈

在我的应用程序中我有三个屏幕 loginverifyotp generatepress 我知道如何从一个页面移动到另一页面例如 Navigator pushNamed context theNameOfThePage 我有一个从登录 g
在 iOS 5 上，UIWebView 报告滚动视图的内容大小错误

我已经尝试了很多解决方案但现在我正在尝试计算 UIWebView 的滚动视图的内容大小目前它总是返回 1024 这是设备的宽度这是没有意义的因为我正在查询高度并且视图是纵向的以下代码将高度报告为 1024 00000 void
如何使用带有 stdin 的 wall 命令将消息广播到 python 中的所有 bash 终端？

我想向我的树莓派上的所有 bash 终端广播消息我知道有 wall 命令来执行该步骤我可以使用 os system python 模块来执行该命令但是运行命令 wall text txt 需要 sudo 权限有没有办法将 wall
是否可以在一个文件中写入和读取多个 DataFrame？

我目前正在处理一组具有双标头的类似数据帧它们具有以下结构 age height weight shoe size RHS height weight shoe size 0 8 0 6 0 2 0 1 0 1 8 0 NaN 2 0 1
Ant - 如何运行相同的内容取决于多个目标

有没有办法让 ant 多次执行多个依赖目标考虑一下
Paypal Express Checkout：混合经常性和非经常性项目

我正在开发我们公司的购物车其中包含人们可以订阅或直接购买的产品问题是它应该要求客户在一个订单中添加这两种类型问是否可以告诉 Paypal 将选定的项目收取订阅费用而将其他项目收取一次性费用提前致谢根据高级功能 https ww
SQL Server GROUP BY COUNT 仅连续行

我在 Microsoft SQL Server 2008 R2 上有一个名为 DATA 的表其中包含三个不可为 null 的整数字段 ID 序列和值具有相同 ID 的序列值将是连续的但可以以任何值开头我需要一个查询该查询将返回具有
Laravel 4 中的 Cron 作业

我需要一个 Cron 作业来对网站执行 Scraper 并发送包含信息的电子邮件我创建了一个控制器来执行此操作但是当我设置命令来运行该文件时 php app controllers ScraperController php 我收到这个
使用 Javascript/jQuery 以编程方式关闭 SELECT 下拉列表

我有一个用一个值初始化的下拉列表当用户单击它时单个元素将被删除并添加一个新元素并显示正在加载然后向服务器发出 AJAX 调用返回时新值将添加到控件中问题是该控件在更新时保持打开状态我想将其关闭这是一个例子 http j
为什么 Active Directory 不向我返回 PagedResultsResponseControl？

我正在尝试从 Java 枚举 Active Directory 中的所有组有很多所以我得到了SizeLimitExceededException1000 个结果后我正在尝试使用PagedResultsControl 我的代码非常接近地
在 Facebook Graph API 中，获取用户电子邮件地址和性别的 API 调用是什么？

我在以下链接的帮助下使用 Graph API 和 Facebook SDK for PHP https developers facebook com docs php howto profilewithgraphapi 4 0 0 htt
加载 XGBoost 模型：ModuleNotFoundError：没有名为“sklearn.preprocessing._label”的模块

我在使用以下代码加载预训练的 xgboost 模型时遇到问题 xgb model pickle load open churnfinalunscaled pickle dat rb 当我这样做时我收到以下错误 ModuleNotFound
聊天中的 Python 客户端

我在尝试构建聊天客户端时遇到问题我刚刚开始这是我的代码 import socket my socket socket socket socket AF INET socket SOCK STREAM my socket connect
NetLogo 高效创建任意度数分布的网络

这是一个后续问题NetLogo 创建固定数量链接的有效方法 https stackoverflow com questions 32967388 netlogo efficient way to create fixed number of
优化 Swift 中的嵌套 for 循环

我得到了这个方法来计算白色像素UIImage 我需要遍历所有像素来增加我找到的每个白色像素的计数器我正在尝试提高它的性能但我找不到更好的方法有任何想法吗 func whitePixelCount gt Int let width In

优化 Swift 中的嵌套 for 循环

优化 Swift 中的嵌套 for 循环 的相关文章

随机推荐

热门标签

优化 Swift 中的嵌套 for 循环的相关文章