Caffe 中的批处理模式 - 没有性能提升

2024-01-12

继这个线程 https://stackoverflow.com/q/32504394/1103412我重新实现了图像处理代码，以便一次发送 10 张图像（即我现在将输入 blob 的 num 属性设置为 100 而不是 10）。

然而，处理这批货所需的时间比原来多了10倍。这意味着我没有得到任何性能提升。

这是合理的还是我做错了什么？

我在 CPU 模式下运行 Caffe。不幸的是 GPU 模式不适合我。

更新：Caffe 现在原生支持使用多个 GPU 时并行处理多个图像。虽然基于当前的 GPU 并行实现看起来相对简单，但目前还没有对多个 CPU 上并行处理的类似支持。

考虑到实现并行性的主要问题是训练期间所需的同步如果您只想并行处理图像（而不是训练模型），那么您可以将同一网络的多个副本加载到内存中（无论是通过 python使用多处理或带有多线程的 C++），并在不同的网络上处理每个图像。这将是简单且非常有效的，特别是如果您加载一次网络然后只处理大量图像。尽管如此，GPU 的速度要快得多:)

Caffe 不会并行处理多个图像，通过批处理多个图像获得的唯一节省是在 Caffe 框架之间来回传输图像数据所需的时间，这在处理 GPU 时可能非常重要。

IIRC 有几种尝试让 Caffe 并行处理图像，但大多数都集中在 GPU 实现（CUDNN、CUDA Streams 等）上，很少尝试向 CPU 代码添加并行性（OpenBLAS 的多线程模式，或者简单地在多个线程上运行））。其中我相信目前只有 CUDNN 选项是 Caffe 稳定版本的一部分，但显然需要 GPU。您可以尝试在 Caffe 的 github 页面上查看有关此事的拉取请求之一，看看它是否适合您，但请注意，它可能会导致与您当前版本的兼容性问题。

这是我过去使用过的一个版本，尽管它不再维护：https://github.com/BVLC/caffe/pull/439 https://github.com/BVLC/caffe/pull/439

我还注意到在上述问题的最后评论中，此拉取请求上的 CPU 代码也有一些速度提升，尽管我自己从未尝试过：https://github.com/BVLC/caffe/pull/2610 https://github.com/BVLC/caffe/pull/2610

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Caffe 中的批处理模式 - 没有性能提升的相关文章

如何使用 VS2022 中的新控制台应用程序模板访问命令行参数

我想知道如何访问命令行参数因为这是在Program cs通过 Visual Studio 2022 中控制台应用程序的新模板创建文件 See https aka ms new console template for more infor
沿着长数据序列在固定大小的移动窗口中查找中值

给定一个数据序列可能有重复项一个固定大小的移动窗口从数据开始处每次迭代时移动窗口序列使得 1 从窗口中删除最旧的数据元素并添加新数据元素被推入窗口 2 求每次移动时窗口内数据的中位数以下帖子没有帮助有效地找到随机序列的中值
如何在Qt中更快地读取数据？

Qt读取数据库比C 慢吗我想我错过了一些东西为了比较阅读速度我在 Qt 中编写了以下内容 QElapsedTimer t t start int count 0 QString cs Driver SQL Server Server
MSVC10 /MP 在项目中跨文件夹构建非多核

我希望有人指出我们所遇到的错误或解决方法使用 MP 编译项目时似乎仅同时编译同一文件夹中的文件我使用进程资源管理器来滑动命令行并确认行为项目过滤器似乎对同时编译的内容没有影响项目结构disk Folder project vcxp
使用 pthread_cond_signal 优雅地终止线程被证明是有问题的

我需要发射一堆线程并希望优雅地将它们拉下来我正在尝试使用pthread cond signal pthread cond wait实现这一目标但遇到了问题这是我的代码首先是thread main static void thrma
是否返回 std::move (x)？

Are std vector
使用 Process.Start() 打开文件夹时访问被拒绝异常

我有一个 C 中的 winforms 应用程序我必须在其中打开某个文件夹我用 System Diagnostics Process Start pathToFolder 这会导致以下异常 System ComponentModel Wi
memccpy 返回比 src 起始地址更低的内存地址

我有一个学校项目我必须重新编码memccpy 功能我使用 2 个程序来检查我的代码是否正常工作第一个是只有一个主程序的小程序第二个程序是另一个学生开发的可以找到here https github com yyang42 mouli
为什么Windsor只能拦截虚方法或接口方法？

我正在阅读文档发现如果不使用接口那么 Windsor 只能拦截虚拟方法这是 Windsor 的限制还是 C 语言的限制我正在寻找深入的答案 C 语言在这里完全无关问题是拦截在运行时级别如何工作一种技术是从类继承实现接口并将其用
在 C++ 中初始化指针

可以在声明时将指针分配给值吗像这样的东西 int p 1000 是的您可以在声明时初始化指向值的指针但是您不能这样做 int p 1000 是个地址运算符并且您不能将其应用于常量尽管如果可以那会很有趣尝试使用另一个变量 int
为什么我从 c# 到 js 得到不同的 MD5 哈希值？

我有一个用于加密密码的 C 函数 System Security Cryptography MD5CryptoServiceProvider md5Provider new System Security Cryptography MD5C
函数中的重复参数检查

我经常有调用层次结构因为所有方法都需要相同的参数如果我不想将它们放在实例级别类的成员那么我总是问我在每个方法中检查它们的有效性是否有意义例如 public void MethodA object o if null o throw
如何从 Function App 设置会话 ID 或创建自定义字段到 Application Insights

功能应用程序如下 public static async Task
如何在 C 预处理器中可靠地检测 Mac OS X、iOS、Linux、Windows？ [复制]

这个问题在这里已经有答案了如果有一些跨平台 C C 代码需要在 Mac OS X iOS Linux Windows 上编译我如何在预处理器过程中可靠地检测到它们大多数编译器都使用预定义的宏您可以找到列表here http sour
Xamarin.Android JmDNS 绑定问题

我开始研究 Xamarin Android 的 JmDNS 绑定我设法构建了绑定但无法从代码中引用它 https github com ytn3rd monodroid bindings tree master JmDNS https
C# 或 Windows 相当于 OS X 的 Core Data？

我迟到了现在才开始在 OS X Cocoa 中使用 Core Data 它令人难以置信并且确实改变了我看待事物的方式 C 或现代 Windows 框架中是否有等效的技术即拥有可免费保存数据管理删除搜索的托管数据类型还想知道Li
不兼容的指针到字符转换

我正在编写一个程序将卡片值写入 52 个点字符的多维数组中该程序是一个测试数组稍后我将其作为函数写入主程序中在程序中我通过以下方式初始化 for 循环计数0通过51 我用一个switch语句调制13将卡牌值分配给数组点但是我收
您的 C++ 程序中是否仍然存在内存分配失败问题 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在为公司写一些指导方针我需要回答一些棘手的问题这一项是相当困难的解决方案可以是根本不跟踪确保使用 new 分配对象这会在分配失败
C++ 项目编译为静态库，编译为动态库失败（链接器错误）。为什么？

我有一个 VS2008 本机 C 项目我希望将其编译为 DLL 它仅引用一个外部库 log4cplus lib 并使用其功能当然也使用 log4cplus 的 h 文件当我尝试将我的项目编译为静态库时它成功了当我尝试作为 DLL
如何正确地将十六进制转义添加到字符串文字中？

当你有C语言的字符串时你可以在里面直接添加十六进制代码 char str abcde a b c d e 0x00 char str2 abc x12 x34 a b c 0x12 0x34 0x00 这两个示例在内存中都有 6 个字节

随机推荐

使用 JavaScript 绘制超过 10 万个节点的组织结构图的最佳方法

谁能建议我如何绘制超过 100k 个节点的组织结构图而不会遇到浏览器崩溃或无响应页面错误的问题注意它是二叉树图表因此每个父节点只有两个子节点到目前为止我已经做了什么 1 使用 google Charts API 绘制图表失败即
在 HashMap 中存储带有引用 arg 的未装箱闭包

我正在尝试将闭包存储为 HashMap 值如果我按值传递闭包参数一切都会很好 use std collections hash map HashMap fn main let mut cmds HashMap
使用 Apache Commons VFS 进行 SFTP 上传时出现空指针异常

我有使用 SFTP 将文件上传到远程服务器的代码我正在使用 Kotlin Java 和 Apache commons 库 val manager StandardFileSystemManager manager init val tem
在 Windows 上通过批处理文件进行 git 提交和推送

我经常执行相同的任务将更改提交并推送到远程分支有时因为懒惰我需要放置一组 git 命令来自动执行这些步骤 cd D wamp www projectName git checkout dev git add git commit am
使用动态基址的 Refit Client

我正在使用 Refit 在 asp net core 2 2 中使用类型化客户端调用 API 该客户端当前使用配置选项中的单个 BaseAddress 进行引导 services AddRefitClient
$_POST 不起作用。 “注意：未定义索引：用户名...”[重复]

这个问题在这里已经有答案了可能的重复 PHP 注意未定义的变量和注意未定义的索引 https stackoverflow com questions 4261133 php notice undefined variable an
如何通过应用程序更新设备上的 Android 操作系统

检查市场 Playstore 中是否有更新的 Android 版本后有没有办法通过应用程序使用 Android API 或任何其他 API 更新 Android 操作系统这里需要支持的用例如下应用程序启动并检查已安装的Android
使用 active-model-serializers 侧载 JSON 作为可标记标签时出错

在 Ruby 2 Rails 4 应用程序中我尝试将acts as taggable on 与active model serializers 结合使用以创建一个JSON API 该API 将输出我的标签以及其他模型参数首先是这个问题
CLEditor动态添加文本

我在用着CLEditor http premiumsoftware net cleditor docs GettingStarted html optionalParameters对于我正在开发的网站我正在尝试使用 jQuery 将动态文
我可以在 C++11 中拥有具有值语义的多态容器吗？

这是一个续集相关帖子 https stackoverflow com questions 41045 can i have polymorphic containers with value semantics in c这提出了一个永恒的问
Rails 5 SQL 注入

我已经在各种 SO 线程指南等上读到这个问题有一段时间了但所有答案都是相互冲突和矛盾的似乎有很多类似的方法而且很多答案都说使用不同的方法 sanitize sanitize conditions sanitize sql sanit
使用异步 NSURLConnection 中的数据填充 NSImage

我在尝试弄清楚如何使用从我的桌面应用程序不是 iPhone 应用程序中的异步 NSURLConnection 返回的数据填充 NSImage 时遇到了困难情况是这样的我有一个使用自定义单元格的表格每个自定义单元格中都有一个从 We
jQuery 淡入事件？

当元素淡入时使用 jQuery 是否可以获得某种事件通知 IE 如果有淡入事件我会尝试类似的事情 elements delegate selector fadeInEvent function alert someId has fade
TypeScript 无法识别我的笑话模拟模块

假设我有一个index ts这将导入Database ts并运行一些查询为了测试这个index ts文件我想模拟Database ts因为我不想连接到任何真实的数据库这是我的index ts import connect from D
更改 Windows DLL 加载顺序？（加载顺序，不是搜索顺序）

假设我有一个可执行文件 app exe 我在此可执行文件中使用 2 个不同的第 3 方 DLL foo dll bar dll并且应用程序必须隐式链接到这些 DLL 也就是说我不能使用 LoadLibrary加载它们注并不是说我不能打电
SQL Server - 是否有一种排序规则可以提供数字的自然顺序？

我正在使用 SQL Server 2008 我有一个带有 type 列的表VarChar 它当前填充了实际代表数字的字符串不幸的是该列必须保留VarChar 1 2 1000 我希望查询该字段的最大数值但由于这是一个VarChar我得
使用属性过滤 Django-sphinx 结果？

我正在经历 django sphinx文档 http code google com p django sphinx 看起来它允许您使用过滤搜索结果属性 queryset MyModel search query query results
Spring boot数据jpa多个数据源entityManagerFactory错误

我想在 Spring Boot 中使用两个数据库这里是代码第一个数据库配置 Configuration EnableAutoConfiguration EnableJpaRepositories basePackages net ely
php echo 输出顺序变化

希望这是一个简单的修复出于某种原因当我运行它时我正在运行 WordPress 并使用高级自定义字段插件 echo Tickets Start at CA the field price 我得到这个输出 50Tickets Start
Caffe 中的批处理模式 - 没有性能提升

继这个线程 https stackoverflow com q 32504394 1103412我重新实现了图像处理代码以便一次发送 10 张图像即我现在将输入 blob 的 num 属性设置为 100 而不是 10 然而处理这批货所

Caffe 中的批处理模式 - 没有性能提升

Caffe 中的批处理模式 - 没有性能提升 的相关文章

随机推荐

热门标签

Caffe 中的批处理模式 - 没有性能提升的相关文章