咖啡 | solver.prototxt值设置策略

2023-12-09

在 Caffe 上，我正在尝试实现一个用于语义分割的全卷积网络。我想知道是否有一个具体的策略来设置你的'solver.prototxt'以下超参数的值：

测试迭代器
测试间隔
迭代大小
max_iter

这是否取决于您的训练集的图像数量？如果是这样，怎么办？

为了以有意义的方式设置这些值，您需要更多有关数据的信息：

1. 训练集大小您拥有的训练示例总数，我们称之为数量T.
2. 训练批量大小在单个批次中一起处理的训练示例的数量，这通常由输入数据层中的设置'train_val.prototxt'。例如，在这个文件训练批量大小设置为 256。让我们将这个数量表示为tb.
3. 验证集大小您为验证模型而预留的示例总数，让我们将其表示为V.
4. 验证批量大小值设置在batch_size用于测试阶段。在这个例子它被设置为 50。我们称之为vb.

现在，在训练期间，您希望每隔一段时间就获得对网络性能的无偏估计。为此，您需要在验证集上运行网络test_iter迭代。要覆盖整个验证集，您需要有test_iter = V/vb.
您希望多久获得一次此估算？这真的取决于你。如果您有一个非常大的验证集和一个缓慢的网络，验证太频繁会使训练过程太长。另一方面，验证不够频繁可能会导致您无法注意到训练过程是否以及何时未能收敛。test_interval确定您验证的频率：通常针对您设置的大型网络test_interval在 5K 左右，对于更小更快的网络，您可以选择更低的值。再说一次，一切都取决于你。

为了覆盖整个训练集（完成一个“纪元”），您需要运行T/tb迭代。通常一个人会训练几个时期，因此max_iter=#epochs*T/tb.

关于iter_size：这允许在多个训练小批量上平均梯度，请参阅这个线程了解更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

咖啡 | solver.prototxt值设置策略的相关文章

libsvm 收缩启发法

我在 C SVC 模式下使用 libsvm 和 2 次多项式内核并且需要训练多个 SVM 在训练期间我训练的一些 SVM 会收到以下一个或什至两个警告 WARNING using h 0 may be faster WARNING re
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection
为什么我的结果仍然无法重现？

我想要为 CNN 获得可重复的结果我使用带有 GPU 的 Keras 和 Google Colab 除了建议插入某些代码片段这应该允许再现性之外我还在层中添加了种子 This is the first code snipped to
sklearn LogisticRegressionCV 是否使用最终模型的所有数据

我想知道sklearn中LogisticRegressionCV的最终模型即决策边界是如何计算的假设我有一些 Xdata 和 ylabels Xdata shape of this is n samples n features yl
使用反向传播算法实现感知器

我正在尝试实现一个具有反向传播的两层感知器来解决奇偶校验问题该网络有 4 个二进制输入第一层有 4 个隐藏单元第二层有 1 个输出我在用this http page mi fu berlin de rojas neural chap
如何使用 AdaBoost 进行特征选择？

我想使用 AdaBoost 从大量 100k 中选择一组好的特征 AdaBoost 的工作原理是迭代功能集并根据功能的执行情况添加功能它选择对现有特征集错误分类的样本表现良好的特征我目前正在 Open CV 中使用CvBoost 我得到
卷积 ImageNet 网络对于翻转图像具有不变性

我正在使用深度学习 caffe 框架进行图像分类我有一些有头像的硬币有些是左向的有些是右向的为了对它们进行分类我使用常见的方法从预训练的 ImageNet 网络中获取权重和结构该网络已经捕获了大量图像模式并主要训练最后一层以
大于 2GB 的 Tensorflow 图

我正在尝试优化一个大型张量流保存模型其中包含 10MB saving model pb 和 16GB 变量我尝试冻结我的图表并进行一些进一步的转换我已按照步骤操作https medium com google cloud optimi
混合 SOM（带 MLP）

有人可以提供一些有关如何正确地将自组织映射与多层感知器结合起来的信息吗我最近读了一些关于这种技术的文章与常规 MLP 相比它在预测任务中表现得更好因此我想使用 SOM 作为前端通过对输入数据进行聚类来降维并将结果传递到 MLP
Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
Caffe 多输入图像

我正在考虑实现一个 Caffe CNN 它接受两个输入图像和一个标签后来可能是其他数据并且想知道是否有人知道 prototxt 文件中执行此操作的正确语法它只是一个带有额外顶部的 IMAGE DATA 层吗或者我应该为每个层使用单独
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
Mobilenet 与 SSD [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案
sigmoid激活函数可以用来解决Keras中的回归问题吗？

我已经用 R 实现了简单的神经网络但这是我第一次用 Keras 实现所以希望得到一些建议我在 Keras 中开发了一个神经网络函数来预测汽车销量数据集可用here https github com allmydatasets dat
使用 keras 澄清 Yolo v3 模型输出

我将 yolo v3 模型与 keras 一起使用该网络为我提供了形状如下的输出容器 1 13 13 255 1 26 26 255 1 52 52 255 所以我找到了这个link https www cyberailab com ho
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2

随机推荐

将actionListener添加到jCalendar

如何将 actionListener 添加到使用 netbeans 放置的现有 jCalendar 的 jDayChooser 组件我只想仅在单击日期按钮时触发事件因为 jCalendar 中的 propertyChange 甚至会监听
Android 不同分辨率的布局

我希望为各种屏幕分辨率创建各种布局例如hdpi xhdpi etc 我读了here关于我怎样才能做到这一点所以我创建了两个目录layout xlarge and layout large in my res目录并放置xml那里的布局我
受密码保护的 UITextField 上的大写锁定图像

我正在创建一个需要使用 USB 键盘的应用程序普通触摸屏键盘已被禁用不会显示当用户第一次安装该应用程序时他们需要创建一个四位数的 Pin 图 Pin 的输入字段受密码保护每次输入新数字时都会出现点 Pin UITextField
每周/每月查询的 SQL 请求，即使不存在记录

我正在使用 MySQL 我很难获得每月的计数包括没有记录的月份这是我的表 Plays idplay idplayer day 1 26 17 11 2015 2 37 22 12 2015 3 65 24 04 2016 4 12 16
在 PHP 中调整图像大小的智能方法[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我想知道是否有人可以帮助我
有这样的RTSP Ping吗？

我目前正在开发一个 WinForm 应用程序使用 C 中的 RTSP 协议从 IP 摄像机流式传输视频一切都很好该应用程序的部分要求包括检查网络摄像机是否在线的功能因此我使用 System Net NetworkInformati
《Head First Design Patterns》一书中的接口与接口关联

这本书首先设计模式将以下 UML 作为观察者模式的示例这张图中让我印象深刻的是之间的关联关系Subject and Observer接口据我了解Java接口它们不能以这种方式实现 Has a 关系当我查看几页后提供的实现示例时我发
如何在Python中对嵌套列表的外部和内部子列表进行排序？

首先如果这太天真我深表歉意我是初学者我有以下类型的列表列表我想首先按内部列表的最后一个成员按升序排序 data 1 45 0 2 49 2 3 98 0 4 82 1 5 77 1 6 98 2 我通过使用以下方法来实现此目的 s
具有不同内容的跨路由的通用组件

我有一个名为Header它存在于所有路线中而应用程序的其余部分则发生变化为了实现这一点我的主要渲染代码如下所示使用 ES6 render return div div
如何检查用户是否登录

我创建了一个登录页面用户必须提供用户名和密码才能访问某些特定资源他们可以在其中上传图像或者只是编辑一些有关自己的描述我的 web config 文件如下所示
php：获取ip地址

我想获取访客的IP地址你能告诉我什么元素吗 SERVER 我应该使用 SERVER HTTP CLIENT IP SERVER HTTP X FORWARDED FOR or SERVER REMOTE ADDR UPDATE 如果您的客
Xcode 4 中的这些图标代表什么？

我以前从未见过这些但是文件浏览器中文件名旁边的小 A 和 M 是做什么用的让我根据SVN的知识猜测一下 A gt 新添加的文件 M gt 修改现有文件
如何在 Titanium JS 中创建带有按钮的标题栏？

我在用着钛合金构建一个应用程序我尝试创建一个带有按钮的标题栏类似于联系人应用程序如下图所示该标题的标题位于中间按钮位于任一站点我一直在到处寻找一种在钛中做到这一点的方法但我还没有找到任何东西文档中似乎没有这个内容我需要创建
如何在配置单元中保留驼峰式大小写的列名

选择 12345 作为 EmpId 输出是 empid 值为 12345 有任何线索可以保持与 EmpId 相同的列名吗不可能这是 HIVE 元存储的限制它以全小写形式存储表的模式 Hive 使用此方法来标准化列名称请参阅表 jav
内部访问修饰符与私有访问修饰符

两者有什么区别internal and privateC 中的访问修饰符 internal适用于程序集范围即只能从同一 exe 或 dll 中的代码访问 private适用于类范围即只能从同一类中的代码访问
为什么char数据的地址不显示？

class Address int i char b string c public void showMap void void Address showMap void cout lt lt address of int lt lt i
没有 Web 服务器的 Spring Boot

我有一个简单的 Spring Boot 应用程序它从 JMS 队列获取消息并将一些数据保存到日志文件中但不需要 Web 服务器有没有办法在没有Web服务器的情况下启动Spring Boot 春季启动 2 x 3 x 应用程序属性 sp
Laravel 4 不刷新

我在 laravel 4 中遇到一个奇怪的问题因为每次我尝试刷新页面时都不会出现更改肯定不是浏览器的缓存任何帮助表示赞赏我遇到了同样的问题并找到了答案尝试在 php ini 中禁用 OPcache 如果您使用MAMP 可以在 Ap
隐藏已编译应用程序可执行代码的实践

反编译和逆向工程 net 程序集是一种标准做法我想发布一些将添加到现有应用程序的插件程序集但我不希望它们被其他人使用有哪些方法可以隐藏这些程序集的来源除非控制目标硬件否则理论上不可能实现 100 的保护如果 CPU 能够执行它
咖啡 | solver.prototxt值设置策略

在 Caffe 上我正在尝试实现一个用于语义分割的全卷积网络我想知道是否有一个具体的策略来设置你的 solver prototxt 以下超参数的值测试迭代器测试间隔迭代大小 max iter 这是否取决于您的训练集的图像数量如果

咖啡 | solver.prototxt值设置策略

咖啡 | solver.prototxt值设置策略 的相关文章

随机推荐

热门标签

咖啡 | solver.prototxt值设置策略的相关文章