GoogLeNet 模型的微调

2024-02-11

我从头开始训练 GoogLeNet 模型。但它并没有给我带来有希望的结果。
作为替代方案，我想在我的数据集上对 GoogLeNet 模型进行微调。有谁知道我应该遵循什么步骤？

假设您正在尝试进行图像分类。这些应该是微调模型的步骤：

1.分类层

原本的分类层"loss3/classifier" https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/train_val.prototxt输出 1000 个类别的预测（它是mum_output设置为 1000)。您需要用适当的新图层替换它num_output。替换分类层：

更改图层的名称（这样当您从caffemodel文件中读取原始权重时，就不会与该图层的权重发生冲突）。
Change num_output您尝试预测的正确数量的输出类。
请注意，您需要更改所有分类层。通常只有一个，但 GoogLeNet 恰好有三个："loss1/classifier" https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/train_val.prototxt#L904, "loss2/classifier" https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/train_val.prototxt#L1667 and "loss3/classifier" https://github.com/BVLC/caffe/blob/master/models/bvlc_googlenet/train_val.prototxt.

2. Data

您需要使用要微调的新标签创建一个新的训练数据集。例如，参见这个帖子 https://stackoverflow.com/a/31431716/1714410关于如何制作 lmdb 数据集。

3. 您想要多大程度的微调？

微调模型时，您可以训练所有模型的权重，也可以选择固定一些权重（通常是较低/较深层的过滤器）并仅训练最顶层的权重。这个选择取决于您，通常取决于可用的训练数据量（您拥有的示例越多，您可以微调的权重就越多）。
每层（保存可训练参数）都有param { lr_mult: XX }。该系数决定了这些权重对 SGD 更新的敏感程度。环境param { lr_mult: 0 }意味着你固定了这一层的权重，它们在训练过程中不会改变。
编辑你的train_val.prototxt因此。

4.运行咖啡

Run caffe train但为其提供 caffemodel 权重作为初始权重：

~$ $CAFFE_ROOT/build/tools/caffe train -solver /path/to/solver.ptototxt -weights /path/to/orig_googlenet_weights.caffemodel

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

deeplearning

ComputerVision

convneuralnetwork

caffe

GoogLeNet 模型的微调的相关文章

如何在opencv python中为图像添加边框

如果我有如下图所示的图像如何在图像周围添加边框以便最终图像的整体高度和宽度增加但原始图像的高度和宽度保持在中间下面的代码添加了一个大小恒定的边框10像素到原始图像的所有四个边对于颜色我假设您想要使用背景的平均灰度值这是我根据图
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
Python 上每个系数具有特定约束的多元线性回归

我目前正在数据集上运行多元线性回归起初我没有意识到我需要限制自己的体重事实上我需要有特定的正权重和负权重更准确地说我正在做一个评分系统这就是为什么我的一些变量应该对音符产生积极或消极的影响然而当运行我的模型时结果不符合我
如何组织循环神经网络？

我想模拟以下内容 y t F x t 1 x t 2 x t k 或者说一个函数其当前输出取决于最后 k 个输入 1 我知道一种方法是使用一个经典的神经网络其中 k 个输入为 x t 1 x t 2 x t k 对于每个y t 并训练它
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
指纹奇异点检测

我正在尝试确定指纹的核心点和增量点我正在使用庞加莱指数方法但我无法成功检测到这一点而且我不明白为什么 First I divide the image in 15x15 blocks then I calculate the x an
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
Java 的支持向量机？

我想用Java编写一个智能监视器它可以随时发出警报detects即将到来的性能问题我的 Java 应用程序正在以结构化格式将数据写入日志文件
神经网络不能立即重现？

通过使用反向传播导数弹性的前馈神经网络中的随机权重初始化误差图上的初始位置位于某个随机谷的顶部该随机谷可能是也可能不是局部最小值可以使用方法来克服局部最小值但假设这些方法没有被使用或者在给定的地形上不能很好地工作那么神经网络
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另

随机推荐

Java 运行时 ClassNotFoundException

只是有一个关于我遇到的奇怪的运行时错误的问题我正在使用一个 JSON 服务器当外部源提示时该服务器会响应 JSON 对象然而到目前为止我只是尝试在发送 JSON 对象之前启动并运行它我的代码编译时没有指定任何类路径但是当涉及
Java 8 forEach 带索引[重复]

这个问题在这里已经有答案了有没有办法建立一个forEachJava 8 中使用索引迭代的方法理想情况下我想要这样的东西 params forEach idx e gt query bind idx e 我现在能做的最好的事情就是 int
MySQL 5.7 无法匹配两个汉字

表TB title keywords 企业贷款该如何看懂银行流水出口退税贷款现金流量表利润表最高人民法院关于审理民间企业贷款合同法贷款中国宏观经济数据点评企业贷款贷款 ngram token size 2 FULLT
iOS Swift didBeginContact 没有被调用

这两天我一直在努力让两个SKSpriteNode注册碰撞并唤起didBegin contact 我已经设置了他们的位掩码 categoryBitMask contactTestBitMask and collisionTestBitMask
在子文件夹中运行的 Angular 7 中的路由无法正常工作

我们正在努力将我们的应用程序迁移到新的 Angular 版本旧的 Angular JS 是它自己的应用程序存储库由 NET Framework 4 5 2 ASP NET MVC 应用程序提供服务该应用程序会将每个调用路由到Home
Python：我尝试使用 tabula：ModuleNotFoundError：没有名为“tabula”的模块

我尝试使用 python 模块 tabula 但显然我已经安装失败了我只是使用了代码 import tabula 但是我收到以下错误消息 ModuleNotFoundError No module named tabula 有什么想法吗
带有 ExtJS 4 存储的 HTTP 标头

我已经实例化了几家商店但在某个时刻我会在所有这些中添加一个 HTTP 标头我怎样才能用 ExtJS 4 做到这一点假设您使用的是 ajax 代理您可以更新headers http docs sencha com ext js 4
（使用 SSH 运行命令时出错）命令行：第 0 行：配置选项错误

错误消息命令行第 0 行错误的配置选项 sh ssh i rundeck rsa key o StrictHostKeyChecking no o email protected cdn cgi l email protection
window.onbeforeunload - 在 Angular2 中导入

我正在尝试使用window onbeforeunload在我的项目中但我不知道如何使用它我尝试过两种方式 1st way window on beforeunload function e return Are you sure you
重定向到屏幕和管道

我想将一些输出传输到另一个程序并显示进度条代码看起来像这样 echo Progress for i in 1 10 do echo i echo gt screen sleep 1 done xargs echo where screen
如何使用 pip 进行 pyenv？

我在 Mac 上安装了 pyenv 来管理不同的 python 版本之前我有系统默认的 python 2 7 位于 Library Frameworks Python framework Versions 2 7 我还有 python3
SW2 更新后如何修复索尼 SmartWatch 2 上的自定义表盘时间 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案背景索尼于 2014 年 12 月发布了索尼 SmartWatch 2 的更新虽然更新为手表添加了新功能但不幸的是它导致了自定义表盘
Proguard 使 Android 应用程序中的 R 类反射不再起作用

自从我尝试在 Google Play 上发布它以来我已经在我的项目中激活了 proguard 尽管 proguard android txt 有 keepclassmembers class R public static
这个错误在nhibernate中意味着什么

出乎意料的是我在使用 nhibernate 进行大量更新时遇到了此错误行已被另一个事务更新或删除或未保存值映射不正确 MyDomainObject 错误中没有附加信息是否有一些推荐的方法来帮助识别根本问题或者有人可以给我一个更好的
使用 FFMPEG 的 PHP HTML5 兼容 MP4 视频

您好我正在使用 FFMPEG 用 PHP 转换上传的视频 echo conversion exercise started br br looping through all files in the directory if handl
循环访问使用 xalan:nodeset 获取的节点集时，xsl:key 不起作用

我发现 xsl key 似乎不起作用的情况我正在将 XSLT 1 与 Xalan 已编译一起使用这就是发生的情况 1 这有效密钥名为test1工作正常
Django 在模板之外人性化？

我知道我可以使用 humanize 模块将日期时间转换为 django 模板中更友好的格式我想知道是否可以在模板之外转换这些内容例如在一个views py函数或models py类意思是在 django 模板之外还有其他库可以做到
填充组中其他行的缺失值（包括重复项）

我有一个数据集其中有一些缺失值我想用同一组的其他成员来填充这些值但是在某些情况下每组有多个值在这些情况下我希望复制每组中的所有行以形成包含每个值的一行样本数据 ID group value 1 1 A blue 2 2 A
Java Thread.stop() 与 Thread.interrupt()

我有以下代码 renderThread new Thread new Runnable Override public void run for int i 0 i lt 10000000 i System out println Numb
GoogLeNet 模型的微调

我从头开始训练 GoogLeNet 模型但它并没有给我带来有希望的结果作为替代方案我想在我的数据集上对 GoogLeNet 模型进行微调有谁知道我应该遵循什么步骤假设您正在尝试进行图像分类这些应该是微调模型的步骤 1 分类层原

热门标签