如何在 CAFFE 的新网络中重复使用同一网络两次

2024-04-10

我有一个预训练的网络（我们称之为N）我想在新网络中使用两次。有人知道如何复制吗？然后我想为每个副本分配不同的学习率。

例如（N1是第一个副本N, N2是第二个副本N），新网络可能如下所示：

N1 --> [joint ip 
N2 -->    layer]

我知道如何重复利用N然而，只有一个副本，因为N1 and N2将有不同的（微调）学习率，我不知道如何制作 2 个副本N并为每个分配不同的学习率。

Thanks!

使用同一个网络两次称为《连体网》 http://caffe.berkeleyvision.org/gathered/examples/siamese.html。它在 caffe 中的实现方式是显式复制网络，但使用"name"param 为每个参数 blob 创建一个single基础参数的副本。看例如这个prototxt https://github.com/BVLC/caffe/blob/master/examples/siamese/mnist_siamese_train_test.prototxt.
一旦明确定义网络两次，您就可以分配不同的"lr_mult"每个副本的参数。

所以假设你的参考网络N有一个输入层（我将在本例中跳过）和一个名为的内积层"ip1". Then

 layer {
   name: "ip1_a"
   bottom: "data_a"
   top: "ip1_a"
   type: "InnerProduct"
   inner_product_param {
     num_output: 10
   }
   param {
     name: "ip1_w"  # NOTE THIS NAME!
     lr_mult: 1
   }
   param {
     name: "ip1_b"
     lr_mult: 2
   }
 }
 layer {
   name: "ip1_b"
   bottom: "data_b"
   top: "ip1_b"
   type: "InnerProduct"
   inner_product_param {
     num_output: 10
   }
   param {
     name: "ip1_w"  # NOTE THIS NAME: it's the same!
     lr_mult: 10 # different LR for this branch
   }
   param {
     name: "ip1_b"
     lr_mult: 20
   }
 }
 # one layer to combine them     
 layer {
   type: "Concat"
   bottom: "ip1_a"
   bottom: "ip1_b"
   top: "ip1_combine"
   name: "concat"
 }
 layer {
   name: "joint_ip"
   type: "InnerProduct"
   bottom: "ip1_combine"
   top: "joint_ip"
   inner_product_param {
     num_output: 30
   }
 }

如果您进行微调，您可能需要进行一些网络手术，以便将原始权重保存在.caffemodel包含名称的文件"ip1_w" and "ip1_b".

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

deeplearning

caffe

如何在 CAFFE 的新网络中重复使用同一网络两次的相关文章

Keras 文本预处理 - 将 Tokenizer 对象保存到文件中以进行评分

我按照以下步骤大致使用 Keras 库训练了一个情感分类器模型使用 Tokenizer 对象类将文本语料库转换为序列使用 model fit 方法构建模型评估这个模型现在为了使用此模型进行评分我可以将模型保存到文件中并从文
YOLO 目标检测：算法如何预测大于网格单元的边界框？

我试图更好地理解 YOLO2 和 3 算法的工作原理该算法处理一系列卷积直到达到13x13网格然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类如果您查看这张图片您会发现红色边框比任何单个网格单元都大边界框也以对象的
为什么我的 keras LSTM 模型陷入无限循环？

我正在尝试构建一个小型 LSTM 它可以通过在现有 Python 代码上进行训练来学习编写代码即使是垃圾代码我已将数百个文件中的数千行代码连接到一个文件中每个文件以
反向传播实现问题

我应该做什么我有一个黑白图像 100x100px 我应该训练一个反向传播 http en wikipedia org wiki Backpropagation神经网络与该图像输入是图像的 x y 坐标从 0 到 99 输出是 1 白色
tensorflow conv2d偶数步长和奇数步长之间的不同起始索引

据我了解从tf nn conv2d 文档 https www tensorflow org api docs python tf nn conv2d对于相同的卷积无论步幅如何第一个点积应以 0 0 为中心正如您在下面看到的当步幅为奇
Tensorflow：如何查看张量板中的检查点？

假设我有内容检查点 checkpoint model ckpt 240000 data 00000 of 00001 model ckpt 240000 index model ckpt 240000 meta 是否可以在张量板中查看检查点
液态状态机：它是如何工作的以及如何使用它？

我现在正在学习LSM 液态状态机我试图了解它们到底是如何用于学习的我对在网上读到的内容感到非常困惑我将写出到目前为止我所理解的内容但这可能是不正确的所以如果您能纠正我并解释什么是正确的我会很高兴 LSM 根本没有经过训练它们只
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
Keras：模型准确率在达到 99% 准确率后下降，损失为 0.01

我正在 keras 中使用改编的 LeNet 模型来进行二元分类我有大约 250 000 个训练样本比率为 60 40 我的模型训练得很好第一个 epoch 的准确率达到 97 损失为 0 07 10 个 epoch 后准确率超过
神经网络中“特征”的定义是什么？

我是神经网络的初学者我对这个词很困惑feature 你能给我一个定义吗feature 这些特征是隐藏层中的神经元吗这些特征是输入向量的元素特征的数量等于网络输入层的节点数量如果您使用神经网络根据物理属性的测量将动物分类为猫或狗那么
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
Keras，训练模型后如何预测？

我正在使用 reuters example 数据集它运行良好我的模型已经过训练我阅读了有关如何保存模型的信息以便稍后加载它以再次使用但如何使用这个保存的模型来预测新文本呢我用吗models predict 我必须以特殊方式准备这
如何使用keras打印神经网络中预测类的名称？

我在 keras 中使用预先训练的模型最终将类索引预测为一些整数值但我似乎不明白如何打印这些类的名称我使用的模型是 ResNet 50 看一下https martin thoma com image classification ht
如何更新反卷积层的权重？

我正在尝试开发一个反卷积层或者准确地说是转置卷积层在前向传递中我进行了完全卷积零填充卷积在向后传递中我进行有效的卷积没有填充的卷积以将错误传递到前一层偏差的梯度很容易计算只需对多余维度进行平均即可问题是我不知道如何更新
张量流：简单 LSTM 网络的共享变量错误

我正在尝试构建一个最简单的 LSTM 网络只是想让它预测序列中的下一个值np input data import tensorflow as tf from tensorflow python ops import rnn cell im
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
如何在快速人工智能中获得给定测试集的预测并计算准确性？

我正在尝试加载由导出的学习者learn export 我想针对测试集运行它我希望我的测试集有标签以便我可以测量其准确性这是我的代码 test src TextList from df df path cols texts split
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h

随机推荐

C 可变长度数组存储持续时间

On this http en cppreference com w c language storage duration网站上有以下段落强调我的自动存储时间当进入声明对象的块时分配存储空间并在通过任何方式 goto return
从 PHP 中检索 Javascript 中的 JSON 数组

我试图从 PHP 返回一个 json 编码的数组到 JS 我之前已经这样做过很多次了但现在我遇到了一个奇怪的错误我成功获取数据并且它在 chrome 中显示数组但是如果我指定了我无法让它进入AJAX成功功能dataType jso
何时使用字节数组&何时使用字节缓冲区？

字节数组和字节缓冲区有什么区别另外在什么情况下应该优先选择其中之一我的用例是用 java 开发的 Web 应用程序实际上有多种处理字节的方法我同意选择最好的并不总是那么容易 the byte the java nio ByteB
EnterpriseLibrary.Logging 写入相差 1 小时的日志

我们在日志记录方面遇到了一个奇怪的问题我们正在使用Microsoft Practices EnterpriseLibrary Logging用于登录我们的 Web 应用程序的库问题是它写入的日志与当前系统时间有 1 小时的差异我们的记
Apache Geode CacheServerException 在密钥集请求期间未找到区域

我是 Geode 新手并且已经开始默认locator and server根据5 分钟内的晶洞 https cwiki apache org confluence display GEODE Index Index Geodein5min
如何在 Eclipse 中找到方法实现的用法？

当我想在java中找到普通方法的用法时这是相当简单和直接的CTRL SHIFT G 但是如果这个方法有一个super定义实现 Eclipse 将向我展示层次结构类型中所有类型的用法例如如果我有一个toString 方法在我的类中我
将 ViewChild 用于动态元素 - Angular 2 和 ionic 2

我想使用多个离子载玻片 https ionicframework com docs api components slides Slides 我动态添加的但我不能使用 viewChild 请提出解决此问题的方法模板 html div d
如何使用 My.Settings.Save Visual Basic 保存窗体背景图像

我正在尝试用 Visual Basic 创建一个操作系统当然是基于程序的它需要个性化我希望用户能够从存储在项目资源中的一组选定图像中进行选择并且我希望保存该图像以便他们下次登录软件时表单具有相同的他们选择保存的图像额外的信息
python中的IOE错误“没有这样的文件或目录”

我正在编写一个 Django 项目涉及从表中检索数据我有一个模块它具有检索一些数据的行 snp data txt是模块同一目录中的文件 data file snp data txt 当我在 django 项目之外单独调用该模块时该模
整数求和布鲁斯，短+=短问题

C 程序 short a b a 10 b 10 a a b Error Cannot implicitly convert type int to short we can also write this code by using Ar
允许重复键并保持插入顺序的映射

目前我正在使用 LinkedHashMap 来维护插入顺序我使用的 LinkedHashMap 的语法 private LinkedHashMap
防止mysql中的值变为负数的最佳方法

我们有一个表通过在该表中记录交易来维护帐户余额即最近一行是帐户余额在记录提款时我们希望确保余额永远不会出现负数我们提出的解决方案类似于 INSERT INTO txns account id prev balance txn t
WinFORMS 中的 WPF 用户控件：项目结构

SCENARIO 我决定为我的新应用程序使用 WPF 技术必须通过从 WinForms 窗口单击菜单来调用此应用程序因此我创建了一个 WPF UserControl 库并将其集成以使用 Element Host 在父 WinForm
如何将数组转换为 UnsafeMutablePointer Swift 3.0？

这是我在以前版本的 Swift 中的可行代码 let imageOptionsDictKeys kCVPixelBufferPixelFormatTypeKey kCVPixelBufferWidthKey kCVPixelBufferHe
如何通过 lambda 函数 aws 发送和返回 JSON 响应

我有一个名为 lambda 函数的 Amazon Webservices 闭包其委托定义如下 def lambda handler event context logger info Ev s event if event action
从 pandas 数据框中删除具有空值的行

我正在尝试从数据框中删除一行其中其中一列的值为空我能找到的大部分帮助都与删除 NaN 值有关到目前为止这对我不起作用我在这里创建了数据框 successfully crated data frame df1 ut get data
Opencv 图像拼接或全景

我正在 OpenCV 全景中进行图像拼接但有一个问题我无法使用 OpenCV 中的 Stitching 类因此我必须仅使用特征点和单应性来创建它 OrbFeatureDetector detector minHessian std
querySelectorAll 是否支持 id 中的句点(.) 字符？

querySelectorAll 是否支持 id 中的句点字符我的意思是如果我附加一个如下所示的元素 var div document createElement div div id my divid document body ap
Java 8 findFirst().isPresent() 比 count() > 0 更高效吗？

鉴于我有一个流Stream
如何在 CAFFE 的新网络中重复使用同一网络两次

我有一个预训练的网络我们称之为N 我想在新网络中使用两次有人知道如何复制吗然后我想为每个副本分配不同的学习率例如 N1是第一个副本N N2是第二个副本N 新网络可能如下所示 N1 gt joint ip N2 gt layer 我知

如何在 CAFFE 的新网络中重复使用同一网络两次

如何在 CAFFE 的新网络中重复使用同一网络两次 的相关文章

随机推荐

热门标签

如何在 CAFFE 的新网络中重复使用同一网络两次的相关文章