caffe： group 参数是什么意思？

2024-03-16

我已阅读有关的文档group param:

group (g) [默认 1]：如果 g > 1，我们将每个过滤器的连接限制为输入的子集。具体地，将输入和输出通道分为g组，第i个输出组通道将仅与第i个输入组通道连接。

但首先我不明白它们的确切含义。其次，我为什么要使用它。谁能帮我更好地解释一下吗？

据我理解，它的意思如下：

如果我将 g 设置为大于 1，我的输入和输出通道将被分成几组。但具体是如何做到的呢？如果我将其设置为 20 并且我的输入为 40，我将不得不以 20 人为一组？如果输出是 50，我将有一组 20 和一组 30？

其次，为什么我要使用[分组]？

这最初是在论文中作为一种优化提出的，引发了当前神经网络流行的周期：

亚历克斯·克里热夫斯基 (Alex Krizhevsky)、伊利亚·苏茨克韦尔 (Ilya Sutskever) 和杰弗里·E·辛顿 (Geoffrey E. Hinton)。 ”使用深度卷积神经网络进行 Imagenet 分类 https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf”，《神经信息处理系统进展》，第 1097-1105 页。2012 年。

图 2 显示了如何使用分组来完成这项工作。 caffe 的作者最初添加了此功能，以便他们可以复制 AlexNet 架构。然而，分组在其他场景中仍然显示出其优势。

例如，Facebook 和 Google 都发布了论文，这些论文本质上表明分组可以显着减少资源使用，同时有助于保持准确性。 Facebook 论文可以在这里看到:(ResNeXt https://arxiv.org/abs/1611.05431）和谷歌论文可以在这里找到：（移动网络 https://arxiv.org/abs/1704.04861)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

caffe： group 参数是什么意思？的相关文章

AlexNet 中的神经元数量

In AlexNet http www cs toronto edu 7Efritz absps imagenet pdf 图像数据为3 224 224 第一个卷积层用96个大小的核对图像进行过滤11 11 3步幅为 4 像素我对第一层的
在新维度中堆叠数组

假设我有三个数组 k np array 1 1 2 2 m np array 3 3 4 4 n np array 5 5 6 6 理想情况下我希望获得形状为 3 2 2 的最终数组即 array 1 1 2 2 3 3 4 4 5 5
在caffe prototxt 文件中。 TRAIN 和 TEST 阶段做什么？

我是咖啡新手感谢你们 in https github com BVLC caffe blob master src caffe proto caffe proto https github com BVLC caffe blob mast
使用贝叶斯优化的深度学习结构的超参数优化

我为原始信号分类任务构建了 CLDNN 卷积 LSTM 深度神经网络结构每个训练周期运行约 90 秒超参数似乎很难优化我一直在研究优化超参数的各种方法例如随机或网格搜索并发现了贝叶斯优化虽然我还没有完全理解优化算法但我认为它
如何在 CAFFE 的新网络中重复使用同一网络两次

我有一个预训练的网络我们称之为N 我想在新网络中使用两次有人知道如何复制吗然后我想为每个副本分配不同的学习率例如 N1是第一个副本N N2是第二个副本N 新网络可能如下所示 N1 gt joint ip N2 gt layer 我知
Keras 自定义损失函数：形状为batch_size (y_true) 的变量

在 Keras 中实现自定义损失函数时我需要tf Variable与我的输入数据的批量大小的形状 y true y pred def custom loss y true y pred counter tf Variable tf zer
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
ValueError：Layerequential_20 需要 1 个输入，但它收到了 2 个输入张量

我正在尝试使用 Tensorflow 中的 KMNIST 数据集和我正在使用的教科书中的一些示例代码构建一个简单的自动编码器但当我尝试拟合模型时我不断收到错误错误说ValueError Layer sequential 20 expe
了解随机起始权重对神经网络性能的影响

使用 R 和包neuralnet 我尝试对数据进行建模如下所示这些是几天内以 10 分钟为间隔的温度读数上面是 2 天的截图使用下面的代码我将神经网络拟合到数据可能有更简单的方法来对这些精确数据进行建模但将来数据可能看起来完全
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
Keras，训练模型后如何预测？

我正在使用 reuters example 数据集它运行良好我的模型已经过训练我阅读了有关如何保存模型的信息以便稍后加载它以再次使用但如何使用这个保存的模型来预测新文本呢我用吗models predict 我必须以特殊方式准备这
如何更新反卷积层的权重？

我正在尝试开发一个反卷积层或者准确地说是转置卷积层在前向传递中我进行了完全卷积零填充卷积在向后传递中我进行有效的卷积没有填充的卷积以将错误传递到前一层偏差的梯度很容易计算只需对多余维度进行平均即可问题是我不知道如何更新
Keras TimeDistributed Conv1D 错误

这是我的代码 cnn input Input shape cnn max length emb output Embedding num chars 1 output dim 32 input length cnn max length t
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
Keras 自定义损失函数：访问当前输入模式

在 Keras 带有 Tensorflow 后端中当前输入模式可用于我的自定义损失函数吗当前输入模式被定义为用于产生预测的输入向量例如请考虑以下情况 X train X test y train y test train test
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
您必须为 MNIST 数据集的占位符张量“Placeholder”提供一个值，dtype float 和 shape [?,784]

这是我在 MNIST 数据集上测试量化的示例我正在使用以下代码测试我的模型 import tensorflow as tf from tensorflow examples tutorials mnist import input dat

随机推荐

控制风扇速度

我想用C 控制风扇速度我尝试了 WMI 但它对我不起作用我有配备 Intel Core i5 的 HP ProBook Windows 7 HomePremium 64 位还有其他方法可以控制风扇速度获取温度将风扇速度设置为更高或
使用 ZF 使 Zend_Rest_Server 返回 JSON 而不是 XML

Zend Rest Server 可以返回 Json 吗如果没有有什么替代方案其他库建议也可以 Zend Rest Server 输出 XML 尽管文档中没有明确指定有一些替代方案您可以利用 Zend Framework 提供的整
如何停止谷歌云数据流中的流管道

我有一个正在运行的流数据流来读取 PUB SUB 订阅一段时间后或者可能是在处理一定量的数据后我希望管道自行停止我不希望我的计算引擎实例无限期地运行当我通过数据流控制台取消作业时它显示为失败的作业有办法实现这一点吗我错过了什么
Mono 编译错误 - 无法从程序集“System”加载类型“System.Runtime.CompilerServices.ReferenceAssemblyAttribute”

我在编译 CSharp Mono 应用程序时遇到问题我的Mono版本是2 10 2 这是我收到的错误程序集 home tmc AcctTerm System dll 中缺少方法 ctor 类型为 System Runtime Compi
TinyMCE v4 关闭 blob

我不想tinymce使用斑点来处理小图像因为我正在转换它们data images到真实图像我正在替换img src 当我有了真实的图像之后我怎样才能做到只得到data image图片是否可以我试过 automatic upload
如何在 OS X 中使用 Java 查找用户的“文档”文件夹？

我想在用户的文档文件夹中创建一个目录但到目前为止我只找到了如何获取用户的主目录 javax swing JFileChooser fr new javax swing JFileChooser javax swing filechoo
scipy 偏态分布的随机变量

尝试从 SciPy 的分布中抽取随机数就像使用 stats norm rvs 一样然而我试图从我拥有的经验分布中获取数字这是一个倾斜的数据集我想将倾斜和峰度合并到我正在绘制的分布中理想情况下我只想调用 stats norm r
functools.partial 不能与 multiprocessing.Pool.map 一起使用吗？

我的代码经过简化如下所示 run functools partial run grep options grep print only options print only force options force if not optio
错误：getaddrinfo EAI_AGAIN（docker、nginx）

我知道此错误与 DNS 查找超时错误相关意味着它是网络连接错误或代理相关错误但是我不知道如何解决它我使用 docker compose yml 里面有 3 个容器这是我的 docker compose yml 作为链接 docker
数据表加载速度非常慢

我使用数据表作为页面上某些下拉列表的数据源但注意到页面在回发期间非常慢我已经追踪到这里 DataTable dt new DataTable dt Load sqlCmd ExecuteReader this takes ages sq
如何使用百分比作为参数调整 HTML 中的图像大小？

我想调整我网站上的图像大小我知道如何通过之前调整图像大小或计算宽度和高度并以像素为单位设置值来做到这一点但我多次使用不同尺寸的同一张图片因此如果我可以相对于图像本身的大小调整图像的大小那么我会花费更少的时间 img src imag
数组按字母顺序排序？

假设我有两个字符串数组名为 arrayone 和 arraytwo 我将如何按照字母顺序从 A 到 Z 对 arrayone 进行排序同时仍然保持与第二个数组的关系如果您想知道 arrayone 和 arraytwo 中的内容 1
通过数据库链接立即执行

是否可以通过数据库链接在远程数据库上执行动态 PL SQL 我正在寻找类似的东西 l stmt begin null end execute immediate l stmt dblink 上面的语法显然是错误的我明白了PLS 00201
为什么要选择 64 位操作系统？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案关于这些问题哪个 Vista 版本最适合开发人员计算机 https stackoverflow com questions 17653
Azure 删除用户对 API 的同意

从我的前端应用程序中当我请求访问令牌时我传递了两个需要与令牌一起返回的范围我没有在 Azure 门户中向应用程序授予这些同意相反用户必须从弹出窗口明确表示同意一旦用户授予同意我就会获得具有所需范围的访问令牌但如何撤销 Azu
如何优化 testng 和 selenium 测试

在我的实习中我必须使用 TestNG 和 selenium 来测试 Web 应用程序但我有一个问题有时硒或浏览器由于某种随机原因无法工作因此工作测试被标记为失败为了避免这种情况我可以使用注释 Test invocationCo
jqGrid 动态更改特定行的编辑类型

继此post https stackoverflow com questions 7535942 solved jqgrid how to set custom editoptions based on initial column val
Python-将日期时间列转换为秒[重复]

这个问题在这里已经有答案了我有一个日期列称为时间其中包含天小时分钟等 timedelta 我在数据框中创建了一个新列我想创建一个新列并将时间列转换为秒我确实找到了如何转换列如何根据现有 timedelta 列的秒数转
如何在Python中执行双线性插值

我想使用 python 执行线性插值我想要插入高度的 GPS 点示例是 B 54 4786674627 L 17 0470721369 使用具有已知坐标和高度值的四个相邻点 n 54 5 17 041667 31 993 54 5 17
caffe： **group** 参数是什么意思？

我已阅读有关的文档group param group g 默认 1 如果 g gt 1 我们将每个过滤器的连接限制为输入的子集具体地将输入和输出通道分为g组第i个输出组通道将仅与第i个输入组通道连接但首先我不明白它们的确切含义其次

caffe： **group** 参数是什么意思？

caffe： **group** 参数是什么意思？ 的相关文章

随机推荐

热门标签

caffe： group 参数是什么意思？

caffe： group 参数是什么意思？的相关文章