CNN中的滤波器数量是多少？

2023-12-22

我目前看到theano的API，

theano.tensor.nnet.conv2d(input, filters, input_shape=None, filter_shape=None, border_mode='valid', subsample=(1, 1), filter_flip=True, image_shape=None, **kwargs)

哪里的filter_shape是一个元组(num_filter, num_channel, height, width)，我对此感到困惑，因为过滤器的数量不是由在图像上滑动过滤器窗口时的步幅决定的吗？我怎样才能像这样指定过滤器编号？如果是通过参数stride（如果有的话）来计算的话，对我来说是合理的。

另外，我也对特征图这个术语感到困惑，它是每一层的神经元吗？批量大小如何？它们是如何相关的？

滤波器的数量就是神经元的数量，因为每个神经元对层的输入执行不同的卷积（更准确地说，神经元的输入权重形成卷积核）。

特征图是应用过滤器的结果（因此，您拥有与过滤器一样多的特征图），其大小是过滤器的窗口/内核大小和步幅的结果。

The following image was the best I could find to explain the concept at high level: Note that 2 different convolutional filters are applied to the input image, resulting in 2 different feature maps (the output of the filters). Each pixel of each feature map is an output of the convolutional layer.

例如，如果您有 28x28 输入图像和一个具有 20 个 7x7 滤波器且步幅为 1 的卷积层，那么您将在该层的输出处获得 20 个 22x22 特征图。请注意，这将作为宽度 = 高度 = 22 且深度 = num_channels = 20 的体积呈现给下一层。您可以使用相同的表示在 RGB 图像（例如来自 CIFAR10 数据集的图像）上训练 CNN，这将是32x32x3 体积（卷积仅应用于 2 个空间维度）。

编辑：我想澄清的评论中似乎存在一些混乱。第一的，没有神经元。神经元只是神经网络中的一个比喻。也就是说，“卷积层中有多少个神经元”无法客观回答，而是与您对该层执行的计算的看法相关。在我看来，过滤器是一个神经元扫过图像，提供不同的激活对于每个位置。在我看来，整个特征图是由单个神经元/过滤器在多个位置生成的。评论者似乎有另一种观点，与我的观点一样有效。他们将每个过滤器视为一组用于卷积运算的权重，并将一个神经元视为图像中每个参与位置，所有神经元都共享由过滤器定义的同一组权重。请注意，这两个视图都是功能上（甚至根本上）相同，因为它们使用相同的参数、计算并产生相同的结果。因此，这不是问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CNN中的滤波器数量是多少？的相关文章

在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
libsvm 收缩启发法

我在 C SVC 模式下使用 libsvm 和 2 次多项式内核并且需要训练多个 SVM 在训练期间我训练的一些 SVM 会收到以下一个或什至两个警告 WARNING using h 0 may be faster WARNING re
使用 LightGBM 进行多类分类

我正在尝试使用 Python 中的 LightGBM 为多类分类问题 3 类建模分类器我使用了以下参数 params task train boosting type gbdt objective multiclass num clas
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection
Python sklearn 多标签分类：用户警告：所有训练示例中都存在标签不是 226

我正在尝试多标签分类问题我的数据看起来像这样 DocID Content Tags 1 some text here 70 2 some text here 59 3 some text here 183 4 some text here
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
使用反向传播算法实现感知器

我正在尝试实现一个具有反向传播的两层感知器来解决奇偶校验问题该网络有 4 个二进制输入第一层有 4 个隐藏单元第二层有 1 个输出我在用this http page mi fu berlin de rojas neural chap
通过 Caffe 中的层提供数据的多种路径

我想在 Caffe 中构建一个网络其中传入的数据最初被分割分别通过同一组层最后使用 eltwise 层重新组合此后所有部件将作为一个斑点移动除了学习的参数之外数据并行移动的网络部分的层配置将是相同的有没有一种方法可以在 Ca
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
混合 SOM（带 MLP）

有人可以提供一些有关如何正确地将自组织映射与多层感知器结合起来的信息吗我最近读了一些关于这种技术的文章与常规 MLP 相比它在预测任务中表现得更好因此我想使用 SOM 作为前端通过对输入数据进行聚类来降维并将结果传递到 MLP
XGBoost 产生预测结果和概率

我可能正在文档中查看它但我想知道 XGBoost 是否有办法生成结果的预测和概率就我而言我正在尝试预测多类分类器如果我能返回Medium 88 那就太好了分类器中预测概率 88 参数 params max depth 3 ob
如何求真实数据的概率分布和参数？（Python 3）

我有一个数据集来自sklearn我绘制了分布load diabetes target数据即回归值load diabetes data用于预测我使用它是因为它的回归变量属性数量最少sklearn datasets 使用Python 3
如何对URL进行分类？ URL 的特点是什么？如何从 URL 中选择和提取特征

我刚刚开始研究分类问题这是一个两类问题我的训练模型机器学习必须决定预测是允许 URL 还是阻止它我的问题非常具体如何对 URL 进行分类我应该使用普通的文本分析方法吗 URL 的特点是什么如何从URL中选择和提取特征我假
Caffe 多输入图像

我正在考虑实现一个 Caffe CNN 它接受两个输入图像和一个标签后来可能是其他数据并且想知道是否有人知道 prototxt 文件中执行此操作的正确语法它只是一个带有额外顶部的 IMAGE DATA 层吗或者我应该为每个层使用单独
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔

随机推荐

如何从文本文件中选取一行并将其转换为数组对象？

好的这是代码我需要以某种方式从文本文件中取出一行并转换为数组对象像 p 0 asdasdasd public class Patient2 public static void main String args int field 0
AngularJS：指令中的 ng-click 未在移动设备上触发

我目前正在努力解决 AngularJS 中的 ng click 问题我有一个指令并且在一个带有 ng click command 的元素内 div class james upload wrapper row div class jam
地图API，存储数据，如何不违反条款？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案在 Google 和 Yahoo Maps API 中我读到了服务条款您不得存储或允许最终用户存储地图图像地图数据或地理编码来自 Yahoo
ical4j 库 org.mnode.ical4j 和 net.fortuna.ical4j 之间的区别

我们正在使用ical4j通过maven 浏览时存储库 https mvnrepository com search q ical4j 我碰到org mnode ical4j作为最常用的ical4jMaven 中央存储库中的库并且它有最新版
SQL Server 的分组字符串聚合/LISTAGG

我确信有人问过这个问题但我找不到正确的搜索词给定一个像这样的模式 CarMakeID CarMake 1 SuperCars 2 MehCars CarMakeID CarModelID CarModel 1 1 Zoom 2 1 Wo
我不明白javascript中的函数返回

谁能解释一下为什么在函数中使用javascript return语句我们何时以及为什么应该使用它请帮我为什么在函数中使用它 1 返回函数的结果回报正如所说的那样它returns返回一些值函数调用者 function sum num
获取给定 UTType 的扩展

我知道我可以使用 UTTypeCreatePreferredIdentifierForTag kUTTagClassFilenameExtension extension NULL 获取给定扩展的 UTType 但我找不到相反的方法即给定
自动初始化并显示 Marionette 布局上某个区域内的视图

我有一个布局有一个区域当布局初始化时我希望它自动初始化一个预设视图以进入其区域并在布局本身显示关闭时显示关闭它当前示例来自https github com marionettejs backbone marionette bl
如何在.NET中以编程方式测量当前进程的总内存消耗？

如何在 NET中以编程方式测量当前进程的总内存消耗参考这个所以问题 https stackoverflow com questions 1248129 c list all processes and their current memo
使用 DataTemplate 的 WPF 可编辑组合框的 SelectedItem 问题

我在使用 WPF 时遇到以下问题ComboBox XAML
Pytorch 和 numpy 广播规则差异？

我对 torch 进行了一些实验以下是我的发现 5 7 3 and 5 7 3 gt 5 7 3 equal 5 3 4 1 and 5 3 1 1 gt 5 3 4 1 1 暗淡为 1 5 3 4 1 and 3 4 1 gt 5 3
访问单元格的预定义元素

我有一个元胞数组 A 1x80 其中每个元素本身就是一个元胞数组 9x2 我还有一个向量 B 代表 A 的一组选定单元格我想提取每个选定单元格的元素 2 2 我尝试用一个简单的 A 1 B 2 2 但当然这是行不通的你能帮助我吗这个
WebStorm/PhpStorm 从任何地方的搜索中排除文件

当我到处搜索时我想从搜索结果中排除 JS 和 js map 文件我正在使用 TypeScript 我的预期行为是从 Search Everywhere 中省略这些文件是的我可以将文件标记为纯文本但这对于每个文件来说很麻烦 I ha
延迟复选框组的 JSF AJAX 侦听器

我有一个复选框组 h selectManyCheckbox 并在选中或取消选中框时触发 AJAX 事件这很简单f ajax e g f ajax execute form event click 我想增强此功能以便在之后不再重新执行ev
Graphics.DrawString() 与 TextRenderer.DrawText()

我对这两种方法感到困惑我的理解是Graphics DrawString 使用GDI 并且是基于图形的实现而TextRenderer DrawString 使用GDI并且允许大范围的字体并支持unicode 我的问题是当我尝试将基于十进制
Python Bottle 运行初始化方法两次

我的瓶子有问题 initialize函数运行两次示例应用程序 route index def index return bang def initialize print bam if name main initialize run r
Java 线程限制，JVM 9

所以根据most https www quora com What is the maximum number of threads in Java What happens if number of threads exceeds the
com.google.gson.JsonSyntaxException：android 中的 java.lang.IllegalStateException

我收到错误 com google gson JsonSyntaxException java lang IllegalStateException 需要一个字符串但在第1行第3列是BEGIN OBJECT My Code Gson gso
Boost：如果模板参数是指针，则取消引用它

如果模板参数是指针或智能指针我可以使用什么来取消引用它或者如果不是则保持原样 template
CNN中的滤波器数量是多少？

我目前看到theano的API theano tensor nnet conv2d input filters input shape None filter shape None border mode valid subsample 1

CNN中的滤波器数量是多少？

CNN中的滤波器数量是多少？ 的相关文章

随机推荐

热门标签

CNN中的滤波器数量是多少？的相关文章