如何设计深度卷积神经网络？ [关闭]

2024-04-01

据我了解，所有 CNN 都非常相似。它们都有一个卷积层，后面是池化层和 relu 层。有些具有专门的层，例如 FlowNet 和 Segnet。我的疑问是我们应该如何决定使用多少层以及如何设置网络中每层的内核大小。我已经搜索过这个问题的答案，但找不到具体的答案。网络的设计是通过反复试验还是有一些我不知道的特定规则？如果您能澄清这一点，我将非常感谢您。

简短的回答：如果存在设计规则，我们还没有发现它们。

请注意，计算中也存在类似的问题。例如，请注意，只有少数基本电子逻辑单元，即驱动制造技术的门。所有计算设备都使用相同的布尔逻辑；有些还具有专门的附加功能，例如光电输入或机械输出。

您如何决定如何设计您的计算设备？

设计取决于 CNN 的目的。输入特征、准确性、训练速度、评分速度、适应性、计算资源……所有这些都会影响设计。即使对于给定的问题，也没有通用的解决方案（目前）。

例如，考虑 ImageNet 分类问题。请注意迄今为止获胜者和竞争者之间的结构差异：AlexNet、GoogleNet、ResNet、VGG 等。如果您更改输入（例如，更改为 MNIST），那么这些就太过分了。如果你改变范式，它们可能就没用了。 GoogleNet 可能是图像处理领域的王子，但在将法语口语翻译成英语书面语方面却很糟糕。如果您想在视频屏幕上实时跟踪冰球，请完全忘记这些实现。

到目前为止，我们正在以经验的方式来做这件事：很多人尝试很多不同的事情来看看什么有效。我们得到feelings哪些因素可以提高准确性、训练时间或我们想要调整的任何因素。我们发现什么对总 CPU 时间效果最好，或者什么可以并行执行。我们改变算法以利用长度为 2 的幂的向量数学。我们稍微改变问题并看看学习如何适应其他地方。我们改变领域（例如，从图像处理到书面文本），然后从头开始——但一旦我们开始考虑某些类型的层，我们就会模糊地感觉到什么可能会调整特定的瓶颈。

请记住，CNN 真正流行的时间还不到 6 年。在大多数情况下，我们仍在努力了解重要的问题可能是什么。欢迎加入研究团队。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何设计深度卷积神经网络？ [关闭] 的相关文章

Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
caret::train：为 mlpWeightDecay（RSNNS 包）指定更多非调整参数

我在使用插入符号包和 RSNNS 包中的 mlpWeightDecay 方法指定学习率时遇到问题 mlpWeightDecay 的调整参数是大小和衰减将大小保持为 4 并在 c 0 0 0001 0 001 0 002 上调整衰减的示例
结合两个 CNN

我想在 Keras 中将两个 CNN 合并为一个我的意思是我希望神经网络拍摄两张图像并在单独的 CNN 中处理每一张图像然后将它们连接在一起进入扁平化层并使用全连接层来做最后的工作我做了什么 Start With First Bran
帮助我在 Python 中实现反向传播

EDIT2 新的训练集 Inputs 0 0 0 0 0 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 1 0 0 0 1 0 1 0 1 0 2 0 1 0 3 0 1 0 4 0 2 0 0 0 2 0 1 0 2 0 2
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段
从 keras 模型中将特征提取到数据集中

我使用以下代码由here https github com keras team keras blob master examples mnist cnn py 运行 CNN 来训练 MNIST 图像 from future import
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
我可以在反向传播期间（有选择地）反转 Theano 梯度吗？

我热衷于利用最近论文中提出的架构通过反向传播进行无监督域适应 http arxiv org pdf 1409 7495 pdf 在 Lasagne Theano 框架中这篇论文的有点不同寻常之处在于它包含了一个梯度反转层 invert
验证准确性非常好，但预测很差

我正在构建一个 keras 模型来对猫和狗进行分类我使用具有瓶颈特征的迁移学习和 vgg 模型的微调现在我得到了非常好的验证准确率例如 97 但是当我进行预测时我得到了关于分类报告和混淆矩阵的非常糟糕的结果可能是什么问题呢这是微
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
CUDA、NPP 滤波器

CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像但不断出现错误我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
如何在 Caffe 中从头开始训练 ResNet101 模型？

我正在使用深度实验室 v2 https bitbucket org aquariusjay deeplab public ver2Caffe 版本以便进行语义分割我可以使用 imagenet 模型微调 ResNet101 但无法使用自定
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每

随机推荐

正则表达式电话号码[重复]

这个问题在这里已经有答案了我的单词电话号码可能以 00 或开头电话号码示例 00xxx xx xxxxxxx xxx xx xxxxxxx xxx xx xxxxxxx 00xxx xx xxxxxxx I have Regex
Numpy float64 与 Python float

我正在处理 Pandas read csv 函数中的一些浮点问题在我的调查中我发现了这一点 In 15 a 5 9975 In 16 a Out 16 5 9975 In 17 np float64 a Out 17 5 9974999
如何在电报机器人中管理更多用户？

我用 python 做了一个电报机器人它发送如下消息 if message start bot sendMessage chat id Insert your name a name if a name and message start
崇高改变highlight_modified_tabs的颜色？

In Sublime Text 2编辑器中我们可以使用以下命令更改修改编辑选项卡的文本颜色 highlight modified tabs true像那样有用但它是鲜红色的我该如何改变text color of it 这些设
如何在 Rails 中拥有不同的环境变量值？

这就是我跑步的方式rails console命令 COMPANY b2b RAILS ENV development DEPLOY ENV localhost rails console 相反我只想跑步rails console通过在内部
Java 将枚举编译成什么？

我和一位同事讨论了 Java 如何表示枚举我的印象是它们是严格的整数就像 C C 一样或者如果您添加行为类型安全枚举它将被包装在一个类中他相信如果它足够小 Java 会将其压缩为一个字节不过我在 Oracle 网站上发现了
组织依赖项目的最佳方式？

我有一组依赖于其他项目你可以说实用程序的项目问题是每次我更改这些实用程序中任何一个的代码时我的同事都需要采用最新的代码并在他们的计算机上构建以使用最新的代码组件有没有好的标准溶液或者只是将 dll 集中在共享文件夹中 P S 我
谷歌地图 API 点标记

目前我使用 StyledMarker 图标带有自定义颜色的默认气泡图标但我发现有些网站使用更紧凑的点点标记的图片 http 3 bp blogspot com kgIKcUsffkA TspZ9QrlraI AAAAAAAAAZc
com.google.gson.JsonPrimitive 无法转换为 com.google.gson.JsonObject

我有一个来自 PHP 的 json 列表 Json test 1 message try it test 2 message try it test 3 message try it final error gt 1 json gt jso
为什么路由不能与 ElasticSearch Bulk API 一起使用？

我正在向 ElasticSearch 设置批量请求并指定要路由到的分片但是当我运行它时文档会被发送到不同的分片这是 ElasticSearch 批量中的错误吗当我只索引单个文档时它就有效当我搜索时它有效但当我进行批量导入时则不然
如何在混合移动应用程序中实施 Google Analytics？

我正在使用 HTML5 CSS 和 jQuery Mobile 编写一个混合移动应用程序我将使用 Cordova Js 将 HTML5 应用程序转换为适用于 iOS 和 Android 的本机移动应用程序我想使用 Google Anal
vim 有 C++11 语法文件吗？

特别是初始化列表的显示非常糟糕 vector
为什么 vue v-model 不适用于数组 prop？

我有一个自定义组件它采用modelValue道具并发出update modelValue事件在父组件中我传递一个数组测试组件 vue
Azure 服务总线“发送”抛出由于对象的当前状态而导致操作无效

我不确定发生了什么变化但突然我得到一个 InvalidOperationException 由于对象的当前状态操作无效我的代码以前确实有效但我不记得更改过任何内容我正在使用 Microsoft Azure ServiceBus 4
创建 d3.js SVG 文本元素后获取其宽度

我正在尝试获取一堆的宽度text我用 d3 js 创建的元素这就是我创建它们的方式 var nodesText svg selectAll text data dataset enter append text text function
如何在会话中运行多个图 - Tensorflow API

张量流API https github com tensorflow models tree master research object detection提供了一些预先训练的模型并允许我们使用任何数据集来训练它们我想知道如何在一个张
在 Pydroid 3 终端中安装 Git

我正在使用 Pydroid3 并且想在 Pydroid 终端中使用 Git 在我的 Termux 终端中我能够按照此处所述安装 Git git 命令现在只能在 Termux 终端中识别但不能在 Pydroid 中识别无法在 Pydro
Keras/Tensorflow 中涉及梯度的自定义损失函数

我发现这个问题之前已经被问过几次了但没有任何解决方案我的问题很简单我想实现一个损失函数它计算预测梯度和真值之间的 MSE 最终转向更复杂的损失函数我定义了以下两个函数 def my loss y true y pred x dyd
自定义警报对话框边框

我正在创建一个自定义对话框其示例代码为 final AlertDialog dialog protected AlertDialog createDialog int dialogId AlertDialog Builder builde
如何设计深度卷积神经网络？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案据我了解所有 CNN 都非常相似它们都有一个卷积层后面是池化层和 relu 层有些具有专门的层例如 FlowNet 和 Segn

如何设计深度卷积神经网络？ [关闭]

如何设计深度卷积神经网络？ [关闭] 的相关文章

随机推荐

热门标签