如何使用CNN来训练不同大小的输入数据？

2024-04-01

CNN 似乎主要针对固定大小的输入来实现。现在我想用CNN来训练一些不同大小的句子，有哪些常用的方法？

以下建议主要与用于计算机视觉任务（特别是识别）的 CNN 相关，但也可能对您的领域有所帮助：我会看看He 等人的“用于视觉识别的深度卷积网络中的空间金字塔池”。 http://arxiv.org/abs/1406.4729提出空间金字塔池化层。

总体思路：CNN 的卷积层（以及相关层，例如池化、局部响应归一化等）能够处理可变大小的输入。因此，可变大小输入的问题向下传播到第一个全连接/内积层，该层需要固定大小的向量。他等人。建议在第一个全连接层之前添加空间金字塔池层（论文中有详细信息）。该层本身的工作原理是将最后一个卷积层（或后续池化或响应归一化层）的特征图分层划分为固定数量的箱。在这些箱中，响应通常会被汇集起来，创建固定大小的输出（其中大小取决于箱的层次结构和数量）。请参阅论文中的说明。

该层基于Caffe实现，可在GitHub上获取：任少卿/SPP_net https://github.com/ShaoqingRen/SPP_net.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用CNN来训练不同大小的输入数据？的相关文章

是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
如何计算两个字符串向量之间的余弦相似度

我有 2 个维度为 6 的向量我想要一个介于 0 和 1 之间的数字 a c HDa 2Pb 2 BxU BuQ Bve b c HCK 2Pb 2 09 F G 谁能解释我应该做什么使用lsa包和该包的手册 create some f
TensorFlow - 为什么这个 softmax 回归没有学到任何东西？

我的目标是用 TensorFlow 做大事但我正在尝试从小事做起我有一些小的灰度方块有一点噪音我想根据它们的颜色对它们进行分类例如 3 个类别黑色灰色白色我编写了一个小 Python 类来生成正方形和 1 hot 向量并
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
如何使用sklearn Pipeline和FeatureUnion选择多个（数字和文本）列进行文本分类？

我开发了一个用于多标签分类的文本模型这OneVsRest分类器 http scikit learn org stable modules generated sklearn multiclass OneVsRestClassifier h
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit

随机推荐

遗留代码中的泛型

我们有相当多的代码刚刚跳转到 Java 5 我们一直在那些打算在 Java 5 版本中发布的组件中使用泛型但是剩下的代码当然充满了原始代码类型我已将编译器设置为生成原始类型错误并开始手动清除它们但按照目前的速度这将需要very很长时
什么样的日志记录对您的应用程序来说是好的日志记录？

因此我们已经讨论了在我的工作地点进行登录我想知道这里的一些人是否可以给我一些关于你们的方法的想法通常我们的场景是根本没有日志记录并且大多数是 NET 应用程序 winforms WPF 客户端通过 Web 服务进行通信或直接与数据
如何知道推送通知发送状态

我正在应用程序中使用推送通知一切都很顺利有时从服务器发送的消息但在应用程序端它没有收到在这种情况下我必须知道缺少哪条消息无法传递应用程序未收到有没有办法从服务器端知道应用程序收到了哪些消息哪些没有收到不推送通知是一劳永逸的
如何在 Laravel Passport 中获取刷新令牌？

我正在使用 Laravel 6 7 并尝试使用Passport用于用户身份验证我可以在用户注册时为他们创建访问令牌这是代码 user User create input user gt createToken auth token 正如
NUnit 与 Windows Phone 7 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想使用 NUnit 对我的 Windows Phone 7 库进行单元测试是否有与 Windows Phone 7 兼容的 NUnit
通过 React App 的数据表按钮

在 React 中工作时我在尝试添加 Excel 导出按钮时遇到了问题我认为它与导入有关但在这方面我在网上找不到太多与 React 和 DataTables net 相关的帮助我只希望用户能够下载到 Excel 这些是我与 jque
我在使用 log4js-protractor-appender 时遇到麻烦

我的 log4js js 文件代码 use strict var log4js require log4js var log4jsGen getLogger function getLogger log4js loadAppender fi
模块错误“模块是使用不兼容的 Kotlin 版本编译的。其元数据的二进制版本是 1.5.1，预期版本是 1.1.16”

我正在为我们的项目编写一个 kotlin 库完成后我构建了一个 aar 文件并将其发送给团队但他们有一个错误 Module was compiled with an incompatible version of Kotlin The
如何使用tensorflow keras在网络中一起使用嵌入层和其他特征列

让我们考虑一个包含 6 列和 10 行的示例数据集这 3 列是数字其余 3 列是分类变量分类列被转换为大小为 10x3 的多热编码数组我有目标列我想要预测它也是分类变量它可以再次采用 3 个可能的值这一列是一个热编码的列现在
Webpack 开发服务器 (webpack-dev-server) 热模块替换 (HMR) 不起作用

我已经在 StackOverflow 和 GitHub 问题上查看了许多答案但是我仍然陷入 Webpack 中的热模块替换中我在用npm start运行我的服务器webpack dev server hot inline 我正在尝试更
如何使用 FOP 在 XSL-FO 中保留表头但允许在表体内分页

我正在使用 Apache FOP 和 XSL FO 样式表生成 PDF 在 PDF 中我输出属于表格的标题 html 相当于 h1 因此应始终保持在一起但是我的表格也可能包含太多数据以至于一页纸上不一定能容纳得下期望的结果是一个规
如何防止可拖动的子元素相互拖动？

如何防止可拖动子元素在绝对位置相互拖动就像是 if firstChild position left gt secondChild position left this draggable disabled true 但这只会在停止拖动时
从android将多个图像保存到mysql php中，但只插入一张图像

我在活动 A 中有三个列表视图如下所示当提交button点击后文字和图片路径将被保存到MySQL和image将被存储在PhotoUpload文件夹我能够将 3 个文本存储到 MySQL 中但问题是只有一个图像路径保存到 MySQL
将某些值排序到顶部

我有一个 MySQL 表其中包含以下数据简化 INSERT INTO stores storeId name country VALUES 1 Foo us 2 Bar jp 3 Baz us 4 Foo2 se 5 Baz2 jp 6
尝试安装 pecl 扩展时在 mac os x 10.7.3 上出现 $PHP_AUTOCONF 错误

我正在尝试使用 pecl http 和 memcache 设置我的机器在这两种情况下我都会遇到类似的错误这是在 MAC OS X 10 7 3 lion 上我也在上面安装了 XCODE 在运行这些命令之前我还安装了 Zend Se
沿着“bresenham”线平滑颜色插值

我正在尝试沿一条线插值颜色以便给定两个点及其各自的 RGB 值我可以绘制一条具有平滑颜色渐变的线使用布雷森纳姆的线条算法我现在可以绘制线条但不确定如何开始在两个端点之间插值颜色以下是 drawLine 函数的一部分适用于斜率小
返回多个结果集的查询

我有一个MSSQL数据库并正在运行以下查询 select from projects select from user 上面的查询一次返回两个结果集我无法单独触发这两个查询如何在 Java 类中同时处理两个结果集处理多个的正确代码Re
用 emacs 替换 ssh+screen+editor

我的目标是远程编写代码到目前为止我一直在使用 ssh screen 编辑器例如 vim 我知道使用本地 emacs 或 vim 可以编辑远程文件但是一旦本地 emacs 关闭并且我想重新打开它或使用另一台计算机打开它我需要再次
如何调整 matplotlib 中每隔一行子图之间的间距

我希望水平调整子图之间的空间特别是在每隔两行之间我可以使用调整每一行fig subplots adjust hspace n 但是否可以将其应用于每第二行 import matplotlib pyplot as plt fig ax p
如何使用CNN来训练不同大小的输入数据？

CNN 似乎主要针对固定大小的输入来实现现在我想用CNN来训练一些不同大小的句子有哪些常用的方法以下建议主要与用于计算机视觉任务特别是识别的 CNN 相关但也可能对您的领域有所帮助我会看看He 等人的用于视觉识别的深度卷积网

如何使用CNN来训练不同大小的输入数据？

如何使用CNN来训练不同大小的输入数据？ 的相关文章

随机推荐

热门标签

如何使用CNN来训练不同大小的输入数据？的相关文章