VGG数据预处理

2023-05-16

参考文献

Very Deep Convolutional Networks for Large-Scale Image Recognition

本文的目的

目标检测/语义分割等领域都会涉及到预训练模型,一般是在ImageNet上训练出来的一个分类模型,但是ImageNet和cifar/mnist不同,

  • 一个图可能包含多个目标
  • 目标的尺寸不固定
  • 图像尺寸不固定
  • 图像长宽比不固定
    这种集合如何用来训练分类模型?

VGG的方法

  • 图片的短边缩小到固定大小S
    文中称S为scale,S的变换认为属于样本增广的一种:scale jittering。 后续实验证明scale jittering是有利于泛化。把S推广到一个区域间 [ S m i n , S m a x ] [S_{min},S_{max}] [Smin,Smax]就是multi-scale,否则是single-scale,实验证明multi-scale更好。需要注意的是此处scale不是图像内容的尺度,即使S只有一个值,整个数据集中目标也包含多个尺度

  • 缩小后的图片中,随机裁剪出224x224的子图,作为网络输入
    理论上S可以取任意不小于224的值,如果S很大,则crop后224x224子图可能包括很小的目标,只覆盖一部分图像内容;如果S很小,则crop后的224x224子图可以覆盖大目标,包括了大部分图像内容。
    论文中尝试了256和384两个值,推广到区间,论文中尝试的是[256,512], 每次随机从区间内取一个值,作为当前的S值。
    training阶段可以有多个尺度,testing阶段也可以有多个尺度,最后的输出是多个尺度的结果的平均值,实验也证明,testing阶段多个尺度效果较好

附图

single-scale
mutiple-scale

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

VGG数据预处理 的相关文章

  • 第1步 数据预处理

    文章目录 前言一 安装依赖环境二 导入依赖包三 导入数据集保姆级操作演示 xff1a 四 处理丢失数据保姆级操作演示 五 解析分类数据保姆级操作演示 六 拆分数据集为训练集合和测试集合七 特征缩放总结 前言 一 安装依赖环境 开始之前 xf
  • 3D机器学习(12):AlexNet、VGG、GoogNet、Resnet、Densenet、nn.Module、数据增强

    从2010年开始 xff0c 深度学习开始进入人们视野 xff0c 2012年的Alexnet是第一个真真意义上的深度网络 xff0c 尽管只有8层 xff0c 但其错误率只有16 4 xff0c 2015年微软亚洲研究院的何凯明同学的Re
  • RepVGG: Making VGG-style ConvNets Great Again

    文章地址 xff1a RepVGG Making VGG style ConvNets Great Again 代码地址 xff1a https github com megvii model RepVGG 文章发表于CVPR2021 xf
  • 标注工具——VGG Image Annotator (VIA)

    VGG Image Annotator VIA VGG Image Annotator VIA 是一款开源的图像标注工具 xff0c 由Visual Geometry Group开发 地址 xff1a http www robots ox
  • 【CV】RepVGG:通过结构重参数化实现训练和推理解耦的类 VGG 架构

    论文名称 xff1a RepVGG Making VGG style ConvNets Great Again 论文下载 xff1a https arxiv org abs 1704 04861 论文年份 xff1a 2021 论文被引 x
  • 数据预处理-数据清洗之numpy访问与计算

    如何访问numpy数组中的元素 xff1f 采用索引或者切片的方式 span class token comment 导入包 span span class token keyword import span numpy span clas
  • 提高机器学习模型性能的五个关键方法

    如何提高机器学习模型性能 可从五个关键方面入手 1 数据预处理 2 特征工程 3 机器学习算法 4 模型集成与融合 5 数据增强 以下是各个方面的具体分析和方法 说明 1 这里主要是各个关键方法的知识汇总梳理 便于集中学习 具体的实际应用内
  • fit、transform、fit_transform的区别,为什么训练集用 fit_transform , 测试集用 transform

    三个函数的使用具体解释 在数据预处理中的应用 1 只涉及一组数据 fit data 对数据进行拟合 获得了数据的均值 最大最小 标准差等属性值 transform data 利用 fit data 获取到的属性对数据做预处理 如标准化 归一
  • SPSS数据拆分(分组)

    本文中以CPI 消费者价格指数 分析为例 数据中分别给出了全国31个省市 在12个月 2018年8月 2019年7月 中的CPI 数据由 中国统计局 官网导出 引入 当我们从Excel文件导入数据后 如下图左 当我们分析的时候 我们希望得到
  • 数据预处理方式合集

    删除空行 del all None value data all dropna axis 1 how all inplace True 删除空列 del all None value data all dropna axis 0 how a
  • 目标检测之数据预处理

    一 数据介绍 AI识虫数据集结构如下 提供了2183张图片 其中训练集1693张 验证集245 测试集245张 包含7种昆虫 分别是Boerner Leconte Linnaeus acuminatus armandi coleoptera
  • 数据处理:归一化与标准化

    归一化与标准化 归一化和标准化是数据预处理时常用的方法 它们都可以将数据映射到特定的区间内 但是具体的实现方式和应用场景有所不同 1 归一化与标准化的相同点 都能够处理特征值之间的差异性 避免特征值之间的度量不一致或者差异过大 都可以提高模
  • cuda

    CUDA Error unspecified launch failure workstation workstation HP Z840 Workstation mjf darknet darknet detector train cfg
  • 统计学基础-数据的图表展示

    理论基础 什么是统计学 统计学分为描述统计和推理统计 统计学研究什么 统计学没有固定的研究对象 统计学研究的是来自各个领域的数据 靠解决其他领域内的工作而生存 我们并不能因此就看轻统计学 就好像计算机现在渗透在各行各业 我们生活中的方方面面
  • 2. 特征缩放(归一化)

    特征缩放 为了消除数据特征之间的量纲影响 我们需要对特征进行归一化处理 使得不同指标之间具有可比性 例如 分析一个人的身高和体重对健康的影响 如果使用 米 m 和 千克 kg 作为单位 那么分析出来的结果显然会倾向于数值差别比较大的体重特征
  • 备战数学建模42-缺失值和异常值的处理方法(攻坚战6)

    在数据建模中 对给出的数据进行预测处理是很重要的 当然一般考虑有归一化或者规范化等方法对数据进行预处理 这都是在数据完整和没有异常的情况下 需要考虑的 当数据量非常大的时候 往往容易出现数据缺失或者异常的现象 如果数据有确实或者有异常值 我
  • sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割

    sklearn机器学习包中的对原始数据的预处理及训练集 测试集的分割 一 数据预处理 1 标准化 2 归一化 3 最小最大标准化 4 缺失值插补 二 训练集测试集的划分 一 数据预处理 sklearn preprocessing 包提供了几
  • Q3.Numpy_统计分析-排序、去重和重复、搜索和计数函数

    Part 1 排序函数 numpy排序方式主要分为直接排序和间接排序两种 直接排序是指对数值直接进行排序 间接排序是指根据一个或多个键对数据集进行排序 在numpy中 直接排序常用sort 函数 间接排序常用argsort 函数和lexso
  • UTSC-TK2016工具集使用笔记

    1 Pcap2Session ps1 对原始流量文件进行切分 以会话 所有层 会话 应用层 流 所有层 流 应用层的形式对原始流量文件进行切分 删除文件长度为0的数据 删除重复文件 生成2 Session文件夹 2 ProcessSessi
  • VGG预训练模型网络结构详解——以VGG16为例

    VGG卷积神经网络是牛津大学在2014年提出来的模型 当这个模型被提出时 由于它的简洁性和实用性 马上成为了当时最流行的卷积神经网络模型 它在图像分类和目标检测任务中都表现出非常好的结果 在2014年的ILSVRC比赛中 VGG 在Top

随机推荐