【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络

2023-05-16

【深度学习-图像分类篇】Pytorch搭建EfficientNe图像分类网络

1、理论基础
- 1.1 EfficientNet网络简析
- - EfficientNet 网络结构的改进之处
  - EfficientNet不同模型的参数取值
  - 论文中不同 EfficientNet 模型的性能对比
  - 分析：EfficientNet-B0 baseline network 网络结构
  - - 关于 MBConv 简析
    - SE 注意力机制模块
2、网络搭建与训练、预测
- - 依赖库
- 2.1 代码实现网络架构
- - 声明：
  - - model.py 文件
- 2.2 训练过程
- - - train.py
  - 更改数据集训练自己的模型
- 2.3 预测
- - - predict.py
    - 数据集问题
  - 实操预测的效果：
3、实际训练操作小结
4、代码的提取与简化
- 使用集成好的模型，直接调用库训练自己的数据集，简化代码量
Reference:

1、理论基础

1.1 EfficientNet网络简析

网络发表的论文：EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
论文下载：论文下载地址

论文相关代码：论文提供github代码访问地址

EfficientNet 网络结构的改进之处

在这里插入图片描述

这就是可能为什么EfficientNet会有不同的版本模型，网络的深度和宽度不同，效果也就不同.

EfficientNet不同模型的参数取值

在这里插入图片描述

EfficientNet 模型从 B0 到 B7 对于电脑的显存要求越来越高的。

论文中不同 EfficientNet 模型的性能对比

在这里插入图片描述

分析：EfficientNet-B0 baseline network 网络结构

在这里插入图片描述

关于 MBConv 简析

在这里插入图片描述

解释：

MBConv1 ， MBConv6 …MBConv 后的数字就是channel 的 n 值（倍率因子）
11 卷积升维
se 为注意力机制
se 后的 11 卷积降维

SE 注意力机制模块

在这里插入图片描述

2、网络搭建与训练、预测

依赖库

requirement

numpy==1.19.5
matplotlib==3.2.1
tqdm==4.56.0
torch >=1.7.1
torchvision>=0.8.2

2.1 代码实现网络架构

声明：

这里以 EfficientNet_B0 模型为例，实现网络的搭建训练与预测，但是实际代码包含了实现从 B0 到 B7 的功能，只要更改相应的参数，就可改变使用不同的模型进行训练，所以看起来比较复杂，如果熟悉以后，可以单独拿出来自己需要的代码块，组成单一模型的网络架构，会对网络的搭建与功能实现理解的更加清晰！

model.py 文件

依据上述的 EfficientNet-B0 baseline network 网络结构实现（卷积层、池化层、全连接层）

代码关键地方参考注释

import math
import copy
from functools import partial
from collections import OrderedDict
from typing import Optional, Callable

import torch
import torch.nn as nn
from torch import Tensor
from torch.nn import functional as F


def _make_divisible(ch, divisor=8, min_ch=None):     # 将传入的channel个数调整到离它最近的8的整数倍，这样对于我们的硬件更加的友好
    """
    This function is taken from the original tf repo.
    It ensures that all layers have a channel number that is divisible by 8
    It can be seen here:
    https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet/mobilenet.py
    """
    if min_ch is None:
        min_ch = divisor
    new_ch = max(min_ch, int(ch + divisor / 2) // divisor * divisor)
    # Make sure that round down does not go down by more than 10%.
    if new_ch < 0.9 * ch:
        new_ch += divisor
    return new_ch


def drop_path(x, drop_prob: float = 0., training: bool = False):
    """
    Drop paths (Stochastic Depth) per sample (when applied in main path of residual blocks).
    "Deep Networks with Stochastic Depth", https://arxiv.org/pdf/1603.09382.pdf

    This function is taken from the rwightman.
    It can be seen here:
    https://github.com/rwightman/pytorch-image-models/blob/master/timm/models/layers/drop.py#L140
    """
    if drop_prob == 0. or not training:
        return x
    keep_prob = 1 - drop_prob
    shape = (x.shape[0],) + (1,) * (x.ndim - 1)  # work with diff dim tensors, not just 2D ConvNets
    random_tensor = keep_prob + torch.rand(shape, dtype=x.dtype, device=x.device)
    random_tensor.floor_()  # binarize
    output = x.div(keep_prob) * random_tensor
    return output


class DropPath(nn.Module):
    """
    Drop paths (Stochastic Depth) per sample  (when applied in main path of residual blocks).
    "Deep Networks with Stochastic Depth", https://arxiv.org/pdf/1603.09382.pdf
    """
    def __init__(self, drop_prob=None):
        super(DropPath, self).__init__()
        self.drop_prob = drop_prob

    def forward(self, x):
        return drop_path(x, self.drop_prob, self.training)


class ConvBNActivation(nn.Sequential):
    def __init__(self,
                 in_planes: int,
                 out_planes: int,
                 kernel_size: int = 3,
                 stride: int = 1,
                 groups: int = 1,   # 作用：控制当前的卷积结构是使用普通的卷积还是使用 Dw 卷积
                 norm_layer: Optional[Callable[..., nn.Module]] = None,   # (BN结构)
                 activation_layer: Optional[Callable[..., nn.Module]] = None):    #（激活函数）
        padding = (kernel_size - 1) // 2
        if norm_layer is None:
            norm_layer = nn.BatchNorm2d
        if activation_layer is None:
            activation_layer = nn.SiLU  # alias Swish  (torch>=1.7)
        # 定义卷积层
        super(ConvBNActivation, self).__init__(nn.Conv2d(in_channels=in_planes,
                                                         out_channels=out_planes,
                                                         kernel_size=kernel_size,
                                                         stride=stride,
                                                         padding=padding,
                                                         groups=groups,
                                                         bias=False),  # 使用了 BN 结构，bias 设置为 false 
                                               norm_layer(out_planes),
                                               activation_layer())

# SE 模块（注意力机制）
class SqueezeExcitation(nn.Module):
    def __init__(self,
                 input_c: int,   # block input channel
                 expand_c: int,  # block expand channel
                 squeeze_factor: int = 4):
        super(SqueezeExcitation, self).__init__()
        squeeze_c = input_c // squeeze_factor
        self.fc1 = nn.Conv2d(expand_c, squeeze_c, 1)  # 全连接层
        self.ac1 = nn.SiLU()  # alias Swish
        self.fc2 = nn.Conv2d(squeeze_c, expand_c, 1)
        self.ac2 = nn.Sigmoid()

    def forward(self, x: Tensor) -> Tensor:
        scale = F.adaptive_avg_pool2d(x, output_size=(1, 1))  # 全局平均池化
        scale = self.fc1(scale)
        scale = self.ac1(scale)
        scale = self.fc2(scale)
        scale = self.ac2(scale)
        return scale * x


class InvertedResidualConfig:
    # kernel_size, in_channel, out_channel, exp_ratio, strides, use_SE, drop_connect_rate
    def __init__(self,
                 kernel: int,          # 3 or 5
                 input_c: int,
                 out_c: int,
                 expanded_ratio: int,  # 1 or 6
                 stride: int,          # 1 or 2
                 use_se: bool,         # True
                 drop_rate: float,
                 index: str,           # 1a, 2a, 2b, ...
                 width_coefficient: float):           # 倍率因子
        self.input_c = self.adjust_channels(input_c, width_coefficient)
        self.kernel = kernel
        self.expanded_c = self.input_c * expanded_ratio
        self.out_c = self.adjust_channels(out_c, width_coefficient)
        self.use_se = use_se
        self.stride = stride
        self.drop_rate = drop_rate
        self.index = index

    @staticmethod
    def adjust_channels(channels: int, width_coefficient: float):
        return _make_divisible(channels * width_coefficient, 8)


class InvertedResidual(nn.Module):
    def __init__(self,
                 cnf: InvertedResidualConfig,
                 norm_layer: Callable[..., nn.Module]):
        super(InvertedResidual, self).__init__()

        if cnf.stride not in [1, 2]:
            raise ValueError("illegal stride value.")

        self.use_res_connect = (cnf.stride == 1 and cnf.input_c == cnf.out_c)

        layers = OrderedDict()
        activation_layer = nn.SiLU  # alias Swish

        # expand
        if cnf.expanded_c != cnf.input_c:
            layers.update({"expand_conv": ConvBNActivation(cnf.input_c,
                                                           cnf.expanded_c,
                                                           kernel_size=1,
                                                           norm_layer=norm_layer,
                                                           activation_layer=activation_layer)})

        # depthwise
        layers.update({"dwconv": ConvBNActivation(cnf.expanded_c,
                                                  cnf.expanded_c,
                                                  kernel_size=cnf.kernel,
                                                  stride=cnf.stride,
                                                  groups=cnf.expanded_c,
                                                  norm_layer=norm_layer,
                                                  activation_layer=activation_layer)})

        if cnf.use_se:
            layers.update({"se": SqueezeExcitation(cnf.input_c,
                                                   cnf.expanded_c)})

        # project
        layers.update({"project_conv": ConvBNActivation(cnf.expanded_c,
                                                        cnf.out_c,
                                                        kernel_size=1,
                                                        norm_layer=norm_layer,
                                                        activation_layer=nn.Identity)})

        self.block = nn.Sequential(layers)
        self.out_channels = cnf.out_c
        self.is_strided = cnf.stride > 1

        # 只有在使用shortcut连接时才使用dropout层
        if self.use_res_connect and cnf.drop_rate > 0:
            self.dropout = DropPath(cnf.drop_rate)
        else:
            self.dropout = nn.Identity()

    def forward(self, x: Tensor) -> Tensor:
        result = self.block(x)
        result = self.dropout(result)
        if self.use_res_connect:
            result += x

        return result


class EfficientNet(nn.Module):
    def __init__(self,
                 width_coefficient: float,
                 depth_coefficient: float,
                 num_classes: int = 1000,
                 dropout_rate: float = 0.2,
                 drop_connect_rate: float = 0.2,
                 block: Optional[Callable[..., nn.Module]] = None,
                 norm_layer: Optional[Callable[..., nn.Module]] = None
                 ):
        super(EfficientNet, self).__init__()

        # kernel_size, in_channel, out_channel, exp_ratio, strides, use_SE, drop_connect_rate, repeats
        default_cnf = [[3, 32, 16, 1, 1, True, drop_connect_rate, 1],
                       [3, 16, 24, 6, 2, True, drop_connect_rate, 2],
                       [5, 24, 40, 6, 2, True, drop_connect_rate, 2],
                       [3, 40, 80, 6, 2, True, drop_connect_rate, 3],
                       [5, 80, 112, 6, 1, True, drop_connect_rate, 3],
                       [5, 112, 192, 6, 2, True, drop_connect_rate, 4],
                       [3, 192, 320, 6, 1, True, drop_connect_rate, 1]]

        def round_repeats(repeats):
            """Round number of repeats based on depth multiplier."""
            return int(math.ceil(depth_coefficient * repeats))

        if block is None:
            block = InvertedResidual

        if norm_layer is None:
            norm_layer = partial(nn.BatchNorm2d, eps=1e-3, momentum=0.1)

        adjust_channels = partial(InvertedResidualConfig.adjust_channels,
                                  width_coefficient=width_coefficient)

        # build inverted_residual_setting
        bneck_conf = partial(InvertedResidualConfig,
                             width_coefficient=width_coefficient)

        b = 0
        num_blocks = float(sum(round_repeats(i[-1]) for i in default_cnf))
        inverted_residual_setting = []
        for stage, args in enumerate(default_cnf):
            cnf = copy.copy(args)
            for i in range(round_repeats(cnf.pop(-1))):
                if i > 0:
                    # strides equal 1 except first cnf
                    cnf[-3] = 1  # strides
                    cnf[1] = cnf[2]  # input_channel equal output_channel

                cnf[-1] = args[-2] * b / num_blocks  # update dropout ratio
                index = str(stage + 1) + chr(i + 97)  # 1a, 2a, 2b, ...      可以记录当前MBConv结构是属于第几个stage中的第几个MBConv结构
                inverted_residual_setting.append(bneck_conf(*cnf, index))
                b += 1

        # create layers
        layers = OrderedDict()

        # first conv
        layers.update({"stem_conv": ConvBNActivation(in_planes=3,
                                                     out_planes=adjust_channels(32),
                                                     kernel_size=3,
                                                     stride=2,
                                                     norm_layer=norm_layer)})

        # building inverted residual blocks
        for cnf in inverted_residual_setting:
            layers.update({cnf.index: block(cnf, norm_layer)})

        # build top
        last_conv_input_c = inverted_residual_setting[-1].out_c
        last_conv_output_c = adjust_channels(1280)
        layers.update({"top": ConvBNActivation(in_planes=last_conv_input_c,
                                               out_planes=last_conv_output_c,
                                               kernel_size=1,
                                               norm_layer=norm_layer)})

# 池化层结构搭建
        self.features = nn.Sequential(layers)
        self.avgpool = nn.AdaptiveAvgPool2d(1)
  # 分类器  
        classifier = []
        if dropout_rate > 0:
            classifier.append(nn.Dropout(p=dropout_rate, inplace=True))
        classifier.append(nn.Linear(last_conv_output_c, num_classes))
        self.classifier = nn.Sequential(*classifier)

        # initial weights
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode="fan_out")
                if m.bias is not None:
                    nn.init.zeros_(m.bias)
            elif isinstance(m, nn.BatchNorm2d):
                nn.init.ones_(m.weight)
                nn.init.zeros_(m.bias)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.zeros_(m.bias)

    def _forward_impl(self, x: Tensor) -> Tensor:
        x = self.features(x)
        x = self.avgpool(x)
        x = torch.flatten(x, 1)
        x = self.classifier(x)

        return x

    def forward(self, x: Tensor) -> Tensor:
        return self._forward_impl(x)

# 不同版本的 efficient 参数传入设置实现
def efficientnet_b0(num_classes=1000):
    # input image size 224x224
    return EfficientNet(width_coefficient=1.0,
                        depth_coefficient=1.0,
                        dropout_rate=0.2,
                        num_classes=num_classes)


def efficientnet_b1(num_classes=1000):
    # input image size 240x240
    return EfficientNet(width_coefficient=1.0,
                        depth_coefficient=1.1,
                        dropout_rate=0.2,
                        num_classes=num_classes)


def efficientnet_b2(num_classes=1000):
    # input image size 260x260
    return EfficientNet(width_coefficient=1.1,
                        depth_coefficient=1.2,
                        dropout_rate=0.3,
                        num_classes=num_classes)


def efficientnet_b3(num_classes=1000):
    # input image size 300x300
    return EfficientNet(width_coefficient=1.2,
                        depth_coefficient=1.4,
                        dropout_rate=0.3,
                        num_classes=num_classes)


def efficientnet_b4(num_classes=1000):
    # input image size 380x380
    return EfficientNet(width_coefficient=1.4,
                        depth_coefficient=1.8,
                        dropout_rate=0.4,
                        num_classes=num_classes)


def efficientnet_b5(num_classes=1000):
    # input image size 456x456
    return EfficientNet(width_coefficient=1.6,
                        depth_coefficient=2.2,
                        dropout_rate=0.4,
                        num_classes=num_classes)


def efficientnet_b6(num_classes=1000):
    # input image size 528x528
    return EfficientNet(width_coefficient=1.8,
                        depth_coefficient=2.6,
                        dropout_rate=0.5,
                        num_classes=num_classes)


def efficientnet_b7(num_classes=1000):
    # input image size 600x600
    return EfficientNet(width_coefficient=2.0,
                        depth_coefficient=3.1,
                        dropout_rate=0.5,
                        num_classes=num_classes)

2.2 训练过程

train.py

代码关键地方参考注释

import os
import math
import argparse

import torch
import torch.optim as optim
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
import torch.optim.lr_scheduler as lr_scheduler      

from model import efficientnet_b0 as create_model     # 使用 b0 版本 与35行 num_model = "B0"  保持一致（控制传入的图片尺寸大小，不同版本传入的图片尺寸大小不一样）
from my_dataset import MyDataSet
from utils import read_split_data, train_one_epoch, evaluate


def main(args):
    device = torch.device(args.device if torch.cuda.is_available() else "cpu")

    print(args)
    print('Start Tensorboard with "tensorboard --logdir=runs", view at http://localhost:6006/')
    tb_writer = SummaryWriter()
    if os.path.exists("./weights") is False:
        os.makedirs("./weights")

    train_images_path, train_images_label, val_images_path, val_images_label = read_split_data(args.data_path)

    img_size = {"B0": 224,
                "B1": 240,
                "B2": 260,
                "B3": 300,
                "B4": 380,
                "B5": 456,
                "B6": 528,
                "B7": 600}
    num_model = "B0"                   

    data_transform = {
        "train": transforms.Compose([transforms.RandomResizedCrop(img_size[num_model]),
                                     transforms.RandomHorizontalFlip(),
                                     transforms.ToTensor(),
                                     transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])]),
        "val": transforms.Compose([transforms.Resize(img_size[num_model]),
                                   transforms.CenterCrop(img_size[num_model]),
                                   transforms.ToTensor(),
                                   transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])}

    # 实例化训练数据集
    train_dataset = MyDataSet(images_path=train_images_path,
                              images_class=train_images_label,
                              transform=data_transform["train"])

    # 实例化验证数据集
    val_dataset = MyDataSet(images_path=val_images_path,
                            images_class=val_images_label,
                            transform=data_transform["val"])

    batch_size = args.batch_size
    nw = min([os.cpu_count(), batch_size if batch_size > 1 else 0, 8])  # number of workers
    print('Using {} dataloader workers every process'.format(nw))
    train_loader = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size,
                                               shuffle=True,
                                               pin_memory=True,
                                               num_workers=nw,
                                               collate_fn=train_dataset.collate_fn)

    val_loader = torch.utils.data.DataLoader(val_dataset,
                                             batch_size=batch_size,
                                             shuffle=False,
                                             pin_memory=True,
                                             num_workers=nw,
                                             collate_fn=val_dataset.collate_fn)

    # 如果存在预训练权重则载入
    model = create_model(num_classes=args.num_classes).to(device)
    if os.path.exists(args.weights):
        weights_dict = torch.load(args.weights, map_location=device)
        load_weights_dict = {k: v for k, v in weights_dict.items()
                             if model.state_dict()[k].numel() == v.numel()}
        print(model.load_state_dict(load_weights_dict, strict=False))

    # 是否冻结权重
    if args.freeze_layers:
        for name, para in model.named_parameters():
            # 除最后一个卷积层和全连接层外，其他权重全部冻结
            if ("features.top" not in name) and ("classifier" not in name):
                para.requires_grad_(False)
            else:
                print("training {}".format(name))

    pg = [p for p in model.parameters() if p.requires_grad]
    optimizer = optim.SGD(pg, lr=args.lr, momentum=0.9, weight_decay=1E-4)
    # Scheduler https://arxiv.org/pdf/1812.01187.pdf
    lf = lambda x: ((1 + math.cos(x * math.pi / args.epochs)) / 2) * (1 - args.lrf) + args.lrf  # cosine
    scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)

    for epoch in range(args.epochs):
        # train
        mean_loss = train_one_epoch(model=model,
                                    optimizer=optimizer,
                                    data_loader=train_loader,
                                    device=device,
                                    epoch=epoch)

        scheduler.step()

        # validate
        acc = evaluate(model=model,
                       data_loader=val_loader,
                       device=device)
        print("[epoch {}] accuracy: {}".format(epoch, round(acc, 3)))
        tags = ["loss", "accuracy", "learning_rate"]
        tb_writer.add_scalar(tags[0], mean_loss, epoch)
        tb_writer.add_scalar(tags[1], acc, epoch)
        tb_writer.add_scalar(tags[2], optimizer.param_groups[0]["lr"], epoch)

        torch.save(model.state_dict(), "./weights/model-{}.pth".format(epoch))


if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--num_classes', type=int, default=5)          # 训练时候的类别个数依据需要修改
    parser.add_argument('--epochs', type=int, default=30)
    parser.add_argument('--batch-size', type=int, default=16)
    parser.add_argument('--lr', type=float, default=0.01)
    parser.add_argument('--lrf', type=float, default=0.01)

    # 数据集所在根目录
    # http://download.tensorflow.org/example_images/flower_photos.tgz
    parser.add_argument('--data-path', type=str,
                        default="/data/flower_photos")

    # download model weights（B0-->B7）
    # 此预训练权重非pytorch官网提供的权重，而是通过tensorflow官方转化过来的权重
    # 链接: https://pan.baidu.com/s/1ouX0UmjCsmSx3ZrqXbowjw  密码: 090i
    parser.add_argument('--weights', type=str, default='./efficientnetb0.pth',       # 选用的预训练权重要和使用的版本一致
                        help='initial weights path')
    parser.add_argument('--freeze-layers', type=bool, default=False)
    # freeze-layers默认为false（调整所有的权重，），如果只想微调最后一个1*1的卷积层，以及全连接层，改为True 即可
   
    parser.add_argument('--device', default='cuda:0', help='device id (i.e. 0 or 0,1 or cpu)')

    opt = parser.parse_args()

    main(opt)

更改数据集训练自己的模型

依据给出的代码，更改参数后运行

更改数据的地方
① 数据集路径
② 训练的参数（num_classes，epochs，batch-size等等）
③ 预训练的权重，这里使用了预训练模型_b0 (网盘链接中的预训练权重)

在这里插入图片描述

训练结果：

在这里插入图片描述

训练数据集的文件夹方式（文件夹里直接是.jpg 图片）

在这里插入图片描述

2.3 预测

predict.py

import os
import json

import torch
from PIL import Image
from torchvision import transforms
import matplotlib.pyplot as plt

from model import efficientnet_b0 as create_model    # 训练哪个模型就导入哪个模型


def main():
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

    img_size = {"B0": 224,
                "B1": 240,
                "B2": 260,
                "B3": 300,
                "B4": 380,
                "B5": 456,
                "B6": 528,
                "B7": 600}
    num_model = "B0"                 # 注意不同模型之间输入图像大小的问题，模型参数保持一致

    data_transform = transforms.Compose(
        [transforms.Resize(img_size[num_model]),
         transforms.CenterCrop(img_size[num_model]),
         transforms.ToTensor(),
         transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])

    # load image
    img_path = "../tulip.jpg"
    assert os.path.exists(img_path), "file: '{}' dose not exist.".format(img_path)
    img = Image.open(img_path)
    plt.imshow(img)
    # [N, C, H, W]
    img = data_transform(img)
    # expand batch dimension
    img = torch.unsqueeze(img, dim=0)

    # read class_indict   （）
    json_path = './class_indices.json'
    assert os.path.exists(json_path), "file: '{}' dose not exist.".format(json_path)

    json_file = open(json_path, "r")
    class_indict = json.load(json_file)

    # create model（创建模型）
    model = create_model(num_classes=5).to(device)     # 训练时候的类别个数依据需要修改（训练脚本同样）
    # load model weights
    model_weight_path = "./weights/model-29.pth"       # 导入训练好的权重
    model.load_state_dict(torch.load(model_weight_path, map_location=device))
    model.eval()
    with torch.no_grad():
        # predict class
        output = torch.squeeze(model(img.to(device))).cpu()
        predict = torch.softmax(output, dim=0)
        predict_cla = torch.argmax(predict).numpy()

    print_res = "class: {}   prob: {:.3}".format(class_indict[str(predict_cla)],
                                                 predict[predict_cla].numpy())
    plt.title(print_res)
    print(print_res)
    plt.show()


if __name__ == '__main__':
    main()

数据集问题

如果使用自己的数据集，与此保持结构，创建不同类别的子文件夹

在这里插入图片描述
本文复现时候数据划分：

实操预测的效果：

依据上面给的预测文件中的代码，更改参数后运行

在这里插入图片描述

3、实际训练操作小结

① 直接使用代码训练自己的数据集时候，对于model.py 不用修改

② 对于 train.py文件，选定要使用的训练模板b0-b7中的哪一个，从连接中网盘下对应的载预训练权重，放在代码根目录下，并在代码中修改路径导入，然后把数据集划分并将路径导入代码，之后再修改训练超参数，就可以进行训练。

③ 使用predict.py预测，只需要更改导入训练好的模型权重，指定要预测的图片与路径即可，代码其他部分不用动。

4、代码的提取与简化

使用集成好的模型，直接调用库训练自己的数据集，简化代码量

from efficientnet_pytorch import EfficientNet

后续更新。。。。。。

Reference:

视频链接：https://www.bilibili.com/video/BV1XK4y1U7PX

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络的相关文章

【Linux 裸机篇（七）】I.MX6U 中断系统

目录一中断向量表1 中断向量偏移二中断系统简介1 创建中断向量表三 GIC 控制器简介1 中断 ID 四 GIC 逻辑分块1 Distributor 分发器端 2 CPU Interface CPU 接口端五 CP15 协处理器
【Linux 裸机篇（八）】I.MX6U EPIT 定时器中断、定时器按键消抖

目录一 EPIT 定时器简介二定时器按键消抖一 EPIT 定时器简介 EPIT 的全称是 xff1a Enhanced Periodic Interrupt Timer xff0c 直译过来就是增强的周期中断定时器 xff0c 它主要
PCB拼板和工艺边教程

PCB拼板 xff0c 主要是为了充分利用板材 xff0c 从而提高生产效率比较简单的是 xff0c 规则板框的拼板如上图的 xff0c 板框是正方形 xff0c 很容易就拼了四块板 xff0c 其中 xff0c 只需要有一块板有布线
curl命令模拟get请求时遇到特殊字符{}被过滤异常处理

curl命令模拟get请求时遇到特殊字符 xff0c 接口接受参数不符合预期 crul请求 curl GET http test com opdgApply pageNum 61 1 amp sortDesc 61 true amp sea
函数声明在头文件中的好处，可以利用静态库隐藏算法

背景 xff1a 现在有个程序员A想实现一个算法 xff0c 这个算法是俩数之和 xff0c 他自己不会于是他去买程序员B的已经做好的算法 xff0c 但是程序员B不想让他看到算法结构应该怎么做 1 首先程序员B需要写程序 xff0c 包括
Javaparser使用

Javaparser使用什么是Javaparser 分析转换生成Java代码 Javaparser库为你提供了一个 Java 代码的抽象语法树 Abstract Syntax Tree AST 结构允许您以一种简单的编程方式使用 Ja
YUV和RGB图像格式说明

对于进行图像处理的程序员来说 xff0c 图像格式是必须了解的问题本文不涉及压缩图像格式 xff0c 只对YUV和RGB图像进行描述 1 RGB图像和YUV图像区别 RGB和YUV图像的区别在于色彩空间坐标系描述上不同 xff0c 就如同
CMake 常用指令

文章目录范式环境 amp 工程配置 96 cmake minimum required 96 96 project 96 96 file 96 添加头文件搜索路径 96 link directories 96 96 add compile
（JAVA）国际跳棋--棋里乾坤

导入因为假期内被朋友带入坑后起了兴趣 xff0c 但发现网上似乎没有什么人写过国际跳棋的相关制作过程 xff0c 于是制作了一个单纯的java的国际跳棋程序 xff0c 虽然没有AI xff0c 但能够实现玩家双方的任务和皮肤目前只设置
力扣刷题日记 211. 添加与搜索单词

211 添加与搜索单词题目描述题解思路代码结语题目描述题解思路首先 xff0c 这道题要求我们给出所有结果 xff0c 那就意味着我们可能只能选择枚举这一条路 xff0c 然后再看到数据范围 xff0c 好家伙 xff0c 确实挺
力扣刷题日记 798. 得分最高的最小轮调

798 得分最高的最小轮调题目描述题解思路代码结语题目描述题解思路数据范围没有截图到 xff0c 这里的数据范围为0 20000 题目的内容还是很好理解的 xff0c 就是给你一个数组 xff0c 你可以将数组内容向左推移若干次 x
Java实现简单的计算器

文章目录前言一主界面部分二监听器部分三结果计算部分总结前言最近在复习着Java Swing的使用 xff0c 在布局这块反复又看了很久 xff0c 然后突然发现GirdLayout机器适合来做一个计算器的简单样子 xff0c 所
多旋翼飞行器设计与控制（一）

一基本概念固定翼直升机多旋翼复合飞行器二操控和评价四旋翼操控对比评价局限性三发展历史休眠期 xff08 1990前 xff09 复苏期 xff08 1990 2005 xff09 产品方面学术方面发展期 xff08 2005 2
考试中暴露的问题

1 注意位运算可以去看看洛谷里如果城堡不用位运算处理的话会怎样233 2 注意数学函数 xff0c 如sqrt为开根号 xff0c abs为绝对值 xff1b 3 最长上升子序列upper bound与lower bound的用法要知道
10月28日考试解题报告

考试中的心路历程说实话第一道题和第三道题真的是水题 xff0c 然鹅我只搞到了100分 xff0c 感觉有些亏 xff0c 最后一题看错了题目 xff0c 导致我的思路开始各种螺旋 xff0c 当其他人都为第二题思考的时候 xff0c 我
10月30日解题报告

做题思路第一题表示根本没有想到是线段树这种东西 xff0c 结果看到题解的时候内心是崩溃的 xff0c 看了线段树还是得多练练 xff0c 第二题是dp xff0c 算是简单 xff0c 但是自己没有想到还是很伤 xff0c 也还是要多
C++ 获取string字符串长度的三种方法

1 用string的成员方法length 获取字符串长度 length 比较直观 xff0c 表示的就是该字符串的长度 include lt string gt include lt iostream gt using namespace
sublime text3 搭建python环境

1 python下载 python安装文件下载 2 安装easy install 方法是下载ez setup py后 xff0c 在cmd下执行 pythonez setup py xff0c 即可自动安装setuptools window
C++ 字符串指针和字符串指针数组详解

C 43 43 处理字符串有两种方式 xff0c 即 xff1a 指针方式和数组方式数组方式 xff1a char a 61 34 HelloWorld 34 指针方式 xff1a const char s 61 34 HelloWorl
【C++笔记】关于push_back(vector＜int＞())；

vector lt vector lt int gt gt vec vec push back vector lt int gt vec back push back vec n push back 今天在刷leetcode题的时候见到如上

随机推荐

C++ const用法总结

const 是constant的简写 xff0c 是C 43 43 中极为常见且重要的关键字 xff0c 主要功能是设置某些参数不可修改 xff0c 今天对其用法进行总结记录一在变量中的用法对变量进行修饰是const最基本的用法 xf
C++ 函数指针以及对void*（* func）（void *）的解读

1 函数指针我们知道调用一个函数的时候可以给其传递参数 xff0c 这个参数可以是变量 xff0c 也可以是变量的引用或者指针那如果想传递另一个函数可以做到吗 xff1f C提供了函数指针这一用法来完成这个需求函数在内存中是占据一片空
线程同步之互斥锁

1 问题单线程执行任务的场景通常是简单不易出错的 xff0c 但是多线程执行任务时 xff0c 由于线程对于内存空间的共享特性 xff0c 在并发执行时却会产生一些意料之外的错误如下列程序 xff1a include 34 unpthr
C++知识点梳理(1)

C 43 43 程序由一个或者多个被称为函数的模块组成和函数从main函数 xff08 全部小写 xff09 开始执行 xff0c 所以main函数必不可少函数头指向函数的返回值 xff08 如果有函数头 xff09 的类型和函数期望通
串口扩展研究

串口扩展研究曾几何时 xff0c 鼠标键盘还是PS 2接口 xff0c 在向USB过渡过程中会有一些 USB to PS 2 神器出现当主设备 xff08 电脑 xff09 和从设备 xff08 鼠标键盘 xff09 都配标准的USB接
cmake 工具三 add_libary， set_target_properties，target_link_libary，link_directories, link_libary

一起通过一个例子学一下 add libary xff0c set target properties xff0c link libary xff0c target link libary 四个命令首先创建如下的文件 xff1a 其中 bu
ESP32-C3入门教程蓝牙篇①——基于Blufi 的 WiFi 智能配网

文章目录一前言二 WiFi配网方式三快速运行四运行效果五程序流程精简 5 1 WiFi 初始化 5 2 BLE 初始化 5 3 WiFi 回调函数 5 4 BLE 回调函数 5 5 Blufi 回调函数 5 6 流程图
FreeRTOS STM32 线程创建失败，单步运行一看才发现是内存不够

文章目录一 FreeRTOS线程创建失败二失败的解决方法三成功的解决方法一 FreeRTOS线程创建失败今天用STM32板子跑一个测试demo xff0c 结果一上车就翻车一个简简单单的线程起不来断点进不去 xff0c 单步运
HTML5 播放器

暂存一些HTML5播放器的资料 xff0c 慢慢消化使用 HTML5 技术播放视频使用 Clear Key 加密 MP4 视频并播放 Encrypted Media Extensions An introduction to Encry
ESP32-C3入门教程蓝牙篇③——基于微信小程序和Esp Blufi实现 WiFi配网

基于微信小程序和Esp Blufi实现 WiFi配网文章目录一前言二软件框架三软件流程四 API介绍五全部源码一前言本文基于VS Code IDE进行编程编译下载运行等操作基础入门章节请查阅 ESP32 C
路由器重温——接口配置与管理1

路由器的接口相对于交换机接口来说最大的特点就是接口类型和配置更为复杂 xff0c 一般可以把路由器上的接口分为三大类 xff1a 一类是用于局域网组网的LAN接口 xff0c 另一类是用于广域网接入互联的WAN接口 xff0c 最后一类可
路由器接口配置与管理——1

路由器的接口相对于交换机来说最大的特点就是接口类型和配置更为复杂 xff0c 一般吧路由器上的接口分为三大类 xff1a 一类用于局域网的LAN接口 xff0c 一类用于广域网接入互联的WAN接口 xff0c 最后一类可以应用于LAN组网
使用A＊算法寻找路径

使用A xff0a 算法首先需要将地图分成一个个块 xff0c 每个块称为一个节点算法主要是维护两张表 openList和closeList openList用来保存待考察的节点 xff0c closeList用来保存不需要考察的节点算
关于C++中的#define

include lt iostream gt using namespace std define ADD x y x 43 y 试卷上是减号 xff0c 本人觉得是加号 int main int m 61 3 int n 61 4 m 4
c++常用STL库及常用函数

临近各种算法比赛 xff0c 相信很多人想笔者一样还总是记不住很多函数的用法 xff0c 特此总结一下常用的STL标准库以及标准函数 xff0c 希望能够有所帮助 1 输入输出输入输出一般用两个标准库 xff1a include lt c
cv2.rectangle()函数

cv2 rectangle 函数 cv2 rectangle img pt1 pt2 color thickness lineType shift 参数表示依次为 xff1a xff08 图片 xff0c 长方形框左上角坐标长方形框右下角
微信公众号中视频下载的2种方法

介绍twitter视频下载的2种方法文前白话1 使用在线网站2 使用使用桌面版软件GTG 文前白话提示 xff1a 微信公众号中的很多视频可以在YouTube上还有推特上找到并去下载保存 1 使用在线网站链接 xff1a 在线网站
深度剖析WinPcap之(四)——WinPcap的体系架构(1)

本文转自http eslxf blog 51cto com 918801 197405 WinPcap是Win32平台下用于数据包捕获与网络分析的一个架构它包含一个内核层数据包过滤器 xff0c 一个底层动态链接库 xff08 packe
C++ 学习建议

C 43 43 缺点之一 xff0c 是相对许多语言复杂 xff0c 而且难学难精 C 43 43 的优点就是即能接触底层也可用于上层开发我是从C进入C 43 43 xff0c 皆是靠阅读自学在此分享一点学习心得个人认为 xff0c
【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络

深度学习图像分类篇 Pytorch搭建EfficientNe图像分类网络 1 理论基础1 1 EfficientNet网络简析EfficientNet 网络结构的改进之处EfficientNet不同模型的参数取值论文中不同 Efficie

【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络

【深度学习-图像分类篇】Pytorch搭建EfficientNe图像分类网络

1、理论基础

1.1 EfficientNet网络简析

EfficientNet 网络结构的改进之处

EfficientNet不同模型的参数取值

论文中不同 EfficientNet 模型的性能对比

分析：EfficientNet-B0 baseline network 网络结构

关于 MBConv 简析

SE 注意力机制模块

2、网络搭建与训练、预测

依赖库

2.1 代码实现网络架构

声明：

model.py 文件

2.2 训练过程

train.py

更改数据集训练自己的模型

2.3 预测

predict.py

数据集问题

实操预测的效果：

3、实际训练操作小结

4、代码的提取与简化

使用集成好的模型，直接调用库训练自己的数据集，简化代码量

Reference:

【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络 的相关文章

随机推荐

热门标签

【深度学习-图像分类篇】一文全：Pytorch搭建EfficientNe图像分类网络的相关文章