基于卷积神经网络的脱机手写签名识别（Pytorch，Opencv，CNN）

2023-11-13

文章目录

前言：
resnet18模型结构：
resnet18实现代码
数据集：
训练模型：
项目结构：

前言：

最近做了一个手写签名识别的项目，即判断签名的真伪。使用的深度学习框架为Pytorch，Opencv等等。数据集中共包含17个人的签名。使用resnet18网络进行训练。文末附有源码下载地址。

Bi 设 Dai 坐

视频效果如下所示：

深度学习脱机手写签名识别（Pytorch，Opencv）

resnet18模型结构：

在这里插入图片描述

resnet18实现代码

加载pytorch内部自带resnet18模型，代码较为简单：

from torchvision import models
import torch.nn as nn

#加载resnet18模型
net=models.resnet18(pretrained=False)
#因为输入图片为单通道图片，所以修改模型第一个卷积层
net.conv1=nn.Conv2d(1, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
#因为分类个数为34，所以需要修改模型最后一层全连接层
net.fc=nn.Linear(in_features=512, out_features=34, bias=True)
# print(net)

数据集：

部分数据集图像如下所示：
在这里插入图片描述

训练模型：

代码如下所示：

from mymodel import net
from myDataset import MyData
import random
from torch.utils.data import DataLoader
import torch.nn as nn
import torch.optim as optim
import torch
from tqdm import tqdm
import matplotlib.pylab as plt

batch_size=20
Epoch=50
lr=0.0002

lines=open('data.txt','r').readlines()
random.shuffle(lines)
val_lines=random.sample(lines,int(len(lines)*0.1))
train_lines=list(set(lines)-set(val_lines))


train_data=MyData(lines=train_lines)
val_data=MyData(lines=val_lines,train=False)
train_loader=DataLoader(dataset=train_data,batch_size=batch_size,shuffle=True)
val_loader=DataLoader(dataset=val_data,batch_size=batch_size,shuffle=False)

num_train   = len(train_lines)
epoch_step  = num_train // batch_size
BCE_loss     = nn.BCELoss()
optimizer  = optim.Adam(net.parameters(), lr=lr, betas=(0.5, 0.999))
lr_scheduler  = optim.lr_scheduler.StepLR(optimizer, step_size=1, gamma=0.99)
#获取学习率函数
def get_lr(optimizer):
    for param_group in optimizer.param_groups:
        return param_group['lr']
#计算准确率函数
def metric_func(pred,lab):
    _,index=torch.max(pred,dim=-1)
    acc=torch.where(index==lab,1.,0.).mean()
    return acc
device=torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
net=net.to(device)
#设置损失函数
loss_fun     = nn.CrossEntropyLoss()

if __name__ == '__main__':

    T_acc=[]
    V_acc=[]
    T_loss=[]
    V_loss=[]

    # 设置迭代次数200次
    epoch_step = num_train // batch_size
    for epoch in range(1, Epoch + 1):
        net.train()

        total_loss = 0
        loss_sum = 0.0
        train_acc_sum=0.0

        with tqdm(total=epoch_step, desc=f'Epoch {epoch}/{Epoch}', postfix=dict, mininterval=0.3) as pbar:
            for step, (features, labels) in enumerate(train_loader, 1):
                features = features.to(device)
                labels = labels.to(device)
                batch_size = labels.size()[0]

                optimizer.zero_grad()
                predictions = net(features)
                loss = loss_fun(predictions, labels)
                loss.backward()
                optimizer.step()
                total_loss += loss
                train_acc = metric_func(predictions, labels)
                train_acc_sum+=train_acc
                pbar.set_postfix(**{'loss': total_loss.item() / (step),
                                    "acc":train_acc_sum.item()/(step),
                                    'lr': get_lr(optimizer)})
                pbar.update(1)
        T_acc.append(train_acc_sum.item()/(step))
        T_loss.append(total_loss.item() / (step))
        # 验证
        net.eval()
        val_acc_sum = 0
        val_loss_sum=0
        for val_step, (features, labels) in enumerate(val_loader, 1):
            with torch.no_grad():
                features = features.to(device)
                labels = labels.to(device)
                predictions = net(features)
                val_metric = metric_func(predictions, labels)
                loss=loss_fun(predictions,labels)
            val_acc_sum += val_metric.item()
            val_loss_sum+=loss.item()
        print('val_acc=%.4f' % (val_acc_sum / val_step))
        V_acc.append(round(val_acc_sum / val_step,2))
        V_loss.append(val_loss_sum/val_step)

        # 保存模型
        if (epoch) % 2 == 0:
            torch.save(net.state_dict(), 'logs/Epoch%d-Loss%.4f_.pth' % (
                epoch, total_loss / (epoch_step + 1)))

        lr_scheduler.step()

    plt.figure()
    plt.plot(T_acc,'r')
    plt.plot(V_acc,'b')
    plt.title('Training and validation Acc')
    plt.xlabel("Epochs")
    plt.ylabel("Acc")
    plt.legend(["Train_acc", "Val_acc"])
    # plt.show()

    plt.figure()
    plt.plot(T_loss, 'r')
    plt.plot(V_loss, 'b')
    plt.title('Training and validation loss')
    plt.xlabel("Epochs")
    plt.ylabel("loss")
    plt.legend(["Train_loss", "Val_loss"])
    plt.show()

项目结构：

在这里插入图片描述
运行main.py即可弹出界面。项目中包含完整的代码及数据集。

项目下载：下载地址

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

cnn

opencv

基于卷积神经网络的脱机手写签名识别（Pytorch，Opencv，CNN）的相关文章

brew 链接 jpeg 问题

我正在尝试安装opencv在 Mac OSX Lion 上 brew install opencv 我收到以下错误以及其他一些类似的错误 Error The linking step did not complete successful
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
在 RGB 图像上绘制多类语义分割透明叠加

我有语义分割掩码的结果值在 0 1 之间需要大津阈值来确定什么是积极的我想直接在 RGB 图像上绘制在 RGB 图像上每个预测类具有不同的随机颜色我使用以下内容绘制了具有单一颜色的单个蒙版是否有一个包或简单的策略可以为多类别做到
来自 OpenCV 的外部参数

我正在使用 OpenCV 来校准立体相机对我拍摄了各种校准照片并且使用 cv2 calibrateCamera 对内在参数进行了令人满意的拟合然而目前尚不清楚如何获取外部参数该函数仅返回cameraMatrix 尽管它很有用但实
提高 pytesseract 从图像中正确识别文本的能力

我正在尝试使用读取验证码pytesseract模块大多数时候它都能提供准确的文本但并非总是如此这是读取图像操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
如何将 mat 转换为 array2d？

我为dlib http dlib net face landmark detection ex cpp html那里的面部地标代码使用 array2d 来获取图像但我喜欢使用 Mat 读取图像并转换为 array2d 因为 dlib 仅支
曲线/路径骨架二值图像处理

我正在尝试开发一个可以处理图像骨架的路径曲线的代码我想要一个来自两点之间骨架的点向量该代码在添加一些点后结束我没有找到解决方案 include opencv2 highgui highgui hpp include opencv2
来自连接到远程机器的相机的 Opencv 流

我正在用 python 开发一个 wx 应用程序用于流式传输和显示来自两个不同网络摄像头的视频这工作正常但现在我需要在不同的场景中执行此操作其中两个摄像头连接在通过网络连接的 Windows 上运行的单独计算机中我的应用程序将在机
无法在 Windows 7 机器中使用 OpenCV 2.4.3、Python 2.7 打开“.mp4”视频文件

我目前正在进行一个涉及读取 mp4 视频文件的项目我遇到的问题是它在Windows 7机器上使用Python 2 7 32位 OpenCV 2 4 3 cv2 pyd 代码片段如下 try video cv2 VideoCapture v
OpenCV 3 中的 FLANN 错误

我运行的是 Ubuntu 14 04 我正在尝试使用 openCV 3 运行 FLANN 但出现错误下面的所有内容都是通过使用 AKAZE 和 ORB 进行尝试的但代码来自我尝试使用 ORB 的情况我使用 ORB 来查找描述符和关键点
opencv 2.3.* 读取不工作

我无法让 imread 工作与这个人有同样的问题 OpenCV imwrite 2 2 在 Windows 7 上导致异常并显示消息 OpenCV 错误未指定错误无法找到指定扩展名的编写器 https stackoverflow c
如何在 OpenCV 中从 YUV 文件读取帧？

如何在 OpenCV 中从 YUV 文件读取帧我编写了一个非常简单的 python 代码来从二进制文件读取 YUV NV21 流 import cv2 import numpy as np class VideoCaptureYUV de
仅获取图像中的外部轮廓

我有这段代码可以在图像中绘制轮廓但我只需要外部轮廓 import cv2 import numpy as np camino C Users Usuario Documents Deteccion de Objetos 123 jpg
Pytorch 与 joblib 的 autograd 问题

将 pytorch 的 autograd 与 joblib 混合似乎存在问题我需要并行获取大量样本的梯度 Joblib 与 pytorch 的其他方面配合良好但是与 autograd 混合时会出现错误我做了一个非常小的例子显示串行
从图像坐标获取对象的世界坐标

I have been following this http docs opencv org modules calib3d doc camera calibration and 3d reconstruction html docume
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
使用 OpenCV 和/或 Numpy 对两个图像进行 Alpha 混合 [重复]

这个问题在这里已经有答案了我想将一个填充纯色的半透明矩形添加到已加载的半透明 PNG 中这是我正在使用的输入图像示例该图像加载了标准cv2 IMREAD UNCHANGED标志以便完美保留 alpha 通道该输入图像存储在imag
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r

随机推荐

VS Code 快捷键（中英文对照版）

标签空格分隔 visual studio code 常用 General 按 Press 功能 Function Ctrl Shift P F1 显示命令面板 Show Command Palette Ctrl P 快速打开 Quick
快速解决QQ自动下载腾讯视频播放器

使用电脑QQ播放视频时 QQ总是会使用默认安装的腾讯视频播放器打开可是他的这个播放器非常的卡自己设置的默认不使用播放仍然不起作用用geek观察了一下电脑确实没发现腾讯视频于是在播放视频的时候打开任务管理器终于发现了腾讯视频播放器
原理图以及vhdl设计一位全加器

原理图设计以及VHDL设计一位加法器全加器原理全加器真值输出表达式原理图设计法 VHDL设计法代码如下全加器是用门电路实现两个二进制数相加并求出和的组合线路称为一位全加器一位全加器可以处理低位进位并输出本位加法进位多个
【目标检测】各种方法中比较难理解的地方

1 评价指标mAP 全网最清楚的解释强推原文链接 http blog sina com cn s blog 9db078090102whzw html 理解的关键点在于每一次的precision和recall计算都是在top X的基础上
VMware虚拟机装win7教程

VMware虚拟机装win7教程前言一 VMware虚拟机装win7 二装Vmware Tools 1 初步装好win7后要装Vmware Tools 2 搞不定的接着往下看也是本人遇到的问题总结前言昨晚想要在win10系统
初识RecyclerView

使用之前 implementation com android support recyclerview v7 26 1 0 添加v7的依赖不然Recyclerview不给用 1 Xml布局此处布局文件有两个一个是整体的父布局文件代
利用Python实现几种常见排序算法

一排序算法概览插入排序直接插入排序二分法插入排序选择排序直接选择排序堆排序交换排序冒泡排序快速排序归并排序二代码实现 1 直接插入排序最简单直接的一种方式序列在排序中可分为左边已排序部分和右边未排序部分每次从
拷贝构造函数与深拷贝和浅拷贝

拷贝构造函数是一种特殊的构造函数函数的名称必须和类名称一致它必须的一个参数是本类型的一个引用变量作用就是用来复制对象在使用这个对象的实例来初始化这个对象的一个新的实例类中可以存在多个拷贝构造函数拷贝构造函数的调用时机当函数的参
Java中的代理（一）

一概念代理 Proxy 是一种设计模式提供了对目标对象另外的访问方式即通过代理对象访问目标对象这样做的好处是可以在目标对象实现的基础上增强额外的功能操作即扩展目标对象的功能重要的编程思想不要随意去修改别人已经写好的代码或
Java中成员变量、局部变量、全局变量、静态变量存在位置及初始化

根据定义变量位置的不同可以将变量分为成员变量和局部变量成员变量是定义在一个类的变量类中方法外局部变量是定义在一个方法内的变量方法中成员变量分为静态属性随类的存在而存在是在类加载的初始化非静态属性随实例的属性存在而存在
vsnprintf用法解析

int vsnprintf char s size t n const char format va list arg 描述将格式化数据从可变参数列表写入大小缓冲区如果在printf上使用格式则使用相同的文本组成字符串但使用由arg
深度解析转置卷积，理解转置卷积的原理

参考文章转置卷积 Transposed Convolution 太阳花的小绿豆的博客 CSDN博客转置卷积抽丝剥茧带你理解转置卷积反卷积史丹利复合田的博客 CSDN博客逆卷积和转置卷积参考视频转置卷积 transposed
【Unity3D】回合制游戏

回合制游戏一直在游戏史至少是在中国的游戏历史上扮演很重要的角色从仙剑到梦幻这类游戏深受玩家喜爱那么在Unity3D中怎么实现呢下面用一个比较简单Unity3D的一对一回合制游戏来说明这个问题其实也不难关键是理清各个处理关系如
Bootstarp学习教程（12）导航组件

导航 Bootstrap中可用的导航有相似的标记用基类 nav开头这是相似的部分改变修饰类可以改变样式标签页注意 nav tabs类需要 nav基类
Mathematica学习笔记

Mathematica学习笔记 mathematica 使用总结 1 基础知识 1 从1开始编号输入 Line 1 2 函数的另一种表达形式 1 2 3 4 5 6 7 8 MatrixForm 3 跳出死循环如不小心进入死循环可以采用
软件设计师---数据库

数据库出题形式概念数据模型概念数据模型定义概念数据模型常用术语结构数据模型关系模型真题三级模式结构真题两级映像真题关系模型的基本术语关系关系模式等五个码键完整性约束关系模式的定义关系模式的组成关系数据
基于Android+OpenCV+CNN+Keras的智能手语数字实时翻译——深度学习算法应用(含Python、ipynb工程源码)+数据集（三）

目录前言总体设计系统整体结构图系统流程图运行环境模块实现 1 数据预处理 2 数据增强 3 模型构建 4 模型训练及保存 1 模型训练 2 模型保存 5 模型评估相关其它博客工程源代码下载其它资料下载前言本项目依赖于K
简单洗牌（打乱52个随机生成的数字）

代码如下 include
操作系统学习（六）进程的基本知识

一程序和进程程序 1 指令序列 2 程序段存放指令序列数据段存放程序运行中的产生的数据例如定义的变量进程 1 程序的一次动态执行进程的动态性完成程序的并发执行 2 进程实体进程映像 3 进程是进程实体的运行过程是系统进行资
基于卷积神经网络的脱机手写签名识别（Pytorch，Opencv，CNN）

文章目录前言 resnet18模型结构 resnet18实现代码数据集训练模型项目结构前言最近做了一个手写签名识别的项目即判断签名的真伪使用的深度学习框架为Pytorch Opencv等等数据集中共包含17个人的签名使用