MTCNN+CRNN解决车牌识别问题-2

2023-10-29

这次到CRNN部分了,CRNN网络很简单,就是CNN+RNN,因为RNN适用于时间序列类型的数据,车牌呢,其实也是有规律的,比如第一位是汉字,后面是字母+汉字;

前一部分通过MTCNN将车牌区域已经定位了,那这部分就需要拿CRNN来对其进行训练,使其能作为一个pipeline处理MTCNN输出的车牌图像;

首先是CNN+RNN的网络,这里使用的网络比较简单,CNN部分使用了浅层网络和BN层,最终输出sequence_length*512维的输出;输出正好可以输入后续的RNN网络,其中RNN网络的序列长度是可变的,根据输入特征的长度而定;

RNN的网络结构中,深度为2层,序列长度根据输入待定,隐层单元数是256,车牌的类别数量是69,所以可以认为是每个时间点的输出为一个69维的向量,对向量做softmax,获得预测的结果;当然,此时预测的结果还是不准确的,也就是CTC中B变换之前的一个序列预测,若要得到最终预测,还需要进行B变换;

序列长度的值和输入图像的宽度是有关联的,所以在使用时候,将MTCNN输入图像的宽度除以4,得到了序列的长度,当然,这个序列长度要考虑B变换前的预测长度,不能太短,太短的话,在进行CTC计算的时候,可能得到的结果还不够车牌号的规定位数。

在训练中,很简单,使用自带函数tf.nn.ctc_loss即可,使用ctcc损失函数进行计算;

通过这样的训练,我们就可以使用模型预测了;

最后,MTCNN+CRNN仅仅是一次小的尝试,目前的结果由于样本的关系,还没做大量的训练,也没做优化,流程整个跑通;后面有时间的话,可以按这个方案,用更多数据训练一下,另外,各个环节再优化一下。

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MTCNN+CRNN解决车牌识别问题-2 的相关文章

  • MATLAB车牌识别(含GUI,语音播报)

    GUI框架源码 xff1a https download csdn net download weixin 44748303 12682333 一 设计原理及设计方案 1 系统简述 一个完整的车牌识别系统闭应包括车辆检测 图像采集 图像预处
  • 水表读数自动识别,基于DB和CRNN的方法

    尽管智能水表正在取代老式的机械水表 但在许多地区 xff08 及老小区 xff09 由于环境 成本等因素的限制 机械水表木得办法被替换 所以依旧需要人工手动抄表 为了实现对老式机械水表的自动识别 这篇我们讲讲2020CCF训练赛的 场景文字
  • 自然场景OCR检测(YOLOv3+CRNN)

    自然场景OCR检测 YOLOv3 43 CRNN xff08 中文 43 英文模型 xff09 前言 最近对于自然场景下的OCR比较有兴趣 xff0c 所以总结了一些目前OCR现状 xff0c 并且找了一个自然场景OCR的项目练练手 本人新
  • OpenCV(项目)车牌识别3 -- 模板匹配

    目录 一 基础理论 1 思想 2 大致过程 二 详细过程 1 首先需要模板库 2 得到模板 3 原图限定大小 4 模板匹配 5 匹配所有子文件夹 xff0c 保存最佳得分 xff08 最匹配项 xff09 三 大致过程 xff08 细分类
  • CRNN-模型转换问题Missing Errorin loading state_dict for CRNN

    在将CRNN pytorch模型转为libtorch模型的时候出现报错情况 xff0c Missing Errorin loading state dict span class token keyword for span CRNN 96
  • CRNN-libtorch模型推理的时候报错std:runtime_error

    使用libtorch模型推理的时候出现报错std runtime error 这里报错的情况一般是数据不同步的问题 xff0c 也就是说我们的模型是在gpu上 xff0c 而数据是在cpu上 xff0c 那么要做的一件事就是检查forwar
  • CRNN-pytorch模型转libtorch模型踩坑记录

    这段时间一直在做CRNN文字识别的问题 xff0c 从pytorch中训练好的模型然后转到libtorch中去 xff0c 但是CRNN提供的代码没有转libtorch模型的部分 xff0c 于是就在网上到处乱找 xff0c 其中找到了这篇
  • Tensorflow——端到端车牌识别(数据制作、训练、评估、预测)

    利用周末时间断断续续实现端到端车牌识别项目 具备完整的数据集 数据制作 训练 评估 预测业务 项目特点 采用tensorflow中的keras库 训练时数据生成器data generator 对学习keras API有一些参考意义 项目地址
  • HyperLPR车牌识别技术算法之车牌粗定位与训练

    关于HyperLPR HyperLPR是一个使用深度学习针对对中文车牌识别的实现 与较为流行的开源的EasyPR相比 它的检测速度和鲁棒性和多场景的适应性都要好于目前开源的EasyPR HyperLPR可以识别多种中文车牌包括白牌 新能源车
  • HyperLPR车牌识别相关资源整理

    一 HyperLPR使用 源码分析相关资料 1 HyperLPR中文车牌识别 中给出了视频文件的处理方法 可以参考下 因为识别检测本身比较耗时 所以从画面上看 视频文件播放非常慢 这里需要根据上层应用根据自己的需要进行丢帧处理 PlateR
  • 华夏相机/臻识相机车牌识别器同LED屏幕语音对接以及javaDemo

    上篇文章说过在本地买的华夏相机T83因为当地的销售人员只懂安装 一点技术支持也给不了 导致语音 屏幕 均不能实现自己想要的功能 自定义修改文字 语音播放余额等 经过自己进一步的研究发现 这个led屏幕和语音只需要自己买一块几十块的主板更换上
  • 车牌识别中的不分割字符的端到端(End-to-End)识别

    传统的车牌识别过程是往往是这样的 车牌定位 gt 车牌判断 gt 车牌字符的分割 gt 车牌字符的识别 这种方法有个好处就是 仅仅需要较少的字符样本即可用于分类器的训练 在光照 相机条件好的情况下也能取得较好的效果 现在大多数商业车牌识别软
  • MTCNN+CRNN解决车牌识别问题-2

    这次到CRNN部分了 CRNN网络很简单 就是CNN RNN 因为RNN适用于时间序列类型的数据 车牌呢 其实也是有规律的 比如第一位是汉字 后面是字母 汉字 前一部分通过MTCNN将车牌区域已经定位了 那这部分就需要拿CRNN来对其进行训
  • MTCNN实现流程

    MTCNN实现流程 文章 https arxiv org pdf 1604 02878 pdf code 1 mxnet上的实现 https github com Seanlinx mtcnn 2 tensorflow上的实现 https
  • 【超简易版】基于Pytorch Fasterrcnn_resnet50_fpn的多车牌定位/车牌检测-基于CCPD2019数据集

    说明 本项目为本人初学torch框架练习项目 在此仅作个人经验分享 由于本人现大三 码code经验有限 难免存在瑕疵 望各位前辈批评指正 本项目在linux上训练模型并下载权重 pth文件在windows上进行测试 数据集来源参考 CCPD
  • 调用百度“车牌识别”API接口(go语言实现)

    调用百度的api识别车牌 没有GPU的机器 也没有大量的有标注的车牌数据 所以就只好拿别人现成的车牌识别api接口 具体的识别原理就不说了 只是调别人的接口而已 具体的调用文档百度已经给出 http ai baidu com docs OC
  • 高精度车牌识别算法

    一 车牌识别概述 车牌识别属于OCR的一种 但它也有自己的特点 考虑到边缘设备部署 我们没有用lstm 仅用普通的卷积层便实现了高精度的车牌识别方案 车牌识别的应用场景也十分广泛 常见的停车场收费系统 车牌识别算法也是智能交通算法中的基础算
  • 用opencv3写的超详细注释的车牌检测

    include iostream include opencv2 opencv hpp include opencv2 highgui highgui hpp include opencv2 core core hpp include op
  • 基于MATLAB,使用SVM和ANN实现车牌识别

    基于MATLAB 使用SVM和ANN实现车牌识别 WHY HOW 一 输入图像 二 三 图像处理 四 识别车牌矩形图像 五 字符切割 六 字符识别 七 MATLAB App UI ISSUE WHY 本人一直对计算机图像识别和机器学习以及人
  • face-api.js中加入MTCNN:进一步支持使用JS实时进行人脸跟踪和识别

    如果你现在正在阅读这篇文章 那么你可能已经阅读了我的介绍文章 JS使用者福音 在浏览器中运行人脸识别 或者之前使用过face api js 如果你还没有听说过face api js 我建议你先阅读介绍文章再回来阅读本文 和往常一样 本文中为

随机推荐

  • Android中OkHttp的使用(详解)

    1 先在项目中添加OkHttp库的依赖 dependencies compile com squareup okhttp3 okhttp 3 4 1 2 初始化 OkHttp框架的核心类是OkHttpClient 此类可直接实例化 由于Ok
  • 基于python,虹软sdk3.0实现的实时人脸识别

    前言 虹软sdk3 0是目前用过的最方便 效果最好的且免费的离线人脸识别SDK 提供的编程语音没有python 有大佬用c 代码接口转成python调用的 我在此基础上完善了一些功能 能够实现高精度多人脸实时人脸识别 并提供了年龄 性别识别
  • 用ChatGPT一分钟自动产出一份高质量PPT

    如何用ChatGPT一分钟自动产出一份高质量PPT 节约时间摸鱼呢 废话少说 直接上案例 一 用ChatGPT做一下提问 这里我用的小程序万事知天下 根据自己PPT的需求 制作chatgpt的prompt就行了 请帮我创建一个以 大学生如何
  • csv修改单元格格式后无法保存_Excel教程——excel如何使用条件格式?

    Microsoft excel条件格式可是你分析数据的好帮手 但该如何査看和分析这些数据呢 macw小编带来了excel如何使用条件格式的教程 希望对你有帮助 这款excel Mac版有一项常常被忽视 却非常实用的工具 条件格式 它能自动根
  • XMind思维导图介绍与下载安装使用教程

    文章目录 介绍 下载 安装 千人全栈VIP答疑群推荐 介绍 XMind 是一款非常实用的商业思维导图软件 应用Eclipse RCP 软件架构 打造易用 高效的可视化思维软件 强调软件的可扩展 跨平台 稳定性和性能 致力于帮助用户提高生产率
  • imos v5 web api说明文档_B站视频api整理

    此文档为非官方接口文档 无法保证接口有效性 以下接口为本项目目前使用的接口 也可以直接看src api 文件目录下的接口 仿B站视频网站项目源码 进入项目源码仓库 首页模块 推荐视频 https www bilibili com index
  • JDBC 和数据库连接

    JDBC 和数据库连接 基本介绍 JDBC为访问不同的数据库提供了统一的接口 为使用者屏蔽了细节问题 Java程序员使用JDBC 可以连接任何提供了JDBC驱动程序的数据库系统 从而完成对数据库的各种操作 JDBC的基本原理图 重要 JDB
  • core audio采集音频

    涉及的接口有 IMMDeviceEnumerator IMMDevice IAudioClient IAudioCaptureClient 主要过程 创建多媒体设备枚举器 IMMDeviceEnumerator 通过多媒体设备枚举器获取声卡
  • 如何设计一个电商平台积分兑换系统?

    目录 1 拉开差距的一类面试题 2 业务需求描述 3 对业务流程的思考 4 物流配送进度查询 考虑到了吗 5 事务的保证 6 消息中间件的引入 7 重试机制的引入 8 引入幂等性机制 9 对这类面试题的总结 1 拉开差距的一类面试题 现在面
  • idea安装findBugs 报idea运行项目报错Cannot run program

    装了findbugs之后报错 Malformed argument has embedded quote Djava endorsed dirs 打开帮助 编辑自定义VM选项 在最后一列添加下列代码 Djdk lang Process al
  • long(Long)与int(Integer)之间的转换

    1 将long型转化为int型 这里的long型是基础类型 long a 10 int b int a 2 将Long型转换为int 型的 这里的Long型是包装类型 Long a 10 int b a intValue 3 将Long型转
  • 面试题:HashMap高频面试题

    面试题 HashMap 1 底层数据结构 1 7和1 8有什么区别 1 7是数组 链表 1 8是数组 链表 红黑树 链表元素多时转换成红黑树 元素少时转换成链表 2 为何要用红黑树 为何一上来不树化 树化阈值为何是8 何时会树化 何时会退化
  • DB2客户端连接不上db2默认端口50000

    DB2客户端连接不上db2默认端口50000 1 添加组和用户 root localhost expc groupadd g 2000 upp root localhost expc useradd m g upp d home upp u
  • Java中map的分类和常见的情况

    Java为数据结构中定义了一个接口Java util Map 它有四个实现类 分别是HashMap Hash table LinkedHashMap 和 TreeMap Map主要用于存储键值对 根据键得到值 因此不允许键重复 重复了覆盖了
  • RabbitMQ(一)——入门

    前言 原来公司项目的消息中间件一直在用RabbitMQ 今天抽出时间简单总结梳理一下关于RabbitMQ的相关知识点 我们知道消息队列在分布式系统中应用的的地方有很多 它也有很多种类型 除了今天重点介绍的RabbitMQ 还有像Active
  • ADC的接地

    by Walt KesterQ I ve read your data sheets and application notes and also attendedyour seminars but I m still confused a
  • SpringBoot自动装配出现NULL的情况

    环境 idea 2021 6 mysql 8 0 问题描述 今天遇到通过 Autowired注解自动注入后 发现字段为空的问题 问题产生的原因是将被注入的对象交给了IOC容器管理但是却通过new对象的方式使用该对象 导致该对象下的内容都无法
  • C语言if语句实现分支结构应用练习题

    此练习为本人自己练习完成的答案 答案方法不止一种 仅供参考 练习题列表 1 1 计算分段函数 1 10 分 1 2 分段函数 10 分 1 3 打折促销 10 分 1 4 12 24小时制 10 分 1 5 分数等级转换 10 分 1 1
  • HashMap源码

    数组 数组存储区间是连续的 占用内存严重 故空间复杂度很大 但数组的二分查找时间复杂度很小 为 o 1 数组的特点 查找速度快 插入和删除效率低 链表 链表存储区间离散 占用内存比较宽松 故空间复杂度很小 但时间复杂度很大 为 o n 链表
  • MTCNN+CRNN解决车牌识别问题-2

    这次到CRNN部分了 CRNN网络很简单 就是CNN RNN 因为RNN适用于时间序列类型的数据 车牌呢 其实也是有规律的 比如第一位是汉字 后面是字母 汉字 前一部分通过MTCNN将车牌区域已经定位了 那这部分就需要拿CRNN来对其进行训