图像验证码识别（九）——训练和识别

2023-11-20

前面讲到已经把所有的字符经过去干扰、分割和归一化得到标准大小的单个字符，接下来要做的就是识别验证码了。现在要做的基本上也就和OCR没什么区别了，因为得到的字符已经是尽可能标准的了。下面的识别分为两个步骤，第一步先是特征值的提取，第二步是SVM训练。

一、特征值提取

首先要说的是我当时在做这个的时候，还没有了解“主成分分析”，所以在提取特征值的时候用的是比较简单的方法，就是简单的提取像素值来解决的。具体来说，由于前面归一化的字符每个都是16*16大小的，可以将字符图片等分为16个子区域，每个区域是4*4的，然后统计每个区域内部黑色像素（字符像素）的个数，这样可以得到16个数值，然后按照从左到右，从上到下来的顺序进行排列，可以得到一个16维的数据，这样依赖就将256维的原数据降到了16维。

现在要做的就是如果想验证哪个网站的验证码，就写个爬虫爬该网站的验证码，爬个几百张然后对每一张验证码上的字符进行标记，然后按照前面的步骤一步一步预处理然后提取特征值，将每个字符的特征值和其标记的字符写入到数据文件中，在这里我取了某网站的验证码一共250张，每张有4个字符，字符集只有大写字母26个和0-9十个数字，这样得到了1000条数据，由于字符存在粘连状况，因此在字符分割那一部分并不是100%成功，最后有十几张验证码图片分割失败，所以最终得到的数据集个数只有900多个。部分数据如下：

[cpp] view plain copy

D,0,4,7,12,9,9,4,12,7,8,4,12,0,8,8,2
N,0,1,5,6,9,15,7,2,0,5,14,7,6,9,7,3
Y,3,1,0,0,5,12,9,8,3,12,4,1,5,0,0,0
2,0,0,0,1,7,2,7,12,8,9,8,8,0,3,0,0
Z,0,0,1,8,13,1,10,12,12,11,1,12,5,1,0,2
I,0,0,0,0,0,1,4,6,7,11,7,3,0,0,0,0
Z,0,0,1,6,12,1,11,12,12,12,2,12,6,1,0,0
5,0,0,1,0,6,12,4,9,8,7,9,8,2,0,0,0
G,0,9,8,3,8,7,5,11,12,1,10,11,3,6,9,1
7,0,0,0,0,8,1,6,11,9,10,6,0,2,1,0,0
M,0,4,7,10,8,16,11,9,0,4,12,7,9,14,13,8
D,0,1,4,5,11,10,9,12,12,1,3,10,5,11,11,1
3,0,0,1,1,6,2,2,10,10,9,12,8,0,2,0,0
F,0,0,4,6,7,13,12,4,8,8,8,0,5,3,2,0
N,0,0,5,6,9,15,6,2,0,5,11,7,7,10,5,3
X,1,0,0,7,7,11,12,4,3,13,10,8,9,2,0,1
2,0,0,0,2,8,4,6,13,9,11,9,7,2,3,0,0
P,1,0,4,5,11,12,11,4,12,6,8,0,4,10,1,0
J,0,0,2,2,0,0,3,13,4,10,11,6,3,2,0,0
V,4,4,3,0,2,6,9,16,0,7,12,4,6,6,0,0
7,1,0,0,0,8,5,10,9,12,8,0,0,1,0,0,0
W,9,12,12,9,4,8,11,1,9,10,11,9,4,9,9,2

数据集每行代表一条数据，第一个字母或数字是该字符的标记结果，后面紧跟着16个数字是其特征值。

二、机器学习识别

现在终于到了验证码识别的最后一步了，有了前面的数据集，就可以进行训练了。我在这里使用的分类器是SVM，由于整个项目都是用OpenCV做的，而OpenCV正好提供SVM的库，因此就直接拿来用了。OpenCV的SVM是基于libSVM的，有关SVM（支持向量机）的知识我也了解的不是太多，这里不再赘述，有兴趣的可以去找找资料看看。在OpenCV的源代码工程里，可以找到怎么使用OpenCV SVM的demo，这里就直接拿来用了，代码如下：

[cpp] view plain copy

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

图像验证码识别（九）——训练和识别的相关文章

为什么使用abs()或fabs()而不是条件否定？

在 C C 中为什么要使用abs or fabs 不使用以下代码即可查找变量的绝对值 int absoluteValue value lt 0 value value 这与较低级别的指令较少有关吗您提出的有条件的abs 并不等于std
Blazor 与 Razor

随着 Blazor 的发明我想知道这两种语言之间是否存在显着的效率无论是在代码创建方面还是在代码的实际编译执行方面 https github com SteveSanderson Blazor https github com Ste
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
ASP .NET MVC，创建类似路由配置的永久链接

我需要帮助在 MVC 网站中创建类似 URL 路由的永久链接 Slug 已设置为 www xyz com profile slug 代码为 routes MapRoute name Profile url profile slug defa
获取从属性构造函数内部应用到哪个属性的成员？

我有一个自定义属性在自定义属性的构造函数内我想将属性的属性值设置为属性所应用到的属性的类型是否有某种方式可以访问该属性所应用到的成员从我的属性类内部可以从 NET 4 5 using CallerMemberName Somethi
如何在 VS 中键入时显示方法的完整文档？

标题非常具有描述性是否有任何扩展可以让我看到我正在输入的方法的完整文档我想查看文档因为我可以在对象浏览器中看到它其中包含参数的描述和所有内容而不仅仅是一些摘要当然可以选择查看所有覆盖它可能是智能感知的一部分或者我不知道它并
为什么 std::allocator 在 C++17 中丢失成员类型/函数？

一边看着std 分配器 http en cppreference com w cpp memory allocator 我看到成员 value type pointer const pointer reference const refer
gdb 在 docker 上立即退出“进程已完成，退出代码 1”或 lldb“数据包返回错误 8”。另外：如何在 docker 中允许进行 C++ 调试

这花了我一整天的时间才找到所以我将其发布以供将来参考我正在 docker 镜像上开发 C 我正在使用克利翁我的代码是在调试模式下编译的并且在运行模式下运行良好但是当尝试调试时进程会立即退出并显示非常丰富的信息 Process
单元测试失败，异常代码为 c0000005

我正在尝试使用本机单元测试项目在 Visual Studios 2012 中创建单元测试这是我的测试 TEST METHOD CalculationsRoundTests int result Calculations Round 1 0
为什么 FTPWebRequest 或 WebRequest 通常不接受 /../ 路径？

我正在尝试从 ftp Web 服务器自动执行一些上传下载任务当我通过客户端甚至通过 Firefox 连接到服务器时为了访问我的目录我必须指定如下路径 ftp ftpserver com AB00000 incoming files
C# 编译器如何决定发出可重定向的程序集引用？

NET Compact Framework 引入了可重定向程序集引用现在用于支持可移植类库基本上编译器会发出以下 MSIL assembly extern retargetable mscorlib publickeytoken 7C
“MyClass”的类型初始值设定项引发异常

以下是我的Windows服务代码当我调试代码时我收到错误异常 CSMessageUtility CSDetails 的类型初始值设定项引发异常 using System using System Collections Generic
在 C 中复制两个相邻字节的最快方法是什么？

好吧让我们从最明显的解决方案开始 memcpy Ptr const char a b 2 调用库函数的开销相当大编译器有时不会优化它我不会依赖编译器优化但即使 GCC 很聪明如果我将程序移植到带有垃圾编译器的更奇特的平台上我也不
UWP 无法在两个应用程序之间创建本地主机连接

我正在尝试在两个 UWP 应用程序之间设置 TCP 连接当服务器和客户端在同一个应用程序中运行时它可以正常工作但是当我将服务器部分移动到一个应用程序并将客户端部分移动到另一个应用程序时 ConnectAsync 会引发异常服务器未
Silverlight Datagrid：在对列进行排序时突出显示整个列

我的 Silverlight 应用程序中有一个 DataGrid 我想在对该列进行排序时突出显示整个列它在概念上与上一个问题类似 Silverlight DataGrid 突出显示整列 https stackoverflow com qu
是否有一个 C++ 库可以从 PDF 文件中提取文本，例如 PDFBox for Java？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案去年我使用 PDFBox 在 Java 中创建了一个应用程序来获取某些 PDF 文件中的原始文本现在
无法使用 Ninject 将依赖项注入到从 Angular 服务调用的 ASP.NET Web API 控制器中

我将 Ninject 与 ASP NET MVC 4 一起使用我正在使用存储库并希望进行构造函数注入以将存储库传递给其中一个控制器这是实现 StatTracker 接口的上下文对象 EntityFramework public cla
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
如何在 GCC 5 中处理双 ABI？

我尝试了解如何克服 GCC 5 中引入的双重 ABI 的问题但是我没能做到这是一个重现错误的非常简单的示例我使用的GCC版本是5 2 如您所见我的主要函数在 main cpp 文件中非常简单 main cpp include
为什么 Ajax.BeginForm 在 Chrome 中不起作用？

我正在使用 c NET MVC2 并尝试创建一个 ajax 表单来调用删除数据库记录 RemoveRelation 的方法删除记录的过程正在按预期进行删除记录后表单应调用一个 JavaScript 函数从视觉效果中删除该记录 Rem

随机推荐

手动搭建torch2.0环境

一下载相关whl 1 从Previous PyTorch Versions PyTorch检查相互版本是否兼容否则会出现无法使用cuda的问题 2 从https download pytorch org whl torch stable
阶乘质因子分解（唯一分解定理）

阶乘质因子分解题目描述对N 进行质因子分解输入输出格式输入格式输入数据仅有一行包含一个正整数N N lt 10000 输出格式输出数据包含若干行每行两个正整数p a 中间用一个空格隔开表示N 包含a个质因子p 要求按p的值从
Python JS逆向篇（一）

Python JS逆向篇一效果实现思路最后一步逆向 p a HmacSHA256 t s a state commonStore cupid sign key JS实现 py实现先苦后甜逆向主题 51job请求头headers
【NodeJS】Express框架快速入门

简介作为前端开发 Nodejs已经成了很多公司对我们这一岗位的硬性要求而 Express 框架则是其中知名度最高也是最受欢迎的Nodejs开发框架它帮助我们封装了Nodejs底层的API 屏蔽了大量的繁琐的细节让我们只需要关注业务
Mybatis框架解析

一 Mybatis框架简介 MyBatis框架是一个开源的数据持久层框架它的内部封装了通过JDBC访问数据库的操作支持普通的SQL查询存储过程和高级映射几乎消除了所有的JDBC代码和参数的手工设置以及结果集的检索 MyBatis作为
PAM机制

一 PAM简介 Linux PAM linux可插入认证模块是一套共享库使本地系统管理员可以随意选择程序的认证方式换句话说不用重新编写和重新编译一个包含PAM功能的应用程序就可以改变它使用的认证机制这种方式下就算升级本地认
无监督低照度图像增强网络ZeroDCE和SCI介绍

目录简介 Zero DCE 算法介绍模型代码无监督loss介绍小结 Self Calibrated Illumination SCI 模型介绍无监督loss介绍小结总结简介当前有较多深度学习的方法来做图像效果增强但多数都
量化投资学习-31：如何评判专家的战法是否真的有效还是瞎蒙？

每逢牛市都会冒出各种股神各种专家在牛市大趋势的东风下各种专家鱼龙混杂如何如何评判专家的战法是否真的有效还是瞎蒙所谓牛市就是高点越来越高即使在任何一个时间点买入短暂的亏损后股价也再创新高一样能赚钱因此在牛市的大势下
三个闭环负反馈PID调节系统：电流环、速度环和位置环的关系

三个闭环负反馈PID调节系统电流环速度环和位置环的关系伺服电机为了达到生产的精准控制电机一般采用三环控制这主要是为了使伺服电机系统形成闭环控制所谓三环就是3个闭环负反馈PID调节系统电压映射电流变化电流映射转矩大小转矩大小
Sql语句中的DML语句

一什么是DML语句 DML语句就是数据库操作语句二 DML语句的分类 Insert 插入 Update 修改更新 Delete 删除 Select 选择三 insert语句 Delete from 表名名称 where 条件 DELE
windows下配置Mysql-5.7.9服务

第一步从官方网站下载 mysql 5 7 9 winx64 zip 第二步解压缩在根目录下复制my default ini 改名为my ini 第三步初始化mysql目录 bin mysqld initialize user mys
在渗透测试中，扫描器原理是什么

在渗透测试中扫描器原理是什么渗透测试中的扫描器是一种自动化工具用于识别目标系统中的漏洞弱点或配置错误扫描器通过发送特定的网络请求或使用其他技术手段来检查目标系统的安全性并生成报告以供分析和修复以下是扫描器的一般原理 1 信息收
一眼看懂promise与async await的区别

promise方法 let p1 new Promise resolve reject gt setTimeout gt resolve 我是p1 4000 let p2 new Promise resolve reject gt setT
12.HTML5下一代的HTML标准介绍与初识尝试

关注回复学习交流群加入安全开发运维答疑交流群请朋友们多多点击文中的广告支持作者更新更多文章目录本文为作者原创文章为尊重作者劳动成果禁止非授权转载若需转载请在全栈工程师修炼指南公众号留言或者发送邮件到 master
运维之Linux发行版和容器镜像网站及开源软件收集

关注 WeiyiGeek 公众号将我设为特别关注每天带你玩转网络安全运维应用开发物联网IOT学习 0x00 概述 0x01 镜像源网站国内镜像国内高校 0x02 发行版官网 CentOS kail Debian Ubuntu
客户机操作系统已禁用 CPU。请关闭或重置虚拟机。解决方法

今天在用VMware安装CentOS7报了这个错误在网上找半天都没解决最后换一个地址下的镜像就能正常安装了 Index of centos 7 9 2009 isos x86 64
12_Linux ARM架构_安装JDK8-银河麒麟V10（Kylin Linux Advanced Server V10 ）操作系统

12 Linux ARM架构安装JDK8 银河麒麟V10 Kylin Linux Advanced Server V10 操作系统 1 官网下载aarch64架构jdk包 2 linux服务器中创建java文件夹方便后期快速寻找 3 将
DevC++如何改成中文？

DevC 如何改成中文 1 点击Tools工具 2 选择环境选项 3 选择简体中文 4 点击确定
深入理解Google Cast（一）基本概念

什么是google cast google cast允许用户将手机上的内容投影到TV上然后用户可以将手机作为遥控器来控制TV上的媒体播放 Google cast SDK用于扩展你的app 使其支持google cast功能一个Cast
图像验证码识别（九）——训练和识别

前面讲到已经把所有的字符经过去干扰分割和归一化得到标准大小的单个字符接下来要做的就是识别验证码了现在要做的基本上也就和OCR没什么区别了因为得到的字符已经是尽可能标准的了下面的识别分为两个步骤第一步先是特征值的提取第二步是SV

图像验证码识别（九）——训练和识别

图像验证码识别（九）——训练和识别 的相关文章

随机推荐

热门标签

图像验证码识别（九）——训练和识别的相关文章