基于OpenCV的气体泵扫描仪数字识别系统

2023-11-02

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

综述

2012年iOS应用商店中发布了一个名为FuelMate的Gas跟踪应用。小伙伴们可以使用该应用程序跟踪汽油行驶里程，以及有一些有趣的功能，例如Apple Watch应用程序、vin.li集成以及基于趋势mpg的视觉效果。

燃料伴侣

对此我们有一个新想法，该如何添加一个功能帮助我们在泵中扫描燃油，并在应用程序中输入燃油信息？让我们深入研究如何实现这一目标。

技术

对于这个项目的我们首先应该编写一个简单的Python应用程序以拍摄汽油泵的图像，然后尝试从中读取数字。OpenCV是用于计算机视觉应用程序的流行的跨平台库。它包括各种图像处理实用程序以及某些机器学习功能。除此之外我们希望可以先使用Python对其进行原型设计，然后将处理代码转换为C ++以在iOS应用程序上运行。

目标

我们首先要考虑以下两个问题：

1.我们可以从图像中分离出数字吗？

2.我们可以确定图像代表哪个数字吗？

数字分割

如何确定图像中的数字有多种方法，但是我提出了使用简单的图像阈值法来尝试查找数字的方法。

图像阈值化的基本思想是将图像转换为灰度，然后说灰度值小于某个常数的任何像素，则该像素为一个值，否则为另一个。最后，您得到的二进制图像只有两种颜色，在大多数情况下只是黑白图像。

这个概念在OCR应用中非常有效，但是主要问题是决定对该阈值使用什么。我们可以选择一些常量，也可以使用OpenCV选择其他一些选项。我们可以使用自适应阈值而不是使用常数，这将使用图像的较小部分并确定要使用的不同阈值。这在具有不同照明情况的应用中特别有用，特别是在扫描气泵中。

将图像设置为阈值后，可以使用OpenCV的findContours方法查找图像中连接了白色像素部分的区域。绘制轮廓后，便可以裁剪出这些区域并确定它们是否可能是数字以及它是什么数字。

基本图像处理流程

这是我在测试图像处理中使用的原始图像。它有一些眩光点，但是图像相当干净。让我们逐步完成获取此源图像的过程，并尝试将其分解为单个数字。

原始图片

影像准备

在开始图像处理流程之前，我们决定先调整一些图像属性，然后再继续。这有点试验和错误，但注意到，当我们调整图像的曝光度时，可以获得更好的结果。下面是使用Python调整后的图像，相当于曝光（阿尔法）的图像cv::Mat::convertTo这是刚刚在图像垫乘法操作cv2.multiply(some_img, np.array([some_alpha])，

调整曝光

灰阶

将图像转换为灰度。

转换为灰度

模糊

模糊图像以减少噪点。我们尝试了许多不同的模糊选项，但仅用轻微的模糊就找到了最佳结果。

稍微模糊

阈值图像转换为黑白图像

在下图中，使用cv2.adaptiveThreshold带有cv2.ADAPTIVE_THRES_GAUSSIAN_C选项的方法。此方法采用两个参数，块大小和要调整的常数。确定这两者需要一些试验和错误，更多有关优化部分的内容。

阈值为黑/白

填补空白

由于大多数燃油泵都使用某种7段LCD显示屏，因此数字中存在一些细微的间隙，无法使用轮廓绘制方法，因此我们需要使这些段看起来相连。在这种情况下，我们将转到erode图像来弥补这些差距。由于大家可能希望使用，所以这似乎向后看，dilate但是这些方法通常适用于图像的白色部分。在我们的案例中，我们正在“侵蚀”白色背景以使数字看起来更大。

侵蚀出来的数字

反转图像

在尝试在图像中查找轮廓之前，我们需要反转颜色，因为该findContours方法将找到白色的连接部分，而当前的数字是黑色。

颜色反转

在图像上找到轮廓

下图显示了我们的原始图像，该图像在上图的每个轮廓上都有包围框。大家可以看到它找到了数字，但也找到了一堆不是数字的东西，因此我们需要将它们过滤掉。

红色框显示所有找到的轮廓

轮廓过滤

1.现在我们有了许多轮廓，我们需要找出我们关心的轮廓。浏览了一堆气泵的显示和场景后，使用一套适用于轮廓的快速规则。

2.收集所有我们将分类为潜在小数的正方形轮廓。

3.扔掉任何不是正方形或高矩形的东西。

4.使轮廓与某些长宽比匹配。LCD显示屏中的十个数字中有九个数字的长宽比类似于下面的蓝色框高光之一。该规则的例外是数字“ 1”，其长宽比略有不同。通过使用一些样本轮廓，我将0–9！1方面确定为0.6，将1方面确定为0.3。它将使用这些比率和+/-缓冲区来确定轮廓是否是我们想要的东西，并收集这些轮廓。

5.对潜在数字应用一组附加规则，在这里我们将确定轮廓边界是否偏离所有其他潜在数字的平均高度或垂直位置。由于数字的大小应相同，并且在相同的Y上对齐，因此我们可以丢弃它认为是数字的任何轮廓，但不能像其他轮廓那样将其对齐和调整大小。

蓝色矩形显示我们的数字/十进制，红色被忽略

预测

有两个等高线轮廓，一个带潜在位数，一个带潜在小数位，我们可以使用这些轮廓边界裁剪图像，并将其输入经过训练的系统中以预测其值。有关此过程的更多信息，请参见“数字培训”部分。

查找小数

在图像中查找小数点是要解决的另一个问题。由于它很小，有时会连接到它旁边的手指，因此使用我们在手指上使用的方法来确定它似乎有问题。当我们过滤轮廓时，我们收集了可能是十进制的正方形轮廓。从上一步获得经过验证的数字轮廓之后，我们将找到数字的最左x位置和最右x位置，以确定我们期望的小数位数。然后，我们将遍历那些潜在的小数，确定它是否在该空间以及该空间的下半部分，并将其分类为小数。找到小数点后，我们可以将其插入到我们上面预测的数字字符串中。

只在黄色部分中查找小数

数字培训

在机器学习的世界中，解决OCR问题是一个分类问题。我们建立了一组训练有素的数据，例如图像处理中的数字，将它们分类为某种东西，然后使用该数据来匹配任何新图像。一旦基本的图像隔离功能开始工作，我就创建了一个脚本，该脚本可以遍历图像文件夹，运行数字隔离代码，然后将裁剪的数字保存到新文件夹中供我查看。运行完之后，我会有一个未经训练的数字文件夹，然后可以用来训练系统。

由于OpenCV已经包含了k近邻（k-NN）实现，因此无需引入任何其他库。为了进行训练，我们浏览了数字作物的文件夹，然后将其放入标有0–9的新文件夹中，因此每个文件夹中都有一个数字的不同版本的集合。我们没有大量的这些图像，但是有足够的证据来证明这是可行的。由于这些数字是相当标准的，我认为我不需要大量训练有素的图像就可以相当准确。

k-NN工作原理的基础是，我们将以黑白方式加载每个图像，将该图像存储在每个像素处于打开或关闭状态的数组中，然后将这些打开/关闭像素与特定的数字相关联。然后，当我们要预测一个新图像时，它将找出哪个训练图像与这些像素最匹配，然后向我们返回最接近的值。

整理好数字后，将创建一个新的脚本，该脚本将遍历这些文件夹，获取每个图像并将该图像与数字关联。到目前为止，在大多数代码中，一般的图像处理概念在Python和C ++中都应用相同，但是在这里会有细微的差别。

在大多数此类应用程序的Python示例中，分类被写入两个文件，一个包含分类，另一个包含该分类的图像内容。通常使用NumPy和标准文本文件完成此操作。但是，由于我想在iOS应用程序上重用该系统，因此我需要想出一种可以拥有跨平台分类文件的方式。当时，我什么都找不到，因此最终编写了一个快速实用程序，该实用程序将从Python中获取分类数据并将其序列化为JSON文件，我可以在OpenCV的FileStorage系统的C ++端使用它。这不漂亮，但是我写了一个简单的MatPython中的序列化方法，它将为OpenCV创建合适的结构以在iOS端读取。现在，当我训练数字时，我将获得NumPy文件供我的Python测试使用，然后获取一个JSON文档，我可以将其拖到我的iOS应用程序中。您可以在此处看到该代码。

优化

一旦确定了数字隔离和预测的两个目标，就需要对算法进行优化，以预测泵的新图像上的数字。

在优化的初始阶段，创建了一个简单的Playground应用程序，其中使用了OpenCV提供的一些简单的UI组件。使用这些组件，可以创建一些简单的轨迹栏，以左右滑动并更改不同的值并重新处理图像。围绕该cv2.imshow方法创建了一个小包装程序，该方法可以平铺显示的窗口，因为我讨厌总是重新放置它们，

尝试不同的变量

我们可以加载不同的图像，并在图像处理中尝试变量的不同变化，并确定最佳的组合。

自动化

在每个图像上测试不同的变量是上手的好方法，但是我们想要一种更好的方法来验证是否更改了一个图像的变量是否会对其他任何图像产生影响。为此，我们想出了针对这些图像进行一些自动化测试的系统。

我拍摄了每个测试图像，并将它们放在文件夹中。然后，我用图像中期望的数字来命名每个文件，并用小数点“ A”表示。应用程序可以加载该目录中的每个图像并预测数字，然后将其与文件名中的数字进行比较以确定是否匹配。这使我们可以针对所有不同的图像快速尝试更改。

自动测试输出

更进一步，我创建了此脚本的不同版本，该脚本将尝试对这组图像进行模糊，阈值等变量的几乎每种组合，并找出最优化的变量集将具有最佳的性能。准确性。该脚本在计算机上花费了相当长的时间才能运行，大约需要7个小时，但是最后提出了一组不同的变量，这些变量在我们手动测试时找不到。

结论

这是否是任何人实际上都会使用的功能尚待确定，但这在实现某些机器学习概念和使用OpenCV方面是一个有趣的练习。到目前为止，在我们的测试中，应用程序最大的问题是泵显示屏上的眩光。根据泵上的照明和手机的角度，可能会导致某些扫描失效。

代码链接：https://github.com/kazmiekr/GasPumpOCR

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基于OpenCV的气体泵扫描仪数字识别系统的相关文章

python 使用曲面图和第四个变量的滑块可视化 4d 数据

如何使用前 3 个变量和第四个变量的 3 维曲面图作为滑块来可视化 4 维数据从 csv 文件加载集我写了一个非常小的示例重点介绍了实现此目标的方法 import numpy as np import matplotlib pypl
Java 将字符串拆分为单词逗号和句号

我一直在使用myString split s 得到每个单词但现在我想把逗号和句号也分开例如妈妈总是说生活就像一盒巧克力你永远不知道会得到什么 to Mama always said life was like a box of ch
如何设置 pandas DataFrame _repr_html_ 方法的默认样式？

我有一个 pandas DataFrame 其中有一列是 url 并且我编写了以下格式化程序以将其作为链接呈现在我的笔记本中 def make clickable val target blank to open new window re
Pygame - 两个圆圈的碰撞检测

我正在制作一个碰撞检测程序其中我的光标是一个半径为 20 的圆当它碰到另一个圆时应该将值更改为 TRUE 出于测试目的我在屏幕中心有一个半径为 50 的固定圆我可以测试光标圆是否击中固定圆但它不能正常工作因为它实际上是在测试它是
Python条件运算符“if else”不等于“and or”[重复]

这个问题在这里已经有答案了我认为下面两个函数的结果会相同但事实并非如此 def fib2 n return n and n lt 2 or fib2 n 1 fib2 n 2 def fib3 m return m if m lt 2
如何在Python中按天对时间序列数据求和？ resample.sum() 没有效果

我是Python新手如何根据日期求和数据并绘制结果我有一个 Series 对象其数据如下 2017 11 03 07 30 00 NaN 2017 11 03 09 18 00 NaN 2017 11 03 10 00 00 NaN
使用 Cython 扩展模块分发共享库和一些 C 代码

我正在尝试从大型 C 共享库 libbig so 中获取一些函数并通过 Cython 将它们公开给 Python 为此我有一个小 C 文件 small cpp 它为我需要的共享库的功能提供了一个薄包装器从而可以轻松地通过 Cython
Java客户端找不到主节点：MasterNotDiscoveredException等待[1m]

我正在使用 vagrant 并使用 debian 软件包在其上安装了 ES elasticsearch 1 1 1 deb 在我的网络应用程序中我使用 jar org elasticsearch elasticsearch 1 1 1 我
在 DAO 中反映继承关系最有效的方法是什么？

使用 MVC 结构和业务对象 http en wikipedia org wiki Business object DAO http en wikipedia org wiki Data access object建筑学对于任何正常的业务
在 ubuntu 12.04 上安装 ReviewBoard

我正在尝试使用 easy install 在 ubuntu 12 04 上安装 ReviewBoard http www reviewboard org docs manual 1 7 admin installation linux ht
Python 中 Javascript 的 reduce()、map() 和 filter() 的等价物是什么？

Python 的等价物是什么 Javascript function wordParts currentPart lastPart return currentPart lastPart word Che mis try console l
org.openqa.selenium.remote.service.DriverService$Builder.createArgs()Lcom/google/common/collect/ImmutableList;使用 Selenium 3.5.3

我正在使用 IntelliJ 编写 Selenium Junit 测试如果我直接从测试触发测试运行正常但是如果我使用 JunitCore 触发 TestRunnerSuite 的测试我遇到了以下奇怪的错误在谷歌研究后我没有找到解
在某一方面，在同一连接点上组合操作前、周围和后建议时，建议优先级不明确

请考虑这个简单的 Java 代码 public class Application public void m int i System out println M with argument i public static void ma
如何在 python setup.py 中 chmod 文件？

我使用 setup py 创建了一个 python 包安装我希望它复制文件夹为临时创建的 did 中的数据文件问题是我必须使用 sudo 权限调用 setup py 因为它写入 usr local 因此当我的数据文件复制到 did
在 AWS ec2 实例上使用“sudo pip”时出现错误

我正在尝试在 aws ec2 实例上运行一个小型 python 代码需要 pytz 和其他一些包当我尝试安装 pytz 时出现一些错误 ec2 user ip 172 31 28 178 pip install pytz Collec
在 OpenCV 中将 `BufferedImage` 转换为 `Mat`

我怎样才能转换BufferedImage to a Mat in OpenCV 我正在使用 JAVA 包装器OpenCV not JavaCV 由于我是新手OpenCV我在理解如何做时遇到一些问题Mat works 我想做这样的事情基于
Java 错误：默认构造函数未定义隐式超级构造函数

我有一些简单的 Java 代码其结构与此类似 abstract public class BaseClass String someString public BaseClass String someString this someSt
检查Python multiprocessing.Connection 的实例吗？

Connection对象是在打开时创建的multiprocessing Pipe 然而尚不清楚如何检查一个对象是否是一个实例Connection 在Python3 3 4 3 3 3 2 中检测Connection我可以 from mu
JDK1.6 中 ManagementFactory 的托管 Mbean - NotCompliantMBeanException：

我使用 ManagementFactory 来获取 JDK1 5 和 JBOSS 4 X 中的 ManagedMbeans 现在想将我的相同代码移至 JDK 1 6 Mbean 部分中断并抛出异常引起原因 javax management
Doctest 返回失败，但“预期”和“得到”完美匹配

我正在尝试做列表部分的第二个练习 http www openbookproject net thinkcs python english2e ch09 html exercises 如何像计算机科学家一样思考一书的内容我基本上必须将给定

随机推荐

一、Docker入门

最小安装centos7之后无法联网无法查看ip的解决方法 cd etc sysconfig network scripts 查看目录下的文件修改ifcfg ens33文件 ONBOOT yes 修改之后执行 service networ
Sprin boot 加载位置顺序

配置文件的加载位置 Spring boot 启动会扫描一下位置的application properties或者application yml文件作为Spring boot的默认配置文件 file config 项目根目录下的config文
【数据集制作】VOC2007格式数据集制作和处理教程(Faster-RCNN模型标准输入)

说明此次案例是制作VOC2007数据集的制作教程用于目标检测此次数据集处理可用于Faster RCNN YOLOv3等网络进行目标检测模型的标准输入 VOC2007数据集结构 VOC2007数据集结构如下 VOC2007 Annota
灵魂拷问！GPT-4来了！人类自媒体博主存在的意义是什么？

大家有没有想过一个问题当某某领域大v 的文章或者视频都是GPT 4创作出来的时候那么我们这些低产能的人类自媒体博主存在的意义又是什么呢拿什么跟GPT 4进行竞争呢想到这个问题是不是会有些伤感 GPT 4 VS 人类博主首先我们先比
左神提升6：暴力递归改动态规划

内容讲述暴力递归和动态规划的关系去重的过程记忆化搜索傻缓存动态规划都可以由暴力递归改进过来解决动态规划的套路常见的尝试模型设计尝试过程的原则本节是暴力递归到动态规划的总纲很重要后续的课都是在讲述这一系列的套路 1 尝试
Python多进程写日志ConcurrentLogHandler

文档 https pypi org project ConcurrentLogHandler 0 9 1 这个类库是通过文件锁实现写日志进程安全的但是只能通过文件大小控制切割不能通过时间分割文件 demo import time imp
2023年数据要素交易指数研究报告

报告紧扣数据要素市场化发展主线深入分析数据要素交易现状从构建规范高效的数据交易场所入手坚持理论指导导向实践需求导向共性特征导向发展趋势导向围绕数据场内交易需要分析构建了数据要素交易指数指标体系并在此基础上提出数据要素交易指
zabbix客户端错误：no active checks on server [192.168.1.107:10051]: host [ ] not found

查看zabbix agentd log时出现下列错误 root www tail var log zabbix zabbix agentd log 10526 20170506 154012 832 no active checks on
解决Maven：com.oracle:ojdbc7-12.1.0.2.jar在pom文件中无法下载问题

一 pom文件中有ojdbc依赖但是一直无法下载导致打包出错二解决方法 1 配置Maven的环境变量此处省略检查maven配置成功 win R 在doc窗口输入mvn v 如下则说明Maven 的环境变量配置成功 2 自行下载o
【原创】QString 函数 replace()indexOf()、 lastindexOf()

1 替换函数示例 QString x Say yes QString y no x replace 4 3 y x Say no 应用将 002 jpg 7位替换为 s save002 jpg 1 13位 QString x1 fil
swc-loader Segmentation fault “$NODE_EXE“ “$NPM_CLI_JS“ “$@“

webpack swc swc还不是很稳定在swcrc 中有配置plugins 时 swc 转换 node modules 会报错环境 swc cor 1 3 62 swc loader 0 2 3 swc plugin vue jsx
python+opencv实现文字颜色识别与标定

最近接了一个比较简单的图像处理的单子花了一点时间随便写了一下数据集客户没有是自己随便创建的程序如下 Code creation time September 11 2021 Author PanBo Realize function
Spring学习心得（6）-- spring DI(依赖注入)

DI的定义给配置文件中的bean的属性赋值方式一种是利用其属性的setter方法另外一种是利用构造函数我们先来讨论第一种利用属性的setter方法赋值首先先创建好类并且配置到配置文件中 public class Perso
基于上下文的推荐 -- 包括时间衰减算法和位置推荐算法（代码实现）

基于上下文的推荐基于时间特征的推荐时间衰减基于时间衰减的ItemCF算法算法核心两部分都加入了时间衰减项以movielens数据集实现ItemCF 基于时间衰减的UserCF算法以movielens数据集实现UserCF 基于
java怎么让按钮发挥作用,Java“周年”如何真正发挥作用？

这是一个简单的错误开始的我使用的YYYY不是对象的yyyy格式字符串SimpleDateFormat 但是我对使用格式错误的字符串的测试结果完全感到困惑这段代码 Test public void whatTheHell try Simp
Linux——I/O复用（1）——select

前言 TCP服务器的运行模型 TCP中第一个客户端和服务器端建立连接向服务器端不发数据服务器端就在recv阻塞住无法继续执行如果有第二个客户端与服务器端建立连接就在已完成三次握手的队列中放着等着accept处理它由于我们的代
从 TDD 到 BDD

转自http www cnblogs com lidaobing archive 2010 07 18 1779987 html 最近在学 ruby 也用了 rspec 传统的 xUnit 是 TDD 指导思想下的产物而 rspec 则算
本地上传文件到Gitee分支--傻瓜式教程

废话不多说在本地上传文件到Gitee分支按如下几个步骤走完即可创建本地仓库通俗一点就是任意文件夹都可以作为你的本地仓库这里我在桌面建立了一个新建文件夹作为本地试验仓库使用git init命令初始化仓库初始化完成以后本地仓库会生
ETL日志数据采集&商品数据采集

01 结构化数据模型选择理解问题1 原生python中有没有数据库中的表类型没有问题2 我们一般会使用什么数据类型存储数据库中读取到的数据值列表嵌套字典记录数据和书写数据非常方便但是我们需要记住每一个键字段的含义如果字
基于OpenCV的气体泵扫描仪数字识别系统

点击上方小白学视觉选择加星标或置顶重磅干货第一时间送达综述 2012年iOS应用商店中发布了一个名为FuelMate的Gas跟踪应用小伙伴们可以使用该应用程序跟踪汽油行驶里程以及有一些有趣的功能例如Apple Watc

基于OpenCV的气体泵扫描仪数字识别系统

基于OpenCV的气体泵扫描仪数字识别系统 的相关文章

随机推荐

热门标签

基于OpenCV的气体泵扫描仪数字识别系统的相关文章