opencv项目实战（二）——文档扫描OCR识别

2023-11-05

一、项目描述
二、代码详解
三、项目完整代码

一、项目描述

目的
将图片中的文档矫正，并识别文档内容
输入与输出
方法流程
核心思想：采用tesseract-ocr进行文档识别。具体流程如下：
1. 定位图像中文档区域
2. 对图像中文档区域进行透视变换等操作，凸显文档内容
3. 采用pytesseract进行文档识别

二、代码详解

2.1 预定义参数

导包

import os
import cv2
import argparse
import pytesseract
import numpy as np
from PIL import Image

设置参数

def parse():
    """设置自己的参数"""
    parser = argparse.ArgumentParser(description="set your identity parameters")
    parser.add_argument("-i", "--image", default="./images/receipt.jpg", type=str,
                        help="Path to the image to be scanned")

    opt = parser.parse_args()
    # opt = vars(opt)   # 可用于返回参数的‘字典对’对象
    return opt

2.2 辅助函数

绘图

def cv_show(name, img):
    """绘图，避免重复造轮子"""
    cv2.imshow(name, img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

缩放图像尺寸

def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
    """根据自定的宽/高进行等比例缩放图像"""
    dim = None              # 缩放后的图像尺寸
    h, w = image.shape[:2]  # 原始图像尺寸
    if width is None and height is None:
        return image
    if width is None:
        r = height / float(h)
        dim = (int(w * r), height)
    else:
        r = width / float(w)
        dim = (width, int(h * r))

    resized = cv2.resize(image, dim, interpolation=inter)
    return resized

对四边形四个顶点排序：左上，右上，右下，左下

def order_points(pts):
    """对4个坐标点进行排序：左上，右上，右下，左下"""
    rect = np.zeros((4, 2), dtype="float32")

    # 计算左上，右下；左上特点：x+y最小，右下特点：x+y最大
    s = pts.sum(axis=1)             # 计算每一个点的 x+y
    rect[0] = pts[np.argmin(s)]     # 得到左上点
    rect[2] = pts[np.argmax(s)]     # 得到右下点

    # 计算右上和左下；右上特点：y-x最小，左下特点：y-x最大
    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]  # 得到右上点
    rect[3] = pts[np.argmax(diff)]  # 得到左下点

    return rect

根据四组对应点进行透视变换

def four_point_transform(image, pts):
    """根据4组对应点进行透视变换"""
    # 1. 获取输入坐标点
    rect = order_points(pts)    # 对坐标点进行排序
    tl, tr, br, bl = rect       # 依次对应：左上，右上，右下，左下；即A,B,C,D

    # 2. 计算输入的w和h值
    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))   # 计算CD的长度
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))   # 计算AB的长度
    maxWidth = max(int(widthA), int(widthB))

    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))  # 计算BC的长度
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))  # 计算AD的长度
    maxHeight = max(int(heightA), int(heightB))

    # 3. 定义变换后对应坐标位置
    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype="float32")

    # 4. 透视变换
    M = cv2.getPerspectiveTransform(rect, dst)                      # 根据4组对应点，计算投射变换矩阵
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))   # 透视变换

    return warped

2.3 文档矫正

流程：

读取待识别图像进行预处理（缩放）

image = cv2.imread(opt.image)       # 读取图像
ratio = image.shape[0] / 500.0      # 高度调整到500需要的比例
orig = image.copy()                 # 原始图像
image = resize(orig, height=500)    # 缩放图像

在这里插入图片描述
2. 转换为灰度图，进行边缘检测

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转换为灰度图
gray = cv2.GaussianBlur(gray, (5, 5), 0)        # 高斯滤波
edged = cv2.Canny(gray, 75, 200)                # 边缘检测

在这里插入图片描述

进行轮廓检测，对轮廓按面积大小排序，找到最外层轮廓（包含所有文档区域

cnts, hierarchy = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)    # 查找轮廓
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]                                  # 对轮廓按面积从大到小排序
need = cnts[0]

将最外层轮廓近似为四边形

peri = cv2.arcLength(need, True)                     # 获取最外层轮廓的周长
approx = cv2.approxPolyDP(cnts[0], 0.02 * peri, True)

在这里插入图片描述
5. 进行透视变换将文档矫正，二值化凸显内容

# 3. 透视变换——关键所在
warped = four_point_transform(orig, approx.reshape(4, 2) * ratio)

# 4. 二值处理——凸显结果
warped = cv2.cvtColor(warped, cv2.COLOR_BGR2GRAY)
ref = cv2.threshold(warped, 100, 255, cv2.THRESH_BINARY)[1]
cv2.imwrite('scan.jpg', ref)

在这里插入图片描述

2.4 文档识别

方法
利用tesseract-ocr进行文本识别
安装tesseract-ocr
1. 下载安装包 tesseract-ocr-setup-x.xx.xxdev.exe
2. 配置环境变量
- 系统变量
- 路径变量：如 D:\software\pyEnviroment\Tesseract-OCR
1. 测试
```
tesseract -v
tesseract XXX.png result
```
安装pytesseract
```
pip install pytesseract
```
若后续有相关报错，可尝试：

修改安装包中的tesseract_cmd 路径：
\Anaconda3\envs\YOUR_ENVS_NAME\Lib\site-packages\pytesseract\pytesseract.py
原：tesseract_cmd = ‘tesseract’
现：tesseract_cmd = ‘D:\software\pyEnviroment\Tesseract-OCR\tesseract.exe’
识别代码

    gray = cv2.medianBlur(ref, 3)           # 对图像进行中值滤波

    filename = "{}.png".format(os.getpid())
    cv2.imwrite(filename, gray)             # 保存滤波结果

    text = pytesseract.image_to_string(Image.open(filename))    # 文档识别
    with open("result.txt", 'w') as f:
        f.write(text)                       # 将结果写入文档
    os.remove(filename)
    cv_show("output", gray)                 # 显示中值滤波后的图片

在这里插入图片描述

三、项目完整代码

import os
import cv2
import argparse
import pytesseract
import numpy as np
from PIL import Image


def parse():
    """设置自己的参数"""
    parser = argparse.ArgumentParser(description="set your identity parameters")
    parser.add_argument("-i", "--image", default="./images/receipt.jpg", type=str,
                        help="Path to the image to be scanned")

    opt = parser.parse_args()
    # opt = vars(opt)   # 可用于返回参数的‘字典对’对象
    return opt


def cv_show(name, img):
    """绘图，避免重复造轮子"""
    cv2.imshow(name, img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


def order_points(pts):
    """对4个坐标点进行排序：左上，右上，右下，左下"""
    rect = np.zeros((4, 2), dtype="float32")

    # 计算左上，右下；左上特点：x+y最小，右下特点：x+y最大
    s = pts.sum(axis=1)             # 计算每一个点的 x+y
    rect[0] = pts[np.argmin(s)]     # 得到左上点
    rect[2] = pts[np.argmax(s)]     # 得到右下点

    # 计算右上和左下；右上特点：y-x最小，左下特点：y-x最大
    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]  # 得到右上点
    rect[3] = pts[np.argmax(diff)]  # 得到左下点

    return rect


def four_point_transform(image, pts):
    """根据4组对应点进行透视变换"""
    # 1. 获取输入坐标点
    rect = order_points(pts)    # 对坐标点进行排序
    tl, tr, br, bl = rect       # 依次对应：左上，右上，右下，左下；即A,B,C,D

    # 2. 计算输入的w和h值
    widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))   # 计算CD的长度
    widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))   # 计算AB的长度
    maxWidth = max(int(widthA), int(widthB))

    heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))  # 计算BC的长度
    heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))  # 计算AD的长度
    maxHeight = max(int(heightA), int(heightB))

    # 3. 定义变换后对应坐标位置
    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]], dtype="float32")

    # 4. 透视变换
    M = cv2.getPerspectiveTransform(rect, dst)                      # 根据4组对应点，计算投射变换矩阵
    warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))   # 透视变换

    return warped


def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
    """根据自定的宽/高进行等比例缩放图像"""
    dim = None              # 缩放后的图像尺寸
    h, w = image.shape[:2]  # 原始图像尺寸
    if width is None and height is None:
        return image
    if width is None:
        r = height / float(h)
        dim = (int(w * r), height)
    else:
        r = width / float(w)
        dim = (width, int(h * r))

    resized = cv2.resize(image, dim, interpolation=inter)
    return resized


if __name__ == '__main__':
    # =================== 参数预处理 ===================
    opt = parse()
    # ================== 图像文档矫正 ===================
    # 0. 图像预处理
    image = cv2.imread(opt.image)       # 读取图像
    ratio = image.shape[0] / 500.0      # 高度调整到500需要的比例
    orig = image.copy()                 # 原始图像
    image = resize(orig, height=500)    # 缩放图像

    # 1. Canny边缘检测
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转换为灰度图
    gray = cv2.GaussianBlur(gray, (5, 5), 0)        # 高斯滤波
    edged = cv2.Canny(gray, 75, 200)                # 边缘检测

    # 展示预处理结果
    print("STEP 1: 边缘检测")
    cv2.imshow("Image", image)
    cv_show("Edged", edged)

    # 2. 轮廓检测 —— 需要的是最外侧轮廓，其特点：周长/面积最大
    cnts, hierarchy = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)    # 查找轮廓
    cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]                                  # 对轮廓按面积从大到小排序
    need = cnts[0]                                                                              # 最外层轮廓

    peri = cv2.arcLength(need, True)                     # 获取最外层轮廓的周长
    # ----------------------------------------------------------
    # cv2.approxPolyDP(): 主要功能是把一个连续光滑曲线折线化，对图像轮廓点进行多边形拟合。
    # 参数：
    #   curve：表示输入的点集
    #   epsilon：表示从原始轮廓到近似轮廓的最大距离，它是一个准确度参数
    #   closed：表示是否封闭，True表示封闭的
    # ----------------------------------------------------------
    approx = cv2.approxPolyDP(cnts[0], 0.02 * peri, True)   # 轮廓拟合成四边形

    # 展示轮廓检测结果
    print("STEP 2: 获取轮廓")
    print("轮廓的角点个数：", len(approx))
    cv2.drawContours(image, [approx], -1, (0, 255, 0), 2)
    cv_show("Outline", image)

    # 3. 透视变换——关键所在
    warped = four_point_transform(orig, approx.reshape(4, 2) * ratio)

    # 4. 二值处理——凸显结果
    warped = cv2.cvtColor(warped, cv2.COLOR_BGR2GRAY)
    ref = cv2.threshold(warped, 100, 255, cv2.THRESH_BINARY)[1]
    cv2.imwrite('scan.jpg', ref)

    # 展示结果
    print("STEP 3: 变换")
    cv2.imshow("Original", resize(orig, height=650))
    cv_show("Scanned", resize(ref, height=650))

    # 5. 文档识别
    gray = cv2.medianBlur(ref, 3)           # 对图像进行中值滤波

    filename = "{}.png".format(os.getpid())
    cv2.imwrite(filename, gray)             # 保存滤波结果

    text = pytesseract.image_to_string(Image.open(filename))    # 文档识别
    with open("result.txt", 'w') as f:
        f.write(text)                       # 将结果写入文档
    os.remove(filename)
    cv_show("output", gray)                 # 显示中值滤波后的图片

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

实战项目

opencv

计算机视觉

python

opencv项目实战（二）——文档扫描OCR识别的相关文章

如何在 Heroku 中安装 NLTK 模块

嘿我想在我的 Heroku 服务器上安装 NLTK pos tag 我该怎么办呢请给我一些步骤因为我是 Heroku 服务器系统的新手我刚刚添加了官方nltk支持构建包只需添加一个nltk txt文件包含要安装的语料库列表一切都
如何使用 eval dataframe 方法在自定义函数中返回 numpy 数组或列表？

我正在使用 python 3 X 我正在尝试使用eval https pandas pydata org pandas docs stable generated pandas eval html pandas eval数据框方法包括这样
Numpy 中矩阵乘以另一个矩阵的每一行

我有一个大小为 4x4 的齐次变换矩阵和一个大小为 nx3 的轨迹该轨迹的每一行都是一个向量我想将齐次变换矩阵乘以轨迹的每一行下面是代码 append zero column at last trajectory np hstack
在类中设置默认值

我正在用 Python 创建一个类但我不确定如何正确设置默认值我的目标是为所有类实例设置默认值也可以通过类方法对其进行修改但是我希望在调用方法后恢复初始默认值我已经能够使用下面所示的代码使其工作它不是很漂亮所以我怀疑这是解
为什么我的查询在参数化后会中断？

我有 2 张桌子 Sales and Product Sales可以将产品存储为Idn or Name 传统设计和Type列指定实际type与之相关 Product等是连接的子集表into这个表来获取真实的数据在这个例子中 Produc
Python Ctypes：将返回的 C 数组转换为 python 列表，无需 numpy

我正在使用 Python Ctypes 来访问一些 C 库我连接到的函数之一返回const double 它实际上是一个双精度数组当我在Python中得到结果时如何将该数组转换为Python列表 C函数的签名 const double
从可变长度字符串中解析值的最佳方法是什么？

假设我有一个由可变长度的逗号分隔的整数字符串分割字符串并用值更新变量如果存在的最佳方法是什么目前我有以下内容 a b c 10 10 1 default values mylist int x for x in input spl
如何在 Windows 上检查子进程是否被信号杀死

问题给定一个在 python 中启动的子进程其代码类似于 import subprocess p subprocess Popen command stdout subprocess PIPE stderr subprocess PIP
Scikit-learn：如何获得 True Positive、True Negative、False Positive 和 False Negative

我的问题我有一个数据集它是一个很大的 JSON 文件我读取它并将其存储在trainList多变的接下来我对其进行预处理以便能够使用它完成后我开始分类我用kfold交叉验证方法以获得平均值准确性并训练分类器我做出预测并获
优化 Django Queryset for 循环

如何优化以下查询集 link goal for link in self child links all 我想摆脱 for 循环并只访问数据库一次我有以下代码 class Goal models Model name models Cha
MAMP Python-MySQLdb 问题：调用 Python 文件后 libssl.1.0.0.dylib 的路径发生变化

我正在尝试使用 python MySQLdb 访问 MAMP 服务器上的 MySQL 数据库当我最初尝试使用 python sql 调用 Python 文件来访问 MAMP 上的数据库时我得到了image not found关于错误li
BeautifulSoup - 抓取论坛页面

我正在尝试抓取论坛讨论并将其导出为 csv 文件其中包含线程标题用户和帖子等行其中后者是每个人的实际论坛帖子我是 Python 和 BeautifulSoup 的初学者所以我对此感到非常困难我当前的问题是 csv 文件中
在循环中动态添加方法时的范围问题

我有一个 API 用于分析我的锻炼数据我抓取的数据跑卫 http runkeeper com 的网站我的主类是一个子类pandas DataFrame 它基本上是表格数据的容器它支持按列名索引返回列值的数组我想根据数据中存在的
如何通过检查传递给 pytest_runtest_teardown 的 Item 对象来确定测试是否通过或失败？

Pytest 允许您通过实现一个名为的函数来进入每个测试的拆卸阶段pytest runtest teardown在插件中 def pytest runtest teardown item nextitem pass 是否有一个属性或方法it
在Python中，如何将“datetime”对象转换为秒？

我有一堆日期时间对象我想计算每个对象自过去固定时间以来的秒数例如自 1970 年 1 月 1 日以来 import datetime t datetime datetime 2009 10 21 0 0 这似乎只是区分具有不同日期的日期
找出段落中出现的单词

sentence Alice was not a bit hurt and she jumped up on to her feet in a moment words Alice jumped played 我可以使用filterpyth
pytest 看不到正在测试的函数的日志

我有一个像这样的烧瓶应用程序 from flask import Flask import logging app Flask name app route def catch all logging warning I m a warni
Python Pandas 系列失败日期时间

我认为这一定是 pandas 的失败有一个 pandas 系列 v 18 1 和 19 如果我为该系列分配一个日期第一次将其添加为 int 错误第二次将其添加为 int 错误添加为日期时间正确我无法理解原因例如使用以下代码 i
AttributeError：模块“matplotlib”没有属性“font_manager”

我安装了 matplotlib 但 python 3 8 10 显示了这个错误 AttributeError module matplotlib has no attribute font manager What i am doing w
检查数组中是否有 3 个连续值高于某个阈值

假设我有一个像这样的 np array a 1 3 4 5 60 43 53 4 46 54 56 78 有没有一种快速方法来获取 3 个连续数字都高于某个阈值的所有位置的索引也就是说对于某个阈值th 得到所有x其中 a x gt th

随机推荐

17_分布式文档系统_document的全量替换、强制创建以及lazy delete机制

课程大纲 1 document的全量替换 2 document的强制创建 3 document的删除 1 document的全量替换 1 语法与创建文档是一样的如果document id不存在那么就是创建如果document id已经
Swagger

第一节 Swagger 简介 1 企业开发所面临的问题在前后端分离开发的情况下前端开发人员经常抱怨后端开发人员给的接口文档与实际情况不一致后端开发人员觉得编写接口文档太过于消耗精力而且更新也不及时以至于前后端开发人员经常出现争吵的
【kickstart 2021 round C】前三题python题解

第一题题目给定长度为N的字符串S 它是由字母表上的前K个字母构成问字典序小于S且长度为N的回文字符串由字母表上的前K个字母构成有多少个解释参考官方题解计算多少个长度为N 2的字符串的字典序小于S math ceil N 2
动态动态规划(DDP)

1 Problem E Codeforces 一题目大意给你一个无向图第i和i 1条边的权值是w i 问你每个点不在自己原本的点的代价是多少会有q组询问表示修改第i条边的权值二解题思路可以观察到完成这个操作需要每条边经过两
[LeetCode]初级算法-字符串- 实现strStr()

标题实现strStr 实现 strStr 函数给定一个 haystack 字符串和一个 needle 字符串在 haystack 字符串中找出 needle 字符串出现的第一个位置从0开始如果不存在则返回 1 示例 1 输入 h
linux防火墙启动、停止、查看

停止防火墙 service iptables stop 启动防火墙 service iptables start 查看防火墙配置 iptables L n 修改的内容只是暂时保存在内存中如果重启后还要生效则要保存一下 service
Web Storage是什么？Web Storage详解

Web Storag是HTML5引入的一个非常重要的功能可以将数据存储在本地如保存用户的偏好设置复选框的选中状态文本框默认填写的值等用户在浏览器中刷新网页时网页通过Web Storage就可以知道用户之前所做的一些修改而不需要
Autoware 1.14(WSL2) 与LG SVL Simulator（Win11）联合仿真

参考Couldn t find executable named rqt lgsvl simulator configurator below home autoware Autoware ros in li4692625的博客 CSDN博
Hyperledger Fabric核心配置文件（1）

1 core yaml core yaml配置文件是Peer节点的示例配置文件具体路径在fabric samples config目录下该core yaml示例配置文件共指定了如下六大部分内容 1 日志部分日志记录级别有6种 CRI
JDBC访问数据库

一简介 JDBC 全称 Java DataBase Connection 数据库连接技术可以根据驱动包连接不同类型的数据库二 JDBC API JDBC API是java中位于java sql包下的一个数据库访问统一接口通过它来跟数
无监督学习KMeans学习笔记和实例

KMeans算法是一种简单的算法能够快速高效的对数据集进行聚类一般只要通过几次迭代即可 KMeans可以作为一种聚类工具同时也可以作为一种降维的方式进行特征降维 KMeans可以通sklearn cluster kmeans中进行调
测试开发 5 年从外包 18K 跳槽去字节 28K+12，啃完这份笔记你也可以

软件测试是一个付出就有回报的工作可能很多人会说软件测试就是吃青春饭然而其他工作又何尝不是没有哪一家公司养尸位素餐之人大龄员工有被辞退的也有没被辞退的干任何职业抱着一劳永逸的心态在岗位上开始混的中青年早就该辞了粉丝小王转行
测试方法——边界值法

边界值测试方法边界值方法是一种比较常用的测试方法在很多软件测试中都会应用到一应用条件只要有输入框输入数据的地方就可以用边界值这一方法来测试一般与等价类划分共同使用找到有效数值和无效数值之间的分界点及其两边的点进行测试二测
Jmeter进阶使用指南-使用参数化

Apache JMeter是一个广泛使用的开源负载和性能测试工具在进行性能测试时我们经常需要模拟不同的用户行为和数据这时候参数化就显得尤为重要此文主要介绍如何在JMeter中使用参数化什么是参数化参数化是一种将静态值替换为动态
深入理解HashMap和LinkedHashMap的区别

简介我们知道HashMap的变量顺序是不可预测的这意味着便利的输出顺序并不一定和HashMap的插入顺序是一致的这个特性通常会对我们的工作造成一定的困扰为了实现这个功能我们可以使用LinkedHashMap LinkedHashM
【配电变电站的最佳位置和容量】基于遗传算法的最优配电变电站放置(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现 1 概述基于遗传算法的最优配电变电站放置为了实现
iseacms1.0漏洞复现

iseacms1 0漏洞复现作者 admin 时间 2021 06 29 分类漏洞复现 Index php源码文件包含参数转义了 0 利用方式有限在网站目录有phpinfo php文件的前提下 payload为 index r te
【十三】Nacos 服务注册和配置中心

目录 Nacos 初识 Nacos 服务部署注册中心服务部署服务提供者注册到Nacos 服务消费者从Nacos获取服务负载均衡 Nacos 服务详解实列服务详情详解 Nacos 初识 Nacos Dynamic Naming and
Android 输入框的输入提示效果（AutoCompleteTextView）

在一些体验较好的APP中输入框输入时会有相应的提示让人能够很快的通过点击提示进入下一步这里我就通过自己构思实现了一个通过 SharedPreferences 保存的输入提示 demo 实现 1 实现一个 SharedPrefere
opencv项目实战（二）——文档扫描OCR识别

一项目描述二代码详解 2 1 预定义参数 2 2 辅助函数 2 3 文档矫正 2 4 文档识别三项目完整代码一项目描述目的将图片中的文档矫正并识别文档内容输入与输出方法流程核心思想采用tesseract ocr进

opencv项目实战（二）——文档扫描OCR识别

一、项目描述

二、代码详解

2.1 预定义参数

2.2 辅助函数

2.3 文档矫正

2.4 文档识别

三、项目完整代码

opencv项目实战（二）——文档扫描OCR识别 的相关文章

随机推荐

热门标签

opencv项目实战（二）——文档扫描OCR识别的相关文章