Tesseract-OCR4.0在Visual Studio2015中的编译及运行

2023-11-18

最近项目需要使用到OCR引擎，通过百度了解到Tesseract在这方面做的挺好的。于是便开始学习tesseract。

tesseract的github地址：https://github.com/tesseract-ocr/tesseract

现在已经更新到了4.0版本，使用了最新的LSTM网络来进行OCR的识别，较之之前的版本有技术上的提升。

编译之前首先需要下载一些工具：CMAKE和CPPAN。

CMake是一个跨平台的安装（编译）工具，可以用简单的语句来描述所有平台的安装(编译过程)。他能够输出各种各样的makefile或者project文件，能测试编译器所支持的C++特性,类似UNIX下的automake。

Cppan类死于java里的maven，是一个包的管理工具，可以很方便的对用到的类库进行管理。

下载地址：

cmake:https://cmake.org/download/

cppan:https://cppan.org/client/

下载好以后，添加环境变量。在系统环境变量的path变量里，添加cmake.exe和cppan.exe所在的路径。添加完成后，相当于把我们需要的类库管理工具装好了。

接下来下载tesseract源码。tesseract的github地址：https://github.com/tesseract-ocr/tesseract

下载tesseract源码以后，使用命令行，进入tesseract-master（tesseract源码根目录）路径下。进入以后，运行命令：cppan。即可进行相关类库的下载。会出现以下内容：

Initializing storage

Packages database was not found
Downloading database
Downloading: pvt.cppan.demo.gif-5.1.4...
Downloading: pvt.cppan.demo.jpeg-9.2.0...
Downloading: pvt.cppan.demo.gnome.pango.pangocairo-1.42.1...
Downloading: pvt.cppan.demo.openjpeg.openjp2-2.3.0...
Downloading: pvt.cppan.demo.gnome.pango.pangoft2-1.42.1...
Downloading: pvt.cppan.demo.gnome.glib.gobject-2.56.1...
Downloading: pvt.cppan.demo.xz_utils.lzma-5.2.3...
Unpacking : pvt.cppan.demo.openjpeg.openjp2-2.3.0...
Unpacking : pvt.cppan.demo.xz_utils.lzma-5.2.3...
Unpacking : pvt.cppan.demo.gif-5.1.4...
Downloading: pvt.cppan.demo.grigorig.ucdn-master...
Downloading: pvt.cppan.demo.madler.zlib-1.2.11...
Unpacking : pvt.cppan.demo.gnome.pango.pangoft2-1.42.1...
Downloading: pvt.cppan.demo.gnu.fribidi.fribidi-1.0.2...
Downloading: pvt.cppan.demo.gnome.glib.glib-2.56.1...
Unpacking : pvt.cppan.demo.gnome.pango.pangocairo-1.42.1...
Downloading: pvt.cppan.demo.webp-0.6.1...
Unpacking : pvt.cppan.demo.gnome.glib.gobject-2.56.1...
Downloading: pvt.cppan.demo.png-1.6.34...
Unpacking : pvt.cppan.demo.jpeg-9.2.0...
Unpacking : pvt.cppan.demo.grigorig.ucdn-master...
Downloading: pvt.cppan.demo.danbloomberg.leptonica-1.75.3...
Downloading: pvt.cppan.demo.freedesktop.fontconfig.fontconfig-2.13.0...

Unpacking : pvt.cppan.demo.madler.zlib-1.2.11...

下载包，解压包，编译包....很简单。

下载结束以后。

在tesseract-master（tesseract源码根目录）路径下，新建build文件夹，命令是：mkdir build。

新建完成后，进入build文件夹，命令是：cd build。

对项目进行编译，命令是：cmake ..（注意两个点号不能省略，cmake后，有空格。）

输入命令后，即可进行编译操作...等待完成即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OCR

Tesseract

Tesseract-OCR4.0在Visual Studio2015中的编译及运行的相关文章

Tesseract 对阿拉伯语单词/字母不返回任何内容

我已经安装了 Pytesseract 它可以完美地处理法语英语文本以及数字但是当我尝试阅读任何阿拉伯文本字母时它不会返回任何内容这是我使用过的代码 try from PIL import Image except ImportEr
android ndk-构建错误

我正在尝试为 Android 构建 tesseract 我已将 tesseract 放入示例文件夹中 C Android NDK android ndk r8 samples tesseract之内tesseract我有的文件夹tesser
如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想检测图像中的表格识别表格块以及其中可能的文本在 tesseract 的早期版本中可以使用参数 textord dump t
我自己的 Python OCR 程序

我还是一个初学者但我想写一个字符识别程序这个程序还没有准备好而且我编辑了很多所以评论可能不完全一致我将使用 8 个连通性来标记连通分量 from PIL import Image import numpy as np im Ima
pytesseract找不到指定的文件

我的代码很简单如下所示 import pytesseract from PIL import Image img Image open C temp foo jpg img load i pytesseract image to stri
让 tesseract 只识别数字

我正在尝试改进我制作的 OCR 程序来读取我正在使用的某个图像的布局现在我希望我的 OCR 程序只能识别数字 0 9 我尝试遵循问题的解决方案限制 tesseract 正在寻找的字符 https stackoverflow com q
Google Vision API 文本识别器无法正常工作

我使用 Google Vision API 来读取报纸等任何物体上的文本或墙上的文本我已经尝试过来自 Google 开发者网站的相同示例但我的文本识别器总是返回 falseIsOperational功能我在 Blackberry ke
OCR 解析获取复选框或单选按钮值

I need to parse OCR image file and get all texts and checkbox values How to get Checkbox or Radio Button value from OCR
有没有办法在 venv/web 服务器中安装 Tesseract OCR？

我制作了一个执行 OCR 功能的 Python 脚本然后回收了该脚本并使用 Flask 制作了一个 Web 应用程序 Web 应用程序及其库位于 virtualenv 中但该应用程序使用操作系统 Windows 中安装的 Tessera
OCR 扑克牌 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我决定做一个有趣的项目我想将扑克牌的图像作为输入并返回其等级和花色我认为我只需要查看左上角因为那里包含了所有信息它应该是稳健的
用于屏幕文本的 OCR（光学字符识别）

我正在尝试创建一个软件通过捕获屏幕截图来自动化 PC 然后使用 OCR 光学字符识别来查找要单击的特定按钮例如我已经有了鼠标和键盘控制部分但现在我需要 OCR 来处理屏幕截图我发现 Tesseract OCR 似乎不能很好地处
使用 Tesseract OCR 和 python 进行数字识别

我使用 Tesseract 和 python 读取数字从能量计除了数字 1 之外一切都运行良好 Tesseract 无法读取 1 数字 This is the picture I send to tesseract tesseract
Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
如何将 Tesseract 导入 Angular2 (TypeScript)

我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中但是在使用时 import Tesseract from types tesseract js it s
如何在Eclipse中配置Tesseract进行Android开发？

我已经从事 Android 工作 6 个月了至此我对Android开发有了基本的了解现在我想使用 Tesseract 开发一个 OCR Android 应用程序为此我从 Tesseract 下载了 android ndk r6b t
Tess4j - Pdf 到 Tiff 到 tesseract - “警告：分辨率 0 dpi 无效。使用 70 代替。”

我正在使用 tess4j net sourceforge tess4j tess4j 4 4 0 并尝试对 pdf 文件进行 OCR 因此据我了解我必须首先将 pdf 转换为 tiff 或 png 其中有任何建议吗我这样做是这样的 t
以编程方式识别 PDF 文件中的扫描文本 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 PDF 文件其中包含我们需要导入数据库的数据这些文件似乎是打印的字母数字文本的 pdf
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
来自 Google Vision API OCR 的响应 400，带有指定图像的 base64 字符串

我读了如何使用 Google Vision API 对 Base64 编码图像进行文本检测 https stackoverflow com questions 43094048 how to use the google vision ap

随机推荐

mysql更新区间的数_解决针对MySQL中对于某一个区间段范围的数据更新的情况

1 在使用更新update的过程中我们可能会想要更新比如id段在某一个指定范围内的数据如果我们是想要更新前面多少行的数据的话可以直接 UPDATE tb name SET column name value ORDER BY id AS
华为OD机试 - 滑动窗口最大和 - 滑动窗口（Java 2023 B卷 100分）

目录专栏导读一题目描述二输入描述三输出描述四解题思路五 Java算法源码六效果展示 1 输入 2 输出 3 说明华为OD机试 2023B卷题库疯狂收录中刷题点这里专栏导读本专栏收录于华为OD机试 JAVA
配置多个TOMCAT

1 把下载好的tomcat解压到想存放的目录它不用安装的在官网下载好一解压就是了 2 打开电脑的编辑环境变量配置CATALINA HOME环境变量如图我这里装了9和10 先配一个CATALINA HOME9 值是tomcat9的
Qt样式表-详解

一 QT样式表简介 1 1 QT样式表简介 QSS的主要功能是使界面的表现与界面的元素分离使得设计皮肤与界面控件分离的软件成为可能 QT样式表是允许用户定制widgets组件外观的强大机制此外子类化QStyle也可以定制widgets
Latex数学公式方程格式总结

单行公式有自动标号一般式子之间行距较大 begin equation T tilde nabla lim Delta v rightarrow 0 frac 1 Delta v left oint s T hat n mathrm d s
Java接口以及static和final关键字

Java接口以及static和final关键字一 static 二 final 三让final元素可以初始化不用固定赋值四接口五抽象方法六接口能够创建对象吗匿名内部类七另一实例开锁一 static static代
OI考试中及平常练习里的一些低级错误总结

long long相关 1 没开long long long long开少了具体地可能是未对题目可能产生的数值预估可能是只写了int的读优忽略long long 2 define int long long出锅 1 比如在遍历图的时
React中的性能优化

1 所有的this指向都在constructor中绑定就避免了多次绑定 this指向问题只有当this指向我们定义的组件时才能去对state做修改不去改变this指向在该方法中this就指向undefined 2 setState是
ssm基于微信小程序的社区老人健康管理服务系统的设计与实现毕业设计源码011513

摘要随着现在网络的快速发展网络的应用在各行各业当中它很快融入到了许多分类管理之中他们利用网络来做这个社区老人健康管理服务系统随之就产生了社区老人健康管理服务系统这样就让社区老人健康管理服务系统更加方便简单对于本社区老人健康管理
Puzzles【Codeforces 697 D】【树形DP + 期望DP】

Codeforces Round 362 Div 2 D 我们从1号结点开始给每个结点标序问的是每个结点的序号的期望是多少输出这N个结点的期望那么1号点的期望一定就是1了对于其他的点呢可以举例这样的一幅图首先我们可以确定1 因
基于UDP编程

基于UDP编程 1 UDP是数据报协议无连接的不可靠追求传输效率的一种通信协议数据的发送和接收是同步的在进行通信之前不需要建立连接其传输效率比TCP高对其服务器而言并没有三次握手的过程因此和TCP相比少了被动监听 lis
Springboot实现发送邮件功能

相信使用过Spring的众多开发者都知道Spring提供了非常好用的JavaMailSender接口实现邮件发送在Spring Boot的Starter模块中也为此提供了自动化配置下面通过实例来讲解如何在Spring Boot中使用Ja
发布自己的Python包(Pypi)

发布自己的Python包 Pypi 我们经常使用 Pypi 来安装包但是有时候我们也想要发布自己的 Pypi 包有可能我们写了一个特别牛的包也有可能我们只是想使用自己常用的一些轮子可能这是我们日常编码中很常用的一些轮子我们在不同工
AttributeError: 'list' object has no attribute 'shape'

深思熟虑运筹帷幄疑惑解惑 shape 是数组的属性不是集合的属性可把集合变成数组如np array list A
架构之道：分离业务逻辑和技术细节

点击上方朱小厮的博客选择设为星标当当满200减40优惠码 J2KNAE 来源阿里巴巴云原生 1 什么是架构关于架构这个概念很难给出一个明确的定义也没有一个标准的定义硬是要给一个概述我认为架构就是对系统中的实体以及实体之间的
[深度学习] - 网络模型训练过程的 loss 变化分析 (loss / val_loss / test_loss)

目录一 train set 和 test set 基础知识二分析 loss 和 val loss test loss 变化情况一 train set 和 test set 基础知识 train set 训练集是用来训练网络模型的数据
大数据主要应用于哪些行业，应用价值是什么？

大数据无处不在大数据应用于各个行业包括金融汽车餐饮电信能源体能和娱乐等在内的社会各行各业都已经融入了大数据的印迹下面详细介绍一下大数据在各行各业的具体应用制造业利用工业大数据提升制造业水平包括产品故障诊断与预测分析工
- UnitBox An Advanced Object Detection Network，arxiv 16.08

UnitBox An Advanced Object Detection Network arxiv 16 08 download 该论文提出了一种新的loss function IoU loss 这点比较有意思也容易复现论文分析了fa
Python之子类调用父类的两种方式

第一种方式直接在子类中调用父类名调用方式如下 Vehicle init self name speed load power 调用父类的实例 Vehicle run self 调用父类的方法下面给出具体样例直接调用父类名 class
Tesseract-OCR4.0在Visual Studio2015中的编译及运行

最近项目需要使用到OCR引擎通过百度了解到Tesseract在这方面做的挺好的于是便开始学习tesseract tesseract的github地址 https github com tesseract ocr tesseract 现在

Tesseract-OCR4.0在Visual Studio2015中的编译及运行

Tesseract-OCR4.0在Visual Studio2015中的编译及运行 的相关文章

随机推荐

热门标签

Tesseract-OCR4.0在Visual Studio2015中的编译及运行的相关文章