最新Tesseract-OCR源码编译1——leptonica编译

2023-11-01

  上次写了Tesseract-OCR 3.02命令行程序的简单使用,同时官网上给出了3.02版本基于VS2008平台的编译工程。但对于最新源码只是说了在VS2015(3.05)和VS2013(3.04)的编译,还是英文的,且网上关于最新源码的编译不是很多,所以这里我就说一下其最新源码的编译。因为Tesseract依赖于leptonica,所以这里先讲一下最新的leptonica编译。
1
            图1.源码目录
            
  按装完成Cmake以后,我们先建立一个空文件保存leptonica编译完的工程文件,Cmake编译步骤如下所示:
  2
             图2.编译步骤
a.在Cmake界面,首先设定好源码路径,以及编译文件输出路径即上图的1,2。
b.在路径设定完成以后,点击3处的Configure按钮进行编译,此时会弹出提示框让我们选择使用的编译器,这个按自己要求去选4,选定以后点击5处的Finish就可以了。编译后出现下面情况:3

c.这时会出现红色的提示,因为并没有弹出错误提示所以不用管他,图中红色部分GIF,JPEG,TIFF,ZLIB都是leptonica所需要的图片识别库,大家可以下载尝试编译。这里我们不管他,再次点击Configure按钮进行编译就好了。
4
            图4.编译完成
d.编译完成以后,点击Generate进行项目生成即可,然后打开我们新建的编译保存文件夹,(我的是lep_build)如图5:
5
           5.编译后的文件目录
           
e.然后双击图中蓝框中的解决方案,用VS打开,我这里是VS2013,然后就可以编译出我们想要的库文件了,Cmake的默认生成文件是.dll所以我们这里需要配置一下项目。如图6:
6

f.完成后,就可以编译了,这里我们生成静态库文件,右键leptonica工程生成:
7
              图7.右键生成
              
  注意:在编译过程中如果出现错误,可以根据自己错误情况修改一下即可,比如我的就出现下图的参数类型不匹配的错误:8
             图8.可能遇到的错误
             
这里是应为n的定义类型与sqrt()函数输入类型不匹配的问题,所以我们这里稍微改一下就好了,如下图:
9
            图9.编译成功
            
这里所做的修改就是对n进行下强制变换。
g.最后我们就可以在相应的文件爱夹下得到库文件了,我用的是debug模式所以就在该文件下:
10

  这样就完成编译了,这是leptonica源码编译,同样适用VS2008, 上述过程是本人试验所得,要是有什么错误,还望指正。我把我自己编译的工程文件传一下:lep_build,下次再说Tesseract最新源码的编译。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

最新Tesseract-OCR源码编译1——leptonica编译 的相关文章

  • 如何从收据中提取相关信息

    我正在尝试结合使用 Opencv Tesseract 和 Keras 从一系列不同的收据中提取信息 该项目的最终结果是 我应该能够使用手机拍摄收据照片 并从该照片中获取商店名称 支付类型 卡或现金 支付金额和找零 到目前为止 我已经使用 O
  • Microsoft Azure 认知服务手写检测边界框参数

    我目前正在使用Microsoft Azure 认知服务手写检测 API https learn microsoft com en in azure cognitive services computer vision quickstarts
  • Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

    我正在尝试使用 python 创建实时 OCRmss and pytesseract 到目前为止 我已经能够捕获整个屏幕 其 FPS 稳定为 30 如果我想捕获大约 500x500 的较小区域 我已经能够获得 100 FPS 然而 一旦我包
  • 使用 OCR 识别上标字符

    我已经开始了一个简单的项目 其中它必须获取包含带有上标的文本的图像 然后通过使用 OCR 目前我使用的是 tesseract 它必须识别上标字符 普通字符 例如 我们有一个化学方程式 例如 Cl 但是当我使用超立方体识别它时 它给出了 Cl
  • 使用 python 和 opencv 检测图像中的文本区域

    我想使用 python 2 7 和 opencv 2 4 9 检测图像的文本区域 并在其周围画一个矩形区域 就像下面的示例图片所示 我对图像处理很陌生 所以任何想法如何做到这一点将不胜感激 有多种方法可以检测图像中的文本 我建议看看这个问题
  • android ndk-构建错误

    我正在尝试为 Android 构建 tesseract 我已将 tesseract 放入示例文件夹中 C Android NDK android ndk r8 samples tesseract之内tesseract我有的文件夹tesser
  • Tess-2 OCR 不工作

    我试图在 Android 上使用 tess two 从图像中获取文本 但这给了我一个非常糟糕的结果 01 16 12 00 25 339 I Tesseract native 29038 Initialized Tesseract API
  • 烦人的 python tesseract 错误打开数据文件时出错 ./tessdata/eng.traineddata

    我遇到了这个错误 这让我对 tesseract 的 python 包装器有点疯狂 这是一个名为 tesseract 的 python 模块 这是我尝试运行的 python 代码 img cv2 imread image 0 api tess
  • unicharset_extractor:找不到命令

    我想使用超正方体创建新的列车数据 因此 请按照以下网站中提到的步骤进行操作 https blog cedric ws how to train tesseract 301 https blog cedric ws how to train
  • 如何使用 tesseract 4.0 或使用 pytesseract 检测图像中的表格? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我想检测图像中的表格 识别表格块以及其中可能的文本 在 tesseract 的早 期版本中 可以使用参数 textord dump t
  • 在Python中从pdf中提取印地语编写的文本[重复]

    这个问题在这里已经有答案了 我想从 pdf 文档中提取印地文输入的文本 我已附上示例页面的图像 https i stack imgur com UkT86 jpg我正在处理 我尝试使用 pdfminer 从中获取文本 但文本是乱码 可能是由
  • 超正方错误 - 图像太大

    对于大小为 5 MB 的图像 我从 tesseract 收到以下错误 Tesseract 开源 OCR 引擎 v3 01 与 Leptonica 第0页 图片太大 39667 56133 处理过程中出错 文件大小是否有限制 或者是否有参数可
  • 图像中的文本检测

    I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
  • Python Tesseract 无法识别这种字体

    我有这个图像 我想使用 python 将其读取为字符串 我认为这并不难 我发现了 tesseract 然后是使用 tesseract 的 python 脚本的包装器 所以我开始阅读图像 效果很好 直到我尝试阅读这张图像 我是否需要训练它来读
  • 使用背景校正图像 (Python)

    我正在开发一个项目 对标签上的文本进行 OCR 操作 我的工作是对图像进行倾斜校正 使其可以用超正方体读取 I have been using this approach https www pyimagesearch com 2017 0
  • 有没有办法在 venv/web 服务器中安装 Tesseract OCR?

    我制作了一个执行 OCR 功能的 Python 脚本 然后回收了该脚本并使用 Flask 制作了一个 Web 应用程序 Web 应用程序及其库位于 virtualenv 中 但该应用程序使用操作系统 Windows 中安装的 Tessera
  • 裁剪图像后,如何找到新的边界框坐标?

    这是我得到的收据图像 我使用 matplotlib 绘制了它 x1 y1 x2 y2 x3 y3 x4 y4 bbox coords 650 850 1040 850 1040 930 650 930 image cv2 imread IM
  • TensorFlow:训练时参数不更新

    我正在使用 TensorFlow 实现分类模型 我面临的问题是 当我运行训练步骤时 我的权重和误差没有更新 结果 我的网络不断返回相同的结果 我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
  • 提高 pytesseract 从图像中正确识别文本的能力

    我正在尝试使用读取验证码pytesseract模块 大多数时候它都能提供准确的文本 但并非总是如此 这是读取图像 操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
  • Tesseract 是否会忽略扫描文档中的任何非文本区域?

    我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本 我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本 但它最终会给出误报匹配 理想情况下 您应该在将图像

随机推荐

  • ESXI安装Mikrotik RouterOS(ROS)软路由部署指南(附授权镜像下载)

    一 什么是RouterOS ROS ROS优点与缺点 RouterOS 简称ROS 是一种路由操作系统 基于Linux开发 兼容x86 PC的路由软件 是目前功能较强 应用较广的软路由系统 适用于中小企事业单位 网吧 宾馆和运营商 通过该软
  • warning The transaction log file is corrupted.

    Remark Even if appealing using compress option has a constraint when preparing the backup as clearly stated by Percona B
  • 实现两个路由器漫游(传统路由器做AP)

    如果您有钱 请买300 个以上的路由器 接上之后进入设置页面会显示选择AP模式 你继续就好了 本文针对TP Link一类没有模式选择的 方法大致两种 一 接WAN口 不同网段 开DHCP 1 修改IP地址为不同网段 比如前端路由器的IP地址
  • 【Blender】贝塞尔曲线图形原理和公式推导

    Blender 贝塞尔曲线图形原理和公式推导 什么是贝塞尔曲线 贝塞尔曲线 英文名Bezier Curve 是计算机图形学非常重要的一种曲线 它可以将若干的点 用一条平滑自然的曲线来连接起来 比如我们在地图库中绘制用户行走轨迹时 如果用折线
  • 枚举,联合体,结构体大小计算

    文章目录 前言 一 枚举类型 二 结构体 三 联合体 四 结构体的计算 总结 前言 关于枚举 联合体 结构体自己的理解 以及大小的计算 提示 以下是本篇文章正文内容 下面案例可供参考 一 枚举类型 enum 枚举是一个被命名的整型常数的集合
  • Unity_设置Shader代码默认打开方式

    Browse 浏览路径 找到打开方式
  • 【综合类型第 37 篇】又是一年 1024 程序员节

    这是 综合类型第 37 篇 如果觉得有用的话 欢迎关注专栏 到公司后才发现今天是 1024 程序员节 不过最近比较忙 忘记写博客了 刚下班回到家 最近还是挺累的 不过也快完工了 fighting 今年不知道还能不能拿到勋章了 但今天的博客无
  • C# 字典代替switch case跳转函数

    此方法 仅限于case中的函数 有相同的参数 此方法符合表驱动法思想 Table Driven Methods private delegate void Display string JSON private void button12
  • adb -- no permissions (user in plugdev group; are your udev rules wrong?)解决方案

    Ubuntu adb fastboot 报错提示 no permissions user in plugdev group are your udev rules wrong 解决方案 此处的前提是你已经安装了Android platfor
  • express框架route.js源码解析

    route js并不是express里真正的路由代码 他只是其中的一个组成部分 和router router index js 是有区别的 下面先看一下重要的代码 function Route path this path path thi
  • R语言学习:数据结构5-因子

    因子 factor 是用来处理分类数据的 分类数据又分为有序和无序 有序 年级 低中高 性别 男女 整数向量 标签label 因子优于整数向量 在线性和线性模型中经常会用到 创建因子 基线水平 factor x lt factor c fe
  • taro安装过程出现的问题

    正常安装流程 安装命令 npm install g tarojs cli 创建项目 taro init 文件名 安装异常 清除缓存 npm cache clean force 或 npm cache verify 使用淘宝镜像 cnpm i
  • uni app 录音结束监听_Taro vs uni-app选型对比

    公司新产品要求发布到各家小程序 最近研究对比了社区主流的几家小程序开发框架 独坑不如拉人众坑 分享给各位 欢迎和我一起入坑 背景 最近老板不知怎的很重视各种小程序平台 感觉要靠小程序完成今年大半kpi 产品和运营自然找我们要方案 一方面要快
  • 海思3559A上编译FFmpeg源码操作步骤

    1 从https github com FFmpeg FFmpeg releases 下载你需要的版本 2 因为ffmpeg编译选项较多 为了更方便的了解有哪些选项 可将编译选项写入到一个文本文件configure help txt中 执行
  • 在 Python 中逐行打印字典的项目

    Python 中逐行打印字典的项目 使用 dict items 方法获取字典项目的视图 使用 for 循环遍历视图 使用 print 函数逐行打印字典的项目 my dict id 1 name jiyik age 30 for key va
  • hive 压缩编码

    文章目录 1 hadoop 压缩编码 1 1 MR支持的压缩编码 2 编码 解码器 3 压缩性能的比较 4 压缩配置参数 2 hive压缩编码 2 1 如何查看hive支持的压缩 2 1 hive编码的选择 2 2 配置 1 hadoop
  • 解决问题Caused by: java.net.UnknownHostException

    在Java中 java net UnknownHostException 异常表示无法解析主机名 这意味着你尝试连接的主机名无法解析为 IP 地址 可能的原因有 主机名错误 请确保输入的主机名正确 网络连接问题 请检查网络是否连接正常 DN
  • Maven的安装以及环境的配置

    一 准备工作 1 确定电脑上已经成功安装jdk7 0以上版本 2 win10操作系统 win7操作系统 3 maven安装包 下载地址 http maven apache org download cgi 二 解压Maven安装包 在上述地
  • Django连接数据库出错

    pymysql可能出现的版本不匹配问题 第一个问题 File D virtualenv wx lib site packages django db backends mysql base py line 36 in
  • 最新Tesseract-OCR源码编译1——leptonica编译

    上次写了Tesseract OCR 3 02命令行程序的简单使用 同时官网上给出了3 02版本基于VS2008平台的编译工程 但对于最新源码只是说了在VS2015 3 05 和VS2013 3 04 的编译 还是英文的 且网上关于最新源码的