4 Tesseract-ocr 系列 : 开源OCR比较

2023-11-19

对开源OCR做一个简单的调研,网上找到的关于OCR的一些资料:

国内参考资料:

最好的开源或开放API的ocr引擎是什么?
https://www.zhihu.com/question/22417946

列举了4中OCR
目录:
1. Tesseract-OCR (Google)
2. Azure (Microsoft)
3. ABBYY Real-Time Recognition SDK
4. ocr space

OCR:几大开源库
http://blog.csdn.net/qianliheshan/article/details/48974927

OCR 中文识别用哪种软件识别率比较高?
https://www.zhihu.com/question/19593313

OCR识别的开源分析
http://blog.csdn.net/luojun2007/article/details/51614133

国外资料:
What are the best open source OCR libraries?
https://www.quora.com/What-are-the-best-open-source-OCR-libraries

Are you looking for programming libraries or even OCR software works for you ?
OCR libraries
1) Python pyocr and tesseract ocr over python
2) Using R language ( Extracting Text from PDFs; Doing OCR; all within R )
Free OCR Softwares
1. Google’s & HP’s Tesseract
2. Google’s Keep
3. Microsoft Document Imaging ( MODI ) ( assuming majority of us would be having a windows OS )
4. Microsoft One Note
5. Microsoft Oxford Project API ( This API is free until some time )
6. FreeOCR ( This is based on Tesseract engine again )
There are lot more but these are the best and out of all these, if you are looking for accuracy , Microsoft Document Imaging does better job. And if you are looking for hand written text ocr conversion then Google’s Keep does better job.
Commercial Products
1. Adobe Acrobat Pro ( RTF file format gives you best result )
2. Captiva
3. Abbyy
4. Informatica ( Not sure which module within Informatica )
5. IBM Datacapture (Datacap) (IBM Watson)
If accuracy is only your main constraint, there is something like Unprecedented Data Access at your Service( captricity ) which boasts of 99% accuracy since they crowd source people and make them convert hand written text without compromising security.

关于Tesseract-OCR (Google)
支持100多种语言,自带的库识别率不高,但是关键是可以自己训练来改善识别率。提供支持 C 和 C++ 的API。目前使用的最多。
关于安装、使用、训练等详细说明可以参见GitHub:https://github.com/tesseract-ocr/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

4 Tesseract-ocr 系列 : 开源OCR比较 的相关文章

  • 【OCR】实战使用 - 如何提高识别文字的精准度?

    实战使用 如何提高文字识别的精准度 我们在平常使用OCR的时候 经常会出现文字识别不精准的情况 我们改如何提高文字识别的精度呢 以下是一些提高OCR Optical Character Recognition 光学字符识别 文字识别精准度的
  • 2020年认证杯SPSSPRO杯数学建模C题(第二阶段)抗击疫情,我们能做什么全过程文档及程序

    2020年认证杯SPSSPRO杯数学建模 C题 抗击疫情 我们能做什么 原题再现 2020 年 3 月 12 日 世界卫生组织 WHO 宣布 席卷全球的冠状病毒引发的病毒性肺炎 COVID 19 是一种大流行病 世卫组织上一次宣布大流行是在
  • 训练 Tesseract 特定单词 - 可能吗?

    我想使用 Tesseract 从文档中提取大约 10 20 个关键字 该文档将包含所有英文字符 单词 我感兴趣的是 年龄 23 之类的东西 这里 Age 是我感兴趣的关键字 也想提取 23 它的值 我想到的第一个方法是将整个页面提取为文本
  • 使用 PHP 识别数字

    我正在尝试从图片中提取一些范围从 1 到 99 的数字 我已经尝试了几种使用 PHP 的 OCR 方法 但最终我的脚本会失败 因为数字偶尔会向左或向右旋转 5 这使得图片无法识别 我现在已经安装了 Ocropushttp code goog
  • 有人可以帮我在 android 中使用 ocr 名片扫描仪吗? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 网络安全(黑客)自学启蒙

    一 什么是网络安全 网络安全是一种综合性的概念 涵盖了保护计算机系统 网络基础设施和数据免受未经授权的访问 攻击 损害或盗窃的一系列措施和技术 经常听到的 红队 渗透测试 等就是研究攻击技术 而 蓝队 安全运营 安全运维 则研究防御技术 作
  • 网络安全(黑客)自学

    1 网络安全是什么 网络安全可以基于攻击和防御视角来分类 我们经常听到的 红队 渗透测试 等就是研究攻击技术 而 蓝队 安全运营 安全运维 则研究防御技术 2 网络安全市场 一 是市场需求量高 二 则是发展相对成熟入门比较容易 3 所需要的
  • PHP/jQuery/JavaScript 中的免费 OCR 处理 API [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 是否有任何免费的 PHP OCR API 在 PHP jQuery 或 JavaScript 中有详细
  • opencv 中的二值化和背景过滤

    不久 我想在OCR之前进行预处理程序 建议来自ABBYY的技术 http www abbyy developers eu en tech insideocr adaptive binarisation 文章分为两部分 Background
  • 通过 pytesseract 和 PIL 提高文本识别的准确性

    所以我试图从图像中提取文本 由于图像的质量和尺寸不好 因此给出的结果不准确 我尝试了一些 PIL 的增强功能和其他功能 但这只会恶化图像质量 有人可以建议对图像进行一些增强以获得更好的结果 一些图像示例 在提供的图像示例中 文本的视觉质量非
  • OCR 解决方案可以检测数字手写体吗?

    有没有一种解决方案可以很好地书写数字 1 10 我尝试了超正方体 但我只得到垃圾 理想情况下是 OSS 但商业也可以 OpenCV 现在附带手写数字识别 OCR 示例 你可以参考一下 http code opencv org project
  • tesseract 无法识别该图像中的这个单词,这正常吗?

    我需要从这样的小图像中提取单词 我在命令行中使用带有西班牙语选项的 tesseract 如下所示 tesseract category png l spa psm 7 category txt 我认为该文本一定很容易被 OCR 解析 但该单
  • 使用贝叶斯类进行数字识别

    我需要编写一个仅用于数字的 OCR 程序 我将使用 MNIST 数据集 问题是我不知道从哪里开始 有很多论文并没有真正解释算法 我对模式识别真的了解不多 所以我有几个问题 Q1 在哪里可以找到算法 或教程 Q2 如何对数字进行分类 我不需要
  • 提高识别率的图像预处理步骤

    我正在为我的项目使用 TessBaseAPI 制作一个简单的 OCR Android 应用程序 我已经完成了一些图像预处理步骤 例如二值化和图像增强 但他们的结果是50 到60 怎样才能提高识别率呢 我包括两个示例图像 http image
  • Python Tesseract 无法识别这种字体

    我有这个图像 我想使用 python 将其读取为字符串 我认为这并不难 我发现了 tesseract 然后是使用 tesseract 的 python 脚本的包装器 所以我开始阅读图像 效果很好 直到我尝试阅读这张图像 我是否需要训练它来读
  • pytesseract 错误 Windows 错误 [错误 2]

    您好 我正在尝试使用 python 库 pytesseract 从图像中提取文本 请查找代码 from PIL import Image from pytesseract import image to string print image
  • OCR 解析获取复选框或单选按钮值

    I need to parse OCR image file and get all texts and checkbox values How to get Checkbox or Radio Button value from OCR
  • OCR 扑克牌 [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我决定做一个有趣的项目 我想将扑克牌的图像作为输入并返回其等级和花色 我认为我只需要查看左上角 因为那里包含了所有信息 它应该是稳健的
  • 提高 pytesseract 从图像中正确识别文本的能力

    我正在尝试使用读取验证码pytesseract模块 大多数时候它都能提供准确的文本 但并非总是如此 这是读取图像 操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
  • Tesseract 是否会忽略扫描文档中的任何非文本区域?

    我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本 我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本 但它最终会给出误报匹配 理想情况下 您应该在将图像

随机推荐

  • 字符串转整形数据

    c 语言字符转化为数字的函数有 atof 将字符串转换为双精度浮点型值 atoi 将字符串转换为整型值 atol 将字符串转换为长整型值 strtod 将字符串转换为双精度浮点型值 并报告不能被转换的所有剩余数字 strtol 将字符串转换
  • 竞赛选题 卷积神经网络手写字符识别 - 深度学习

    文章目录 0 前言 1 简介 2 LeNet 5 模型的介绍 2 1 结构解析 2 2 C1层 2 3 S2层 S2层和C3层连接 2 4 F6与C5层 3 写数字识别算法模型的构建 3 1 输入层设计 3 2 激活函数的选取 3 3 卷积
  • 微信小程序api语法及代码实例(入门到精通)

    前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到网站 小程序Api App 全局入口 整个小程序项目中 只允许有一个App入口函数 全局数据 globalData 写在全局的js里 使用this
  • 设计模式之(三)---工厂方法模式

    女娲补天的故事大家都听过吧 这个故事是说 女娲在补了天后 下到凡间一看 哇塞 风景太优美了 天空是湛 蓝的 水是清澈的 空气是清新的 太美丽了 然后就待时间长了就有点寂寞了 没有动物 这些看的到 都是静态的东西呀 怎么办 别忘了是神仙呀 没
  • CTFSHOW web11-14

    目录 web11 web12 web13 web14 web11 其他不重要 直接看代码
  • c语言——矩阵运算器

    话不多说 上代码 include
  • 信号完整性之串扰

    1 前言 当PCB板上走线间距较近 一条走线上传输信号时 会在邻近的走线上引起噪声 这种现象称为串扰 串扰实际上是相邻走线之间的一种能量传递现象 下图显示了这种串扰现象 上方的走线传输信号 无论下方的走线是否有信号在传输 其两端都会产生噪声
  • MySQL避免索引失效

    create table staffs id int primary key auto increment name varchar 24 not null default comment 姓名 age int not null defau
  • 偶然发现的一篇相见很晚的文章:如何学好游戏编程

    今天偶然发现一篇介绍如何学好游戏编程的文章 相见恨晚呀 特转载 转帖地址 http new qzone qq com 79134054 blog 1226580538 如何学好游戏编程 此篇文章献给那些为了游戏编程不怕困难的热血青年 它的神
  • mac,macbook 连接蓝牙耳机播放音乐断断续续

    个人的情况是 mac本连的网线 用的无线鼠标 屋里80多号人都在用笔记本 应该也有好多开着无线的东西 解决方法 mac 或macbook 连接蓝牙耳机播放音乐断断续续的原因 在网上找了好多方法 试了各种方法 用各种命令 都完全没有效果 终于
  • VMware Workstation 17 pro 开机一段时间后,cpu飙高、卡死、、、

    报错截图 临时解决方案 找到VMware workstation 17 pro 安装包 右键 以管理员身份运行 修复 重启即可 永久解决 控制面板 程序 启用或关闭Windows功能 去掉 Windows 虚拟机监控程序平台 虚拟机平台 的
  • 《金融数据分析导论:基于R语言》习题答案(第一章)

    金融数据分析导论 基于R语言 是芝加哥大学的教授Ruey S Tsay所著 李洪成 尚秀芬 郝瑞丽翻译 机械工业出版社出版 是一本学习R语言和金融数据分析的很好的参考书籍 注 这些答案都是本人自己做出的结果 可能有错 仅供参考 发现有错的地
  • openstack用户管理笔记

    1 创建项目 1 1 创建项目 需要确认集群环境是否初始化完毕 实验初始化需要几分钟时间 访问控制节点IP dashboard 如果正常弹出登录页面即初始化完毕 假设控制节点IP为172 20 6 22 则访问地址为 172 20 6 22
  • ElasticStack运维必备技能-集群版

    一 背景介绍 首先 我们为什么要用这个产品呢 生产业务中必然会遇到大量业务日志需要分析 在日志量非常大的场景中 直接使用工具 如cat grep awk 就可以获得想要的信息 效率非常低 在这种情况下 如何快速搜索想要信息 如查询 排序 归
  • 车载操作系统汇总

    文章目录 车载操作系统 一 软件定义汽车 为什么是软件定义汽车 车载OS 承上启下 引领智能汽车发展 车载OS在车载智能计算平台中的位置 车载OS市场空间 车载操作系统 二 车控操作系统 什么是车控操作系统 车控操作系统的特点 车控操作系统
  • python3.6.5安装tensorflow_tensorflow(一)windows 10 python3.6安装tensorflow1.4与基本概念解读...

    一 安装 目前用了tensorflow deeplearning4j两个深度学习框架 tensorflow 之前一直支持到python 3 5 目前以更新到 故安装最新版体验使用 慢慢长征路 安装过程如下 anaconda3 5 PYTHO
  • vue跳转this.$router.push()同一路由如何强制刷新页面

    1 新建一个名为refresh vue的文件 放在你认为合理的任意目录 2 在refresh vue里添加 beforeRouteEnter 路由钩子 代码块 代码如下
  • Unity经典项目及作品

    1 Unity Chan Toon Shader https github com unity3d jp UnityChanToonShaderVer2 Project 2 Procedural Cave Generator https g
  • Tensorflow--------tf.nn库

    1 tf nn 提供神经网络相关操作 包括卷积神经 conv 池化操作 pooling 归一化 loss 分类操作 embedding RNN Evaluation 2 tf layers 高层的神经网络 和卷积神经有关 3 tf cont
  • 4 Tesseract-ocr 系列 : 开源OCR比较

    对开源OCR做一个简单的调研 网上找到的关于OCR的一些资料 国内参考资料 最好的开源或开放API的ocr引擎是什么 https www zhihu com question 22417946 列举了4中OCR 目录 1 Tesseract