Tesseract-OCR下载和安装

2023-10-28

Y26


  Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。


1、下载安装包
分享链接:https://pan.baidu.com/s/1OMOu2fwic22kH-q7zDXeUQ
提取码:sukc


2、打开安装,需要选择的选项,看下图。其中语言要选择简体中文,安装时会下载语言包,可能等待一段时间。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


3、若需要下载识别其他语言的字符,可进入官网直接下载对应语言包,下载完成后放到Tesseract-OCR\tessdata\tessconfigs下即可。


4、设置环境变量,进入环境变量中,找path,新建路径。如图
在这里插入图片描述


5、查看是否安装成功,打开cmd,输入tesseract4 -v回车,若显示版本号即为安装成功。如图:
在这里插入图片描述


6、若使用python操作,需要打开cmd管理员模式,下载pytesseract模块,进行图片文字识别功能,如图:
在这里插入图片描述

7、关闭pycharm,重启即可使用。

个人小结,定有不足,欢迎指点。
谢谢~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Tesseract-OCR下载和安装 的相关文章

  • 关于UE4 vs2017 SpawnActor编译通过,调试运行崩溃的问题

    在制作VR模式代码编写的时候 使用一些API采用UWorld SpawnActor的时候出现代码编译编译通过无报错 但是调试运行失败的原因 找了很久才找到原因 原来是构造器的问题 就是把SpawnActor放到到BeginPlay 中 不能
  • oracle全文索引之commit与DML操作

    我们知道 无论对多大的数据做DML操作 执行commit都可以很快完成 但如何删除建有全文索引的记录 在commit时可能会很慢 根据推断可以知道是由于域索引造成的 那么在有域索引的情况下 commit时 oracle还做了那些额外工作呢

随机推荐