python 图片文字提取

2023-05-16

转载:python怎么读取png(python 图像处理)-天道酬勤-花开半夏

图像处理不是一件简单的工作。 对你来说,一看到某样东西,马上就知道你在看什么很容易。 但是,电脑不是这样工作的。

对你来说太难的任务,比如复杂的算术,或者一般意义上的数学,计算机都能顺利完成。 但在这里,相反——对你来说是个微不足道的任务。 例如,识别图像中的猫和狗对计算机来说真的很难。 从某种意义上说,我们是设在天造地设的一对。 至少现在是这样。

虽然图像分类和一定程度的计算机视觉相关任务可能需要大量代码和扎实的理解,但从格式良好的图像中读取文本在Python上很简单,可以适用于很多现实生活问题。

在今天的投稿中,我想证明那个。 安装一些库,但不需要很多时间。 这些是你需要的库:

OpenCVPyTesseract

OpenCV

目前,此库仅用于加载映像。 实际上,不需要事先了解太多(也许有用,但让我们看看为什么)。

根据官方文件:

OpenCV (开源计算机视觉库)是一个开源的计算机视觉机器学习软件库。 OpenCV的目的是为计算机视觉APP提供通用的基础设施,加速机器识别在商业产品上的使用。 OpenCV是bsd许可的产品,通过OpenCV,企业可以简单地使用和更改代码

简单来说,可以使用OpenCV进行所有类型的图像转换。 这是一个相当简单的库。

如果还没有安装,那只是终端中的一行。

pip install opencv-python差不多就是这样。 在那之前,一切都很简单,但这种情况很快就会改变。

PyTesseract

这个库到底是什么? 根据维基百科:

Tesseract是用于各种操作系统的光学字符识别引擎。 这是一个免费软件,基于Apache许可2.0版发布,自2006年以来由谷歌赞助开发。

确实,现在有更复杂的库,但是我发现这个库运行得很好。 根据我自己的经验,这个库应该可以从任何图像中读取文本,但是前提是字体不能让你读取。

如果无法从您的图像中读取字符,请使用OpenCV应用各种过滤器将文本转换为twdg。

现在安装在底部有点麻烦。 如果使用的是Linux,则所有命令都将合并为几个sudo-apt get命令。

获取更新

sudo apt-getinstalltesseract-ocr

sdoapt-getinstalllibtesseract-dev我在使用Windows系统,所以这个过程有点无聊。

首先,打开此URL 3:3359 github.com/u B-mannheim/tessera CT/wiki以下载32位或64位安装程序3360

安装本身很简单,只需点击几次Next即可。 是的,还需要pip安装:

接下来,pip安装模板必须告诉Python Tesseract安装在哪里。 在Linux计算机上不需要这样做,但在Windows上需要。 缺省情况下,将安装程序文件。

如果做得正确,执行这些代码应该不会发生错误:

获取文本

从简单的开始吧。 我找到了免版税的照片。 里面有文字。 第一个是这样的:

那个应该很简单。 Tesseract可能会读蓝色的“对象”作为括号。 让我们看看会发生什么,

我的推测是正确的。 但是,这不是问题。 使用Python的技巧可以很容易地解决。

下一个可能更麻烦:

希望不要检测硬币的“B”:

好像有效果。

现在轮到你把它应用于自己的问题了。 如果文本和背景混合存在,OpenCV技能在这里可能很重要。

在你离开之前

计算机来说,从图像中读取文本是相当困难的工作。 请考虑一下。 电脑不知道文字是什么。 只对数字有效。 引擎盖后面发生的事情一开始可能看起来像个黑匣子,但如果这是你感兴趣的领域,我建议你多做研究。

虽然并不是每次PyTesseract都能正常工作,但是我发现即使是复杂的图像也可以正常工作。 但是,并非所有情况都好,有时需要对背景更加强调文本twdg的图像处理。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python 图片文字提取 的相关文章

随机推荐

  • iOS关于搜索不规则瀑布流布局的实现小结

    最近在项目开发中遇到了不规则搜索布局的问题 之前常用的解决方案是用一个tableview用一个循环动态的加载 xff0c 唯一的缺点是需要动态的移除 xff0c 其实也已经足够 ios搜索历史记录不规则布局 IOS代码类资源 CSDN下载
  • WORD论文撰写中的必备技巧-公式与排版

    word撰写科技论文时 xff0c 经常会遇到下列问题 xff1a xff08 1 xff09 公式大小与文字不匹配 xff1b xff08 2 xff09 公式对齐问题 xff1b xff08 3 xff09 公式编辑的字符在段落中如何与
  • AirSim(五)---理解篇: Airsim世界坐标系、NED坐标系、机体坐标系以及控制相关API接口函数

    目录 1 坐标系 coordinate system 1 AirSim API的坐标系 xff1a NED 坐标系 with SI unit 2 Unreal Engine的坐标系 xff08 3 xff09 AirSim全局坐标系 61
  • 【部署】外网访问家庭计算机( 内网穿透)

    场景 很多时候需要通过远程访问来进行跨网络跨机器 大部分的场景是访问公司机器 这种一般比较容易实现 xff0c 因为公司都是固定ip xff0c 或者有vpn服务等等 实在不行也可以有teamviewer xff0c anydesk xff
  • 使用wxWidgets开发跨平台的GUI程序

    使用wxWidgets开发跨平台的GUI程序 Taii 回家念经 2006 05 20 1 探索背景 xff1a 1 1 引言 从开始使用c c 43 43 编码起算来也快有5年了 xff0c 期间完成了无数项目 xff0c 编写了无数程序
  • R-4.0.2 forecast预测

    library 34 forecast 34 skirts lt scan 34 http robjhyndman com tsdldata roberts skirts dat 34 skip 61 5 skirtsts lt ts sk
  • Linux远程连接图形界面的几种方法

    1 xff0c 利用Xmanager xff0c linux启用XDMCP协议 xff08 可直接修改配置文件 xff0c 也可以采用在Xshell中运行gdmconfig或gdmsetup xff0c 选择XDMCP选项卡 xff0c 勾
  • 什么是视图?作用是什么?

    1 1 视图 1 1 1 什么是视图 视图 VIEW 也被称作虚表 xff0c 即虚拟的表 xff0c 是一组数据的逻辑表示 其本质是对应于一条SELECT语句 xff0c 结果集被赋予一个名字 xff0c 即视图名字 视图本身并不包含任何
  • Python元组(tuple)详解

    目录 一 元组的基本概念 xff1a 二 元组的特点 xff1a 1 声明方式 2 访问方式 xff1a 3 元组中元素的修改 xff1a 三 xff0c 对元组的操作 1 元组的切片 xff1a 2 元组的拼接 xff1a 3 元组与数字
  • 解决debian下thinkpad x1没有声音的问题

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 问题描述 一 解决方法 二 解决步骤 1 使用non free源 2 更改参数 3 更新源信息 4 安装以下驱动包 5 重启 问题描述 安装完debian 11后
  • windows环境变量配置你知道吗?

    1 什么是windows环境变量 xff1f 我们直接看百度的专业解释 环境变量 xff08 environment variables xff09 一般是指在操作系统中用来指定操作系统运行环境的一些参数 xff0c 如 xff1a 临时文
  • C# 远程RDP共享桌面,控制桌面,远程桌面登录注销,用户切换,包括客户端,服务端软件及代码

    可以一次打开16个桌面 可以支持登录切换用户 包含客户端NoteWin exe WINDOWS服务NoteWinService exe xff0c 当前用户服务NoteWService exe xff0c 远程启动服务AppLoad exe
  • 树莓派3B+ 网页控制GPIO(WebIOPi)

    树莓派3B 43 网页控制GPIO xff08 WebIOPi xff09 对于没接触编程的小白来说 xff0c 让他们编程控制树莓派的GPIO口输出输入 xff0c 那简直就是折磨人 xff0c WebOPi就是一个开源 方便 实用的网页
  • 解决Win10 自动更新问题(可以认为永久关闭更新)

    解决Win10 自动更新问题 xff08 可以认为永久关闭更新 xff09 这是我意外想到的一个方法 xff0c 步骤十分简单 xff0c 什么都不用设置 xff0c 不过每隔35天就要操作一下 xff0c 因为win10最多临时暂停35天
  • * failed to start daemon *解决方法

    16 11 23 error could not install smartsocket listener cannot bind to 127 0 0 1 5037 通常每个套接字地址 协议 网络地址 端口 只允许使用一次 10048 1
  • 【工具】验证是否安装cuda和cuDNN

    验证是否安装cuda 验证cuda是否安装方法1 span class token keyword import span torch span class token keyword print span span class token
  • 常用的url链接

    maven库 xff1a https mvnrepository com 一些基本工具的安装和语法 xff0c 如mysql docker https www runoob com docker centos docker install
  • 达梦7数据库后台导入导出命令解释

    达梦7使用的dexp和dimp xff0c 用法和exp和imp类似 xff0c 在命令后直接加上help可以查看帮助 吐槽一下竟然没有 dexp dimp help或 xff1f 这种操作 xff0c 必须是help才可以识别 格式 de
  • 麒麟V10修改root密码

    不知为何 xff0c root密码登录不上去 xff0c 几番测试都说是密码错误 基本环境 xff1a 国产服务器和麒麟V10 人不在机房 步骤如下 xff1a 1 连接服务器 xff0c 打开带外界面 2 打开控制台界面 3 重启电脑 x
  • python 图片文字提取

    转载 xff1a python怎么读取png python 图像处理 天道酬勤 花开半夏 图像处理不是一件简单的工作 对你来说 xff0c 一看到某样东西 xff0c 马上就知道你在看什么很容易 但是 xff0c 电脑不是这样工作的 对你来