python实现批量提取图片中文字的小工具

2023-05-16

要实现批量提取图片中的文字，我们可以使用Python的pytesseract和Pillow库。pytesseract是一个OCR（Optical Character Recognition，光学字符识别）引擎，可以将图片中的文字转换为文本字符串。Pillow是一个Python Imaging Library（PIL），可以用来打开、处理和保存图像文件。

下面是一个使用这些库实现的简单脚本示例：

import os
from PIL import Image
import pytesseract

Set up paths and options

input_folder = "input"
output_folder = "output"
lang = "eng"  # Language of the text in the images

Create output folder if it does not exist

if not os.path.exists(output_folder):
    os.makedirs(output_folder)

Loop through all images in the input folder

for filename in os.listdir(input_folder):
    # Check if file is an image
    if filename.endswith((".png", ".jpg", ".jpeg", ".gif")):
        # Open the image with Pillow
        image_path = os.path.join(input_folder, filename)
        image = Image.open(image_path)

        # Convert image to grayscale (to improve OCR accuracy)
        gray_image = image.convert("L")

        # Use pytesseract to extract the text from the image
        text = pytesseract.image_to_string(gray_image, lang=lang)

        # Save the extracted text to a file in the output folder
        text_filename = os.path.splitext(filename)[0] + ".txt"
        text_path = os.path.join(output_folder, text_filename)
        with open(text_path, "w") as text_file:
            text_file.write(text)
            
        # Print progress message
        print(f"Extracted text from {filename} and saved to {text_filename}.")

在这个程序中，我们首先设置了输入文件夹、输出文件夹和语言选项。然后，我们检查输入文件夹中的每个文件，只对图像文件进行处理。对于每个图像文件，我们使用Pillow库打开它，并将其转换为灰度图像以提高OCR准确性。接下来，我们使用pytesseract库提取图像中的文本，并将其保存到与原始图像同名的文本文件中。最后，我们打印出进度消息，指示我们已经从哪张图片中提取了文本并将其保存到哪个文本文件中。

当脚本执行完毕后，生成的文本文件将放置在“output”文件夹中，并与相应的输入图像文件具有相同的名称（但扩展名不同）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python实现批量提取图片中文字的小工具的相关文章

计算结构体的字节数

结构体中的成员可以是不同的数据类型 xff0c 成员按照定义时的顺序依次存储在连续的内存空间和数组不一样的是 xff0c 结构体的大小不是所有成员大小简单的相加 xff0c 需要考虑到系统在存储结构体变量时的地址对齐问题看下面这样的一个
轻松搞定面试中的二叉树题目

版权所有 xff0c 转载请注明出处 xff0c 谢谢 xff01 http blog csdn net walkinginthewind article details 7518888 树是一种比较重要的数据结构 xff0c 尤其是二叉树
使用Anaconda Navigator无法成功创建虚拟环境问题的解决方案

1 问题描述使用anaconda Navigator创建虚拟环境时 xff0c 配置初始名称以及python版本 xff0c Fetching各种包成功后 xff0c 开始loading各种包的过程中闪过cmd黑色窗口 xff0c 然后左
QT 后台处理时间过长主界面卡死解决办法

之前用WPF开发 xff0c 处理逻辑就是1 xff0c 处理前显示等待窗口 xff0c 2 同步处理改未异步 xff0c 3 处理完毕后关闭等待窗口 Qt应该也是类似的处理逻辑 xff1a 一创建等待处理窗口 xff08 采用了QMoi
一圈n个人，1-3循环报数，报道3的退出，最后剩下的是几号

import java util ArrayList import java util List import java util Scanner public class CirCle public static void main St
GCD【洛谷P2568】(小左的GCD)

题目描述给定整数N xff0c 求1 lt 61 x y lt 61 N且Gcd x y 为素数的数对 x y 有多少对输入格式一个整数N 输出格式答案输入输出样例输入 1 复制 4 输出 1 复制 4 说明提示对于样例 2
C++中的weak_ptr深入解析

引言在C 43 43 的智能指针家族中 xff0c weak ptr是一种非常实用且独特的成员它主要用于解决循环引用问题 xff0c 从而避免内存泄漏在本文中 xff0c 我们将详细讨论weak ptr的基本概念功能和应用场景 xf
【Redis】解决WARNING overcommit_memory is set to 0 Background save may fail under low memory condition.

问题说明不管是linux直装 xff0c 还是在docker环境中 xff0c 启动redis时 xff0c 报如下错误 WARNING overcommit memory is set to 0 Background save may
运动跟踪算法CMT（续）之层次凝聚聚类算法（HAC）

熟悉CMT的都知道 xff0c 作者在聚类部分使用了层次凝聚聚类算法 xff08 Hierarchical Agglomerative Clustering xff09 并且使用的是单链 xff08 Single link xff09 xf
使用mysql8.x版本设置远程连接

主要步骤 xff0c 注意 xff1a 自mysql8 x版本 xff0c 密码的加密方式改为caching sha2 password 登录mysql账号修改root用户登录地址修改root用户密码加密方式 usr local mysql
jenkins基础配置之四：读取本地文件

需要安装的插件 Extended Choice Parameter Plug span class token operator span In span class token operator span External Monitor
初识Btrfs文件系统

Btrfs 也有一个重要的缺点 xff0c 当 BTree 中某个节点出现错误时 xff0c 文件系统将失去该节点之下的所有的文件信息而 ext2 3 却避免了这种被称为错误扩散的问题 Btrfs相关介绍 xff1a Btrfs 是一
服务器使用笔记本网络连接外网

由于服务器经常部署在机房 xff0c 并没有外网 xff0c 连不上外网需要使用自己笔记本的网络供服务器使用笔记本连接手机热点 xff0c 再分享给服务器一首先 xff0c 需要把服务器和笔记本连接到同一网络内 xff0c 可以选择
grafana接入openldap认证

首先两个文件开启ldap的支持文件1 xff1a etc grafana grafana ini auth ldap enabled 61 true config file 61 etc grafana ldap toml allow s
Wireshark的常见提示

概述本文主要介绍Wireshark中出现的一些常见提示详细信息 Wireshark简介 Gerald Combs是堪萨斯城密苏里大学计算机科学专业的毕业生 1998年发布了第一版Ethereal工具 xff0c Ethereal工具使用
shell报错bad substitution 解决办法

bin bash a 61 34 hello 34 b 61 34 hi is a 34 echo b echo a echo a echo a 1 2 执行脚本方式不同出现的结果不同 xff1a 方式1 xff1a sh shell sh
centos8软件安装dnf命令

DNF是新一代的rpm软件包管理器它首先出现在 Fedora 18 这个发行版中而目前 xff0c 它取代了yum xff0c 正式成为从 Fedora 22 起 Fedora 版本的包管理器 DNF包管理器克服了YUM包管理器的一些瓶
多目标规则在 Makefile 中的应用与示例

在 Makefile 中 xff0c 如果一个规则有多个目标 xff0c 而且它们之间用空格分隔 xff0c 我们称之为 34 多目标规则 34 这意味着这个规则适用于列出的所有目标在目标下面的命令是 C 64 xff0c 它通常与 ma
计算机中内存、cache和寄存器之间的关系及区别

1 寄存器是中央处理器内的组成部份寄存器是有限存贮容量的高速存贮部件 xff0c 它们可用来暂存指令数据和位址在中央处理器的控制部件中 xff0c 包含的寄存器有指令寄存器 IR 和程序计数器 PC 在中央处理器的算术及逻辑部件中 x
dell 台式电脑设置每天定时开机和关机

每天定时开机设置 xff1a 戴尔电脑通过CMOS设置实现自动开机的设置过程如下 xff1a 1 首先进入 CMOS SETUP 程序大多数主板是在计算机启动时按DEL或F2键进入 xff1b 2 然后将光条移到 Power Manage

随机推荐

windows批处理自动获取电脑配置信息

39 2 gt nul 3 gt nul amp cls amp 64 echo off 39 amp rem 获取本机系统及硬件配置信息 39 amp set 61 Any question amp set 64 61 WX amp se
Centos7搭建cisco ocserv

一安装的部分直接yum安装即可 yum y install ocserv 二配置文件根据实际情况调整 auth方式有两种 1 系统账号认证配置的话就是 xff1a auth 61 34 pam 34 2 本地文件认证配置的话就是 x
私有harbor部署(docker方式)

环境准备 docker compose v Docker Compose version v2 14 2 wget https github com docker compose releases download v2 14 2 dock
ORACLE扩展表空间

一查询表空间使用情况 SELECT UPPER F TABLESPACE NAME 34 表空间名 34 D TOT GROOTTE MB 34 表空间大小 M 34 D TOT GROOTTE MB F TOTAL BYTES 34 已
Oracle 常用性能监控SQL语句

1 查看表锁 SELECT FROM SYS V SQLAREA WHERE DISK READS gt 100 2 监控事例的等待 SELECT EVENT SUM DECODE WAIT TIME 0 0 1 34 Prev 34 SU
Nginx出现“ 413 （499 502 404） Request Entity Too Large”错误解决方法

1 Nginx413错误的排查修改上传文件大小限制在使用上传POST一段数据时 xff0c 被提示413 Request Entity Too Large xff0c 应该是nginx限制了上传数据的大小解决方法就是打开nginx主
查看弹出广告来自哪个软件

打开VS的Spy 43 43 将指针移到广告处 xff0c 然后点OK xff0c 在Process标签页可以看到进程id和线程id将获得的16进制进程id xff08 例如 xff1a 000025F8 xff09 通过计算器转成10进制
C++多态虚函数实现原理，对象和虚函数表的内存布局

基本概念我们知道C 43 43 动态多态是用虚函数实现的 xff0c 而虚函数的实现方式虽说C 43 43 标准没有要求 xff0c 但是基本都是用虚函数表实现的 xff08 编译器决定 xff09 所以我们有必要了解一下虚函数表的实现原
C++ STL中递归锁与普通锁的区别

在多线程编程中 xff0c 保护共享资源的访问很重要 xff0c 为了实现这个目标 xff0c C 43 43 标准库 xff08 STL xff09 中提供了多种锁 xff0c 如std mutex和std recursive mutex
VS+Qt开发环境

VS Qt下载 VS下载 xff1a https visualstudio microsoft com zh hans vs Qt下载安装 xff1a https www bilibili com video BV1gx4y1M7cM VS
windows下使用ShiftMediaProject编译调试FFmpeg

为什么要编译FFmpeg xff1f 定制模块调试源码 windows下编译推荐项目ShiftMediaProject FFmpeg 平时总是看到一些人说windows下编译FFmpeg很麻烦 xff0c 这时候我就都是微微一笑 xff0
RTSP分析

RTSP使用TCP来发送控制命令 xff08 OPTIONS DESCRIBE SETUP PLAY xff09 xff0c 因为TCP提供可靠有序的数据传输 xff0c 而且TCP还提供错误检测和纠正 RTSP的报文格式可以参考HTTP的
RTP分析

参考 RTP xff08 A Transport Protocol for Real Time Applications 实时传输协议 xff0c rfc3550 xff09 RTP Payload Format for H 264 Vid
VS链接器工具错误 LNK2019：无法解析的外部符号

常见的问题以下是一些导致 LNK2019 的常见问题 xff1a 未链接的对象文件或包含符号定义的库在 Visual Studio 中 xff0c 验证包含定义源代码文件是生成 xff0c 分别链接为项目的一部分在命令行中 xff0c
FFmpeg合并视频流与音频流

mux h ifndef MUX H define MUX H ifdef cplusplus extern 34 C 34 endif include 34 common h 34 include 34 encode h 34 typed
解决电脑同时使用有线网上内网，无线网上外网的冲突

由于内网有网络限制 xff08 限制娱乐等 xff09 xff0c 所以肯定要用外网 xff08 无线网卡 xff09 但是有的网站只能用内网访问 xff0c 比如gitlab xff0c oa等我电脑刚开始连接了wifi后上不了gitl
Python斗鱼直播间自动发弹幕脚本

工具 xff1a Python xff0c Chrome浏览器因为不会用短信验证码登录 xff0c 所以使用QQ帐号登录 xff0c 必须要斗鱼帐号绑定QQ号难点主要是帧的切换查找元素可以通过chrome浏览器鼠标指向该元素 xff0
Qt+FFmpeg录屏录音

欢迎加QQ群309798848交流C C 43 43 linux Qt 音视频 OpenCV 源码 xff1a Qt 43 FFmpeg录屏录音 NanaRecorder 之前的录屏项目ScreenCapture存在音视频同步问题 xff0
Qt源码分析（一）

欢迎加QQ群309798848交流C C 43 43 linux Qt 音视频 OpenCV 源码面前 xff0c 了无秘密阅读源码能帮助我们理解实现原理 xff0c 然后更灵活的运用接下来我用VS2015调试Qt5 9源码首先提一下
python实现批量提取图片中文字的小工具

要实现批量提取图片中的文字 xff0c 我们可以使用Python的pytesseract和Pillow库 pytesseract是一个OCR xff08 Optical Character Recognition xff0c 光学字符识别

热门标签