用Python识别图像

2024-05-08

我对 OCR 识别和 Python 都有点陌生。

我想要实现的是从 Python 脚本运行 Tesseract 以“识别”.tif 中的某些特定数字。

我以为我可以为 Tesseract 做一些培训，但我在 Google 和 SO 上没有找到任何类似的主题。

基本上我有一些包含多个图像（如“箭头”、“花”和其他图标）的 .tif，并且我希望脚本打印该图标的名称作为输出。如果找到箭头，则打印“arrow”。

可行吗？

这绝不是一个完整的答案，但如果 tif 中有多个图像并且您提前知道大小，则可以在对图像样本进行分类之前对其进行标准化。您可以将图像切割成 tif 中所有可能的矩形。

因此，当您创建分类器时（我在这里不提及方法），最终结果将综合对所有较小的矩形进行分类。

因此，如果给定一个 tif ，“箭头”或“花”图像为 16px x 16px ，比如说，您可以使用Python PIL http://www.pythonware.com/products/pil/创建样本。

from PIL import Image

image_samples = []

im = Image.open("input.tif")
sample_dimensions = (16,16)

for box in get_all_corner_combinations(im, sample_dimensions):

    image_samples.append(im.crop(box))


classifier = YourClassifier()

classifications = []

for sample in image_samples:
    classifications.append (classifier (sample))

label = fuse_classifications (classifications)

再说一次，我没有谈论实际写作的学习步骤YourClassifier。但希望这有助于解决部分问题。

关于学习图像分类以及在分类之前清除图像中的噪声这一主题有很多研究。

考虑浏览这个现有 Python 机器学习库的精彩集合。

http://scipy-lectures.github.com/advanced/scikit-learn/index.html http://scipy-lectures.github.com/advanced/scikit-learn/index.html

还有许多与图像相关的技术。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

image

imageprocessing

OCR

用Python识别图像的相关文章

如果 Excel 文件是由程序创建的，Pandas read_excel 对于具有简单公式的单元格返回 nan [重复]

这个问题在这里已经有答案了 I use pd read excel读取由以下命令创建的 excel 文件openpyxl并从一个网址下载解析后的数据框将给出nan如果单元格值是公式 which formula is simply 100
Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
下载后从谷歌照片库检索图像

我正在发起从图库中获取照片的意图当我在图库中使用 Nexus 谷歌照片应用程序时一切正常但如果图像不在手机上在 Google Photos 在线服务上它会为我下载选择图像后我将图像发送到另一个活动进行裁剪但在下载的情况下发
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

从 url 加载图像并绘制到 HTML5 Canvas

我在从 javascript 中的 url 加载图像时遇到问题下面的代码可以工作但我不想从 html 加载图像我想使用纯 JavaScript 从 url 加载图像 var c document getElementById myCa
致命错误：未捕获错误：调用未定义的函数curl_version() - Localhost Dev

我正在尝试将 stripe 集成到我的 PHP 项目中但在 localhost 上出现此错误 Fatal error Uncaught Error Call to undefined function curl version in 我正
使用 PyDrive 将图像上传到 Google Drive

我有一个关于 PyDrive 的愚蠢问题我尝试使用 FastAPI 制作一个 REST API 它将使用 PyDrive 将图像上传到 Google Drive 这是我的代码 from fastapi import FastAPI Fil
将脚本 Jquery 转换为 Javascript

我需要将以下 jquery 脚本转换为 javascript
将输入字段中的逗号替换为点

欧洲国家在输入十进制数字时使用逗号而不是点所以我想在用户输入时用逗号替换点号我知道 input number 可以做到这一点但我需要对 IE 的支持我想指令是最好的选择我用下面的代码尝试了一下但它失败了 directive r
在 Restangular 中发送 GET 参数

我在用着矩形 https github com mgonto restangular在我的项目和早期的项目中这段代码对于检索对象数组效果很好 var params name Stack surname Overflow var servi
添加零时奇怪的 numpy.sum 行为

我了解数学上等效的算术运算如何因数值错误而导致不同的结果例如以不同的顺序对浮点数求和然而令我惊讶的是添加零sum可以改变结果我认为无论如何这始终适用于浮动 x 0 x 这是一个例子我预计所有的线都恰好为零有人可以解释为什么会
关闭时不会调用 SetConsoleCtrlHandler

我编写了一个在控制台中运行的应用程序需要在系统关闭或用户注销之前进行快速备份我的测试应用程序编写一个带有信号的文件并在手动关闭控制台窗口单击 X 时工作但当控制台在关机或注销时关闭时它不起作用从我在 MSDN 上读到的内容来看
Flask：AttributeError：'UnboundField'对象没有属性'__call__'？

为什么我会收到此错误什么是 UnboundField 我需要了解什么才能在将来修复和避免此问题当我访问时调试输出http 127 0 0 1 5000 signup http 127 0 0 1 5000 signup Attribut
如何使用 R vctrs 包构建一个可以与 c() 结合的对象

我试图了解如何用向量构建对象我认为这很简单但是当我在我的对象上使用 c 时遇到了麻烦我们的对象有两个属性 x 和描述符在本例中都是字符串我的对象将具有不同类型的属性我们构建了一个构造函数 new toy vector 我还没有在
当一个模块安装了两个版本时 Perl 会做什么？

我在正在使用的远程机器上没有 root 访问权限因此我使用 cpanm 和 local lib 的组合如下所述here https stackoverflow com a 2980715 1156644将 CPAN 模块安装到我的本地目
提交表单时 ng-required 不起作用

我在带有 required 属性的输入文本框中包含以下代码但是当我跳出该字段或提交表单时它不会阻止表单提交并通知用户该字段是必填字段 div class col sm 8 div
Node.js 子进程

我试图弄清楚这对于 node js 子进程来说是否是一个不错的用例我有一款多人游戏人们可以进行 1v1 比赛我应该为每场比赛使用子进程吗并不是真的需要由于节点是基于事件的并且单个进程将能够处理数千个这样的玩家对您将为每个这样的
从什么时候起sqlite的持久日志模式成为Android中的默认日志模式？

从什么时候起sqlite的持久日志模式成为Android中的默认日志模式我知道Android版本4 1 1 API 16 中的日志模式已经改变但这并不准确因为发行说明中不包含此信息我不知道是否可以在发行说明中找到如果您认识的人确切
使用jmeter测试多个网站

如何使用jmeter测试100个不同的网站来自DMOZ 我认为可以通过将jmeter与脚本集成来完成基本上该脚本是告诉 jmeter 从文本或 csv 文件中读取 URL 并将 http 请求采样器更改为文件中的 URL 以运行测试
使用 VBA 清除 Excel 单元格格式而不清除 NumberFormat

是否可以在不改变的情况下清除Excel单元格格式和内容使用VBA NumberFormat 给定的单元格我尝试过 ClearContents ClearFormats 但 ClearFormats 删除了数字格式细胞也请建议你可以
前置条件失败：从 iOS 13.4 开始，在 SwiftUI 中使用 GeometryReader 时输入索引无效

昨天我将 XCode 和我的项目升级到 iOS 13 4 我开始在使用 GeometryReaders 的视图周围看到很多失败除了前提条件失败输入索引无效之外该错误没有显示任何内容升级到 13 4 1 后我遇到了完全相同的问题
使用 javascript onchange 下拉菜单

我有一个简单的下拉菜单我希望拥有它以便如果用户选择有一个婴儿则消息会更改为有一个婴儿但对于任何其他选择该消息保持不变什么也没有但这不起作用有人可以帮忙吗请玩我的jsfiddle http jsfiddle net Z9
当 ToString() 具有协作对象时，为什么 WPF 数据绑定不显示文本？

在一个简单的形式中我绑定到许多不同的对象有些放在列表框中有些放在列表框中有些放在列表框中一些在文本块中其中一些对象具有协作对象在这些对象上ToString 方法在执行其工作时调用通常是某种格式化程序当我单步执行代码时我发
用Python识别图像

我对 OCR 识别和 Python 都有点陌生我想要实现的是从 Python 脚本运行 Tesseract 以识别 tif 中的某些特定数字我以为我可以为 Tesseract 做一些培训但我在 Google 和 SO 上没有找到任何

用Python识别图像

用Python识别图像 的相关文章

随机推荐

热门标签

用Python识别图像的相关文章