我对 OCR 识别和 Python 都有点陌生。
我想要实现的是从 Python 脚本运行 Tesseract 以“识别”.tif 中的某些特定数字。
我以为我可以为 Tesseract 做一些培训,但我在 Google 和 SO 上没有找到任何类似的主题。
基本上我有一些包含多个图像(如“箭头”、“花”和其他图标)的 .tif,并且我希望脚本打印该图标的名称作为输出。如果找到箭头,则打印“arrow”。
可行吗?
这绝不是一个完整的答案,但如果 tif 中有多个图像并且您提前知道大小,则可以在对图像样本进行分类之前对其进行标准化。您可以将图像切割成 tif 中所有可能的矩形。
因此,当您创建分类器时(我在这里不提及方法),最终结果将综合对所有较小的矩形进行分类。
因此,如果给定一个 tif ,“箭头”或“花”图像为 16px x 16px ,比如说,您可以使用Python PIL http://www.pythonware.com/products/pil/创建样本。
from PIL import Image
image_samples = []
im = Image.open("input.tif")
sample_dimensions = (16,16)
for box in get_all_corner_combinations(im, sample_dimensions):
image_samples.append(im.crop(box))
classifier = YourClassifier()
classifications = []
for sample in image_samples:
classifications.append (classifier (sample))
label = fuse_classifications (classifications)
再说一次,我没有谈论实际写作的学习步骤YourClassifier
。但希望这有助于解决部分问题。
关于学习图像分类以及在分类之前清除图像中的噪声这一主题有很多研究。
考虑浏览这个现有 Python 机器学习库的精彩集合。
http://scipy-lectures.github.com/advanced/scikit-learn/index.html http://scipy-lectures.github.com/advanced/scikit-learn/index.html
还有许多与图像相关的技术。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)