我已经在终点字体上训练了 tesseract,但无论如何,我都无法让它识别 0。我正在使用 jTessEditor 创建训练 tif 和框。即使在验证时,它也会将所有 0 读取为 8。我有什么遗漏的吗?
下面是 0 的示例,它将其读作 8:
我使用以下参数:
--psm 10 -c tessedit_char_whitelist=0123456789# --oem 3 -l terminus
EasyOCR 是轻量级模型,为收据或 PDF 转换提供了良好的性能。它通过 pdf 文件、收据、账单等有组织的文本提供更准确的结果。 EasyOCR 在噪声图像上也表现良好,并且比 pytesseract 更好地识别数字。
code:
!pip install easyocr
import easyocr
import cv2
#Initialzing the ocr
img = cv2.imread("image path")
text_reader = easyocr.Reader(['en']) #Initialzing the ocr
results = text_reader.readtext(img)
for (bbox, text, prob) in results:
print(text)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)