我正在尝试改进我制作的 OCR 程序来读取我正在使用的某个图像的布局。现在,我希望我的 OCR 程序只能识别数字 0-9。
我尝试遵循问题的解决方案:
限制 tesseract 正在寻找的字符 https://stackoverflow.com/questions/2363490/limit-characters-tesseract-is-looking-for
但我陷入了必须将 tesseract 称为以下部分:
tesseract input.tif output nobatch letters
这是哪里?
我在使用 python 和 tesseract 3 时遇到了同样的问题
假设更多的读者可能会这样做。
从这里 :https://github.com/tesseract-ocr/tesseract/wiki/FAQ#how-do-i-recognize-only-digits https://github.com/tesseract-ocr/tesseract/wiki/FAQ#how-do-i-recognize-only-digits
和这里:https://github.com/madmaze/pytesseract/blob/27fed535bf1eb665ec991313841b177336b50f61/src/pytesseract.py#L91 https://github.com/madmaze/pytesseract/blob/27fed535bf1eb665ec991313841b177336b50f61/src/pytesseract.py#L91
我成功使用:
pytesseract.image_to_string(someimage, config='输出基数')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)