我的代码很简单,如下所示:
import pytesseract
from PIL import Image
img = Image.open('C:/temp/foo.jpg')
img.load()
i = pytesseract.image_to_string(img)
我得到的错误响应是:
Traceback (most recent call last):
File "img.py", line 6, in <module>
i = pytesseract.image_to_string(img)
File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 161, in image_to
_string
File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 94, in run_tesse
ract
File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 710, in __init__
errread, errwrite)
File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 958, in _execute_child
startupinfo)
WindowsError: [Error 2] The system cannot find the file specified
任何指导都会很棒。
将 tesseract 添加到我的路径变量有帮助:C:\Program Files (x86)\Tesseract-OCR
但现在,当尝试运行 pytesseract 片段时,代码会崩溃。
只是遇到了同样的错误并决定回答这个问题 - 它可能会帮助某人节省时间......
首先,确保你有安装/复制 Tesseract-OCR 可执行文件 https://github.com/tesseract-ocr/tessdoc/blob/master/Installation.md.
Windows 找不到可执行文件tesseract
在您指定的目录中PATH
环境变量。因此,要么确保包含的目录tesseract
在你的PATH
变量或覆盖tesseract_cmd
您的 Python 脚本中的变量如下所示(改为您的 PATH):
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
除此之外,请确保TESSDATA_PREFIX
Windows环境变量设置为目录,包含tessdata
目录。例如:
TESSDATA_PREFIX=C:\Program Files (x86)\Tesseract-OCR
if tessdata
位置是:C:\Program Files (x86)\Tesseract-OCR\tessdata
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)