我正在尝试创建一个软件,通过捕获屏幕截图来自动化 PC,然后使用 OCR(光学字符识别)来查找要单击的特定按钮(例如)。我已经有了鼠标和键盘控制部分,但现在,我需要 OCR 来处理屏幕截图。我发现 Tesseract OCR 似乎不能很好地处理屏幕上的文本。文本太小,或者某些文本似乎是相连的,例如 K 和 X。我应该如何处理?
p/s:这是一个自动化测试程序。
我不确定这是否真的适合您,但我在自动化中看到的一些更好的 OCR 是由 Tevron 完成的西特拉测试 http://www.tevron.com/default.asp。它包含一个字体库,如果不存在字体集,他们将根据您提交的内容创建一个新字体。该工具的负面因素是成本以及与可变屏幕分辨率相关的常见问题。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)