我们目前正在研究在提交 OCR 之前提高图像质量的方法。我们当前使用的 OCR 引擎是 Nuance (v15) 的 Scansoft API。我们当时正在研究铅工具 http://leadtools.com/但此后决定去别处寻找。与 Lead Tools 相关的许可成本实在是太高了。首先,我们正在寻找简单的图像增强功能,例如:纠偏、去斑、线条去除、打孔去除、锐化等。我们正在运行 .NET 和 Java 软件的混合,但首选 java 解决方案。
Kofax 非常适合预处理,但对于您所说的清理类型来说可能有点过头了,除非图像真的很糟糕。除非您的专长是图像处理,否则我建议您与进行图像清理和 OCR 的提供商合作,以便您可以专注于实际添加的价值。
我们从 ABBYY 获得了 OCR 开发套件的许可(ABBY SDK http://www.abbyy.com/sdk/)并且发现它在图像处理和 OCR 方面都非常出色。 API 相当广泛,示例应用程序、帮助和支持令人印象深刻。我绝对推荐看一看。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)