我当前的项目涉及将 pdf 中的文本转录为文本文件,我首先尝试将图像文件直接放入 OCR 程序(tesseract)中,但效果不佳。
原始图像文件基本上是旧报纸,并且有一些背景噪音,我确信 tesseract 存在问题。因此,我尝试在将图像输入超正方体之前对其进行一些预处理。有没有适合这种情况的开源图像预处理引擎的建议???以及有关如何使用它的说明将更加感激!
我从来没有听说过“图像预处理引擎“为此目的,但你可以看看OpenCV http://opencv.org/(开源计算机视觉库)并实现您自己的“预处理引擎". OpenCV是一个计算机视觉库,提供许多执行图像处理的功能。
您可能想要测试的一件有趣的事情预处理步骤是应用一个临界点到图像中去除噪音和东西。反正,我曾在这个线程 https://stackoverflow.com/a/11471322/176769.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)