我有这张图片
如何进行 OCR 识别?
我知道这非常具有挑战性,但我非常感谢任何帮助。
如果您有时间自己开发检测,我会大致这样做:
- 获取 1000 张左右的图像,然后自己进行 OCR 识别,或者让 Amazon Mechanical Turk 上的人员为您完成,这几乎不需要任何成本。现在您可以调整算法并衡量您的表现。
- 就像 Ryan 写的那样,手动或使用标准图像滤镜、对比度、颜色、高斯等http://www.roborealm.com/ http://www.roborealm.com/。看看您是否无法找到使文本真正脱颖而出的组合。
- 再次尝试库
- 如果这些库仍然不起作用,请尝试利用您对图片的了解将其拆分为单独的数字。您知道应该有多少位数字以及每个数字大约需要多少像素。使用边缘检测或其他方法(也许标准 OCR 特征提取与聚类一起会将每个数字作为一个簇?)来查找数字并将它们分开。
- 对每个数字进行标准 OCR 特征提取(不要太有创意 - 使用现有库或至少阅读最常见和最简单的内容),并将这些特征与 1)下得到的答案一起输入神经网络网络或 SVM。
- 改进您的功能集,直到机器学习发挥作用。
由于您只有十位数字,而且图像之间相当一致,因此这应该可行。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)