这并不是真正的“OCR”,因为它不识别字符,但它与应用于曲线的想法相同。有人知道用于从(光栅)绘图图像检索值的图像处理库或已建立的算法吗?例如,在这张图中,我很难用眼睛读取精确的值,因为网格线之间存在这样的间隙:
我可以使用直尺或其他工具,但它仍然容易出错。如果有软件可以截取任何旧图表的屏幕截图并自动将其转换为可以查询的值表或函数,那就太好了。
好像叫“曲线识别”?还可用于从未发布基础数据的科学论文中的曲线中提取数据。
有一些人类指导也是可以的。例如,OCR 没有理由无法读取“100”并将其与线条匹配,但在机器提取曲线相对于网格线的路径后,让人类给出线条数值是可以的。我最感兴趣的是跟踪相对于网格的曲线的功能,即使网格倾斜、旋转或以非仿射方式扭曲 https://stackoverflow.com/q/1601600/125507.
Update:
现在有一篇维基百科文章叫做将扫描图转换为数据 https://en.wikipedia.org/wiki/Converting_scanned_graphs_to_data链接中有一堆软件。还有一些Alternativeto.net 上的软件 http://alternativeto.net/software/engauge-digitizer/。我想这个理论属于http://dsp.stackexchange.com http://dsp.stackexchange.com现在,虽然软件解决方案属于http://superuser.com http://superuser.com?
这是极其困难且容易出错的。 (我们在化学领域经常做这种事情,试图分析化学。)这很大程度上取决于各种参数和条件。
- 图像是位图(仅像素)还是矢量(EMF、WMF、SVG、PS、PDF...)?矢量比像素好得多。我们处理矢量(包括 PDF),但不触及像素。我们的一些合作者会尝试使用像素,但仅限于最近的文档。
- 如果您受像素困扰,那么您的图像都来自同一来源吗?如果是这样,您提取字体信息的机会很小。恐怕你的形象太差了,需要做大量的工作。但是,如果您可以计算出字体,并且所有文档都来自同一来源,那么您就有机会提取文本和数字。您可以使用启发式(例如数字可能在哪里的规则)或机器学习(可以训练方法的功能列表)。
- 您的图像似乎已被扫描(因为轴已像素化)。这使得情况变得更糟。对于机器来说,肉眼看来是一条直线是可怕的。您的图像在页面上是否倾斜?您可能必须对其进行校正。
- 如果您有直线和曲线的模型,那么您可能需要更改将预期参数建模到图像中的方法。但这并非小事。
很抱歉我是悲观的。如果您确实想要这些信息,那么可以通过大量投资或与从事此类工作的团体合作来完成。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)