谷歌云视觉 API 是否检测 OCRed 文本中的格式,例如
粗体、斜体、字体名称(helvetica 或 times new roman)等?
很不幸的是,不行。
在我的项目中,我使用ABBYY云OCR SDK以此目的。如果你想尝试的话,你可以开启免费体验其中包括 500 个免费请求(页面)。创建试用帐户后,您将收到 ABBYY 发送的电子邮件,其中包含您的应用程序 ID 和应用程序密码。使用这 2 个值根据以下内容创建您的身份验证标头验证.
请参见以下示例:
- Perform 处理图像要求。在请求正文中传递您的图像。
Request:
POST / https://cloud.ocrsdk.com/v2/processImage?exportFormat=xml&profile=documentConversion&xml:writeFormatting=true
Authorization: <your token>
回复:
{
"taskId": "a226a0b6-6705-4d6f-9f4c-517fa9b4e28e",
"registrationTime": "2020-07-26T09:42:39Z",
"statusChangeTime": "2020-07-26T09:42:39Z",
"status": "Queued",
"filesCount": 1,
"requestStatusDelay": 10000
}
- Perform 获取任务状态请求以检查您的任务是否完成。使用上一步响应中的taskId。
Request:
GET / https://cloud.ocrsdk.com/v2/getTaskStatus?taskId=a226a0b6-6705-4d6f-9f4c-517fa9b4e28e
Authorization: <your token>
回复:
{
"taskId": "a226a0b6-6705-4d6f-9f4c-517fa9b4e28e",
"registrationTime": "2020-07-26T09:42:39Z",
"statusChangeTime": "2020-07-26T09:42:40Z",
"status": "Completed",
"filesCount": 1,
"requestStatusDelay": 0,
"resultUrls": [
"https://ocrsdk.blob.core.windows.net/files/a226a0b6-6705-4d6f-9f4c-517fa9b4e28e.result?sv=2012-02-12&se=2020-07-26T19%3A00%3A00Z&sr=b&si=downloadResults&sig=4k9FcRoBfhodq%2BMj%2Ffj%2BGLBfwK2BsO7sj15JQOLcArk%3D"
]
}
- 下载结果(请参阅上一步响应中的 resultUrls)。
I used the following picture
and received the following result