我目前正在使用Microsoft Azure 认知服务手写检测 API https://learn.microsoft.com/en-in/azure/cognitive-services/computer-vision/quickstarts/python-hand-text。
API 返回一组边界框值:
{
"boundingBox": [
2,
52,
65,
46,
69,
89,
7,
95
],
"text": "dog",
.
.
.
我想了解一下这8个参数。它们的意义是什么,反映了什么?我努力在 Microsoft API 中找到它们文档 https://westus.dev.cognitive.microsoft.com/docs/services/5adf991815e1060e6355ad44/operations/587f2c6a154055056008f200,但是没有用。请帮助我理解这些参数的含义,或者将我链接到可以消除此疑问的地方。
如果您需要更多信息,也请告诉我。
根据this https://techcommunity.microsoft.com/t5/Azure/Computer-Vision-API-OCR-bounding-boxes/td-p/71774,API 返回框的四个角的 X、Y 坐标。所以:
X 左上、Y 左上、X 右上、Y 右上、X 右下、Y 右下、X 左下、Y 左下
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)