我正在尝试开发一个需要知道图像中标记对象位置的应用程序。知道图像中有一架“钢琴”还不够,我需要知道钢琴在图像中的位置。
微软的计算机视觉 API 和谷歌的云视觉 API 都提供了某种形式的裁剪建议/智能缩略图生成服务,这让我认为某些对象的位置正在被检测到 - 但是有没有办法获取该信息(例如边界框)来自 Microsoft 的计算机视觉 API 或 Google 的 Cloud Vision API?
EDIT:据我所知,这两个 API 都可以返回图像中检测到的面部位置,但是我正在寻找图像中每个对象的位置和大小:汽车、钢琴、树木、人……任何东西。
Microsoft Vision API 不提供检测到的对象的像素坐标(请参阅返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa).
但是,如果您想检测人,Microsoft API 可以返回面部矩形的坐标。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)