Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？

2024-04-27

我正在尝试开发一个需要知道图像中标记对象位置的应用程序。知道图像中有一架“钢琴”还不够，我需要知道钢琴在图像中的位置。

微软的计算机视觉 API 和谷歌的云视觉 API 都提供了某种形式的裁剪建议/智能缩略图生成服务，这让我认为某些对象的位置正在被检测到 - 但是有没有办法获取该信息（例如边界框）来自 Microsoft 的计算机视觉 API 或 Google 的 Cloud Vision API？

EDIT:据我所知，这两个 API 都可以返回图像中检测到的面部位置，但是我正在寻找图像中每个对象的位置和大小：汽车、钢琴、树木、人……任何东西。

Microsoft Vision API 不提供检测到的对象的像素坐标（请参阅返回功能：https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa).

但是，如果您想检测人，Microsoft API 可以返回面部矩形的坐标。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？的相关文章

在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
iOS 应用程序上的 Youtube API v3。我的 API 密钥不起作用，但其他人的密钥可以在同一应用程序上起作用。错误403

这可能是 Google 的 Youtube 团队直接提出的问题但我想先在这里问以防将来也能帮助其他人我在 iOS 应用程序上使用简单的 API 密钥没有 OAuth 2 0 该应用程序只是从特定的播放列表 ID 返回视频 ID 列表
ReSharper API...呃...它在哪里？

好吧我一定正在享受金发时刻但我一生都找不到去哪里下载 ReSharper API 与我获得的项目一起使用here http devlicio us blogs hadi hariri archive 2010 01 12 writin
如何使用 Sound Cloud API 按标签搜索特定用户的曲目？

我想通过仅与我的用户名即皇家歌剧院相关的标签搜索曲目例如 http api soundcloud com users royaloperahouse tracks client id 238947HSGDHSDG tags eric
opencv createsamples没有错误，但是没有找到样本

我在用着this http coding robin de 2013 07 22 train your own opencv haar classifier html教程我正在根据我的正面图像创建大量样本我正在使用 Windows 这是
jQuery - 解析 JSON 数据 - 变量名称遇到问题

我第一次深入研究 JSON 数据的使用不过我有一些使用 jQuery 的经验我发布到此 URL tumblr api jyoseph com api read json 我想做的是输出返回的 json 到目前为止我所拥有的 docume
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE
授予 Rails 应用 API 访问权限的最佳身份验证方法

我想为我的网络应用程序提供经过身份验证的 API 访问此类服务的消费者通常是其他网站服务验证这些用户身份的最佳方法是什么 OAuth openID http 身份验证正如我们的工作一样哪个最好的答案是这样的是这取决于 HTT
如何从网站中提取冠状病毒病例？

我正在尝试从网站中提取冠状病毒 https www trackcorona live https www trackcorona live 但我得到了一个错误这是我的代码 response requests get https www t
通过API更新Twitter背景

我在通过 Twitter 的 API 更新背景时遇到了一些问题 target url http www google com logos 11th birthday gif ch curl init curl setopt ch CURLO
中间件 API 的最佳实践是什么？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我们正在开发一个中间件 SDK 采用 C 和 Java 语言供游戏开发人员动画软件开发人员阿凡达开
检查图像中是否有太薄的区域

我正在尝试验证雕刻机的黑白图像更多的是剪贴画图像不是照片我需要考虑的主要事情之一是区域的大小或线条的宽度因为机器无法处理太细的线条所以我需要找到比给定阈值更细的区域以此图为例竖琴的琴弦可能太细而无法雕刻我正在阅读有关 Ma
无法在 Angular 10 中的“pdf-viewer”=>“ng2-pdf-viewer”中显示 blob url

我有一个 API 它将上传的文件作为 blob 返回当我尝试绑定时src如果使用 blob URL 则它不会显示任何内容但是当我尝试绑定直接 URL 时它可以显示 PDF 文件这是我下面给出的代码我的 TS 代码 downloa
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
Twitter Streaming API 使用的官方编码？是UTF-8吗？

Twitter 流 API 的官方编码是什么根据我所看到的我最好的猜测是 UTF 8 但我想避免做出假设我见过的 Twitter 网站上唯一暗示他们使用什么作为官方编码的部分是在这里 Twitter 不想因为我们使用 UTF 8 或相
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
彭博开放 API

彭博开放 API最近宣布 http www computerworlduk com news it business 3334375 bloomberg market data api made public 这只是彭博软件开发工具包 ht
Spotify Apps API：库类不会返回用户播放列表

我试图获取一个包含用户库中所有播放列表的数组 http developer spotify com download spotify apps api reference dcdebc652c html 其他类属性专辑艺术家加星标的播
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
Booking.com酒店管理API

我拥有一家酒店并在 booking com 上查看了 API 因为我想创建自己的前端界面来更新我的酒店房价房间数以及通过该 API 上传图片更新酒店描述然而我唯一能找到的是一个 API 供联营公司以一定的价格获取特定位置的酒店等

随机推荐

为什么链接器要修改--defsym“绝对地址”

目标一个使用可执行文件中的函数不导出符号的共享库 Means gcc Wl defsym function 0x432238 手册页指出 defsym symbol expression Create a global symbol
无法在 root 设备上运行程序“su”

我有一部运行 Android N AOSP 版本的 root 手机我试图从我的应用程序获取 root 权限但它不断被拒绝这是我正在尝试的 java lang Process p runtime exec su DataOutputS
Python - 在 Windows 中的多进程下创建线程时出现“can't pickle thread.lock”错误

我陷入了我认为的基本多进程和线程问题我已经设置了一个多进程其中有一个线程但是当我在其中设置线程类时init函数我收到以下错误类型错误无法pickle thread lock对象但是如果线程是在线程之外设置的则不会发生这种
更改 jQuery UI 滑块大小

我在用这个 UI 滑块 http api jqueryui com slider entry examples尺寸也是我网站上的尺寸不是宽度而是按钮的尺寸演示页面底部但是here http jqueryui com themerol
如何通过 XAML 绑定设置当前 CultureUI

我有一个绑定到字符串的 TextBlock 我希望该字符串以应用程序的当前 UI 区域性显示我想在 XAML 中执行此操作文本块很简单如下所示
如何从 type=file 输入中删除“未选择文件”？

我似乎无法找到任何方法来删除显示在文件类型的输入旁边的未选择文件文本你们知道如何删除此文本吗 input type file color transparent Enjoy
如何将tmux热键设置为Ctrl-，即Ctrl+逗号

我在 Mac OS X 上设置首选 tmux 热键时遇到了一些麻烦 The most common hotkeys that invokes tmux s magics are CTRL A and CTRL B But I would r
Internet Explorer 8 不会修改打印样式表中的 HTML5 标记

我之前正在制作打印样式表并遇到了 IE8 的问题我正在使用 HTML5 和几个布局标签包括页眉导航和页脚由于某种原因在我的打印样式表中显示无这些标签上的声明在 IE8 中被忽略我只能假设后续的较低版本我首先认为 IE9
Javascript 弹出窗口会消失

我需要有一个类似消息框的东西但没有按钮它会显示在屏幕上All data was saved然后在 2 3 秒内消失这就像一个警报我们提醒用户记录已保存但我需要它显示在屏幕顶部的一个小框中并且它应该淡出有人可以帮我编写一个可以执
将一些提交移至另一个分支

我只有一个分支有 git repo A B C D E master 我想将提交 B C 和 D 拆分到另一个名为开发的分支 A E master B C D develop 做到这一点最简单的方法是什么无需关心远程仓库做cherry
`/dev/urandom` 适合模拟目的吗？

似乎在类 Unix 系统中使用纯 C fread from dev urandom是提取高质量随机字节的最简单方法我需要运行一个每秒需要大约 10k 32 位随机数的模拟并且可能会运行几天是 dev urandom可以用于此目的吗当
根据具有重复测量的其他列的条件向列添加值

我对 R 还很陌生正在尝试在 Rstudio 中准备我的数据集以供进一步分析如果有人能帮助我找到代码的解决方案我将不胜感激我的数据叫做m8 这就是我到目前为止所做的但它只返回整个 Q2 列中 U1High U1Low 和 U1Me
如何对加密算法进行逆向工程？

我编写了一个以这种方式加密文本的应用程序获取输入文本反转文本转换为十六进制用密钥进行异或 Base64编码现在我自己没有做很多加密编码所以我的问题可能听起来很愚蠢但是假设我得到一个包含上述算法内容的文件而我不知道这个算
如何修改 HttpUrlConnection 的标头

我试图稍微改进一下 Java Html 文档但我遇到了问题HttpUrlConntion 有一件事是如果用户代理是 Java VM 某些服务器会阻止请求另一个问题是HttpUrlConnection不设置Referrer or Loc
将数字缩放为 <= 255？

我的单元格的数值可以是 0 到 0 之间的任何值Integer MAX VALUE 我想对这些单元格进行相应的颜色编码如果该值 0 则 r 0 如果该值是Integer MAX VALUE 则 r 255 但是中间的值呢我想我需要一个函
D3.js - 如何迭代数据集中的子数组

我试图让 d3 迭代数据中的子数组并生成多个饼图这是完整的代码来自https gist github com mbostock 1305111 https gist github com mbostock 1305111 and htt
为 ListView 最后一个元素添加下边距

我需要添加具有复杂项目背景的 ListView 顶部和底部的偶数奇数和圆角不同它看起来像这样我已经通过级别列表实现了所有这些东西但我还想做一件事现在底部项目位于屏幕底部附近最好添加一些空间我不想向 ListView 添加底部边
如何将 3D 图像输出到 3D 电视？

我有一台 3D 电视如果我不至少尝试让它显示我自己创作的漂亮 3D 图像我就会逃避我的责任作为一个极客我之前已经完成了非常基本的 OpenGL 编程因此我了解所涉及的概念假设我可以为自己渲染一个简单的四面体或立方体并使其旋转一点
将 Java `sort` 签名转换为 `? super T` 到 Scala（泛型）

问题看着这个问题 https stackoverflow com questions 16430355 translating generic 20wildcards from java to scala关于迁移 Java 签名 publ
Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？

我正在尝试开发一个需要知道图像中标记对象位置的应用程序知道图像中有一架钢琴还不够我需要知道钢琴在图像中的位置微软的计算机视觉 API 和谷歌的云视觉 API 都提供了某种形式的裁剪建议智能缩略图生成服务这让我认为某些对象的位置

Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？

Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？ 的相关文章

随机推荐

热门标签

Microsoft 计算机视觉 API 或 Google 的 Cloud Vision API 是否可以获取对象的位置？的相关文章