使用 google mlkit 视觉样本减少跟踪窗口

2024-04-03

我想在使用 google Vision api 时减少减少条形码跟踪窗口。有一些答案here https://stackoverflow.com/questions/36405717/android-vision-reduce-bar-code-tracking-window/36428822#36428822但他们感觉有点过时了。

我正在使用谷歌的示例：https://github.com/googlesamples/mlkit/tree/master/android/vision-quickstart https://github.com/googlesamples/mlkit/tree/master/android/vision-quickstart

目前，我试图弄清楚条形码是否在我的覆盖框内条码扫描器处理器 https://github.com/googlesamples/mlkit/blob/master/android/vision-quickstart/app/src/main/java/com/google/mlkit/vision/demo/kotlin/barcodescanner/BarcodeScannerProcessor.kt onSuccess打回来：

override fun onSuccess(barcodes: List<Barcode>, graphicOverlay: GraphicOverlay) {
    if(barcodes.isEmpty())
      return;

    for(barcode in barcodes) {
      val center = Point(graphicOverlay.imageWidth / 2, graphicOverlay.imageHeight / 2)
      val rectWidth = graphicOverlay.imageWidth * Settings.OverlayWidthFactor
      val rectHeight = graphicOverlay.imageHeight * Settings.OverlayHeightFactor

      val left = center.x - rectWidth / 2
      val top = center.y - rectHeight / 2
      val right = center.x + rectWidth / 2
      val bottom = center.y + rectHeight / 2

      val rect = Rect(left.toInt(), top.toInt(), right.toInt(), bottom.toInt())

      val contains = rect.contains(barcode.boundingBox!!)
      val color = if(contains) Color.GREEN else Color.RED

      graphicOverlay.add(BarcodeGraphic(graphicOverlay, barcode, "left: ${barcode.boundingBox!!.left}", color))
    }
}

Y 方向它工作得很好，但是 X 值来自barcode.boundingBox e.g. barcode.boundingBox.left似乎有偏移。是否基于正在计算的内容图形叠加 https://github.com/googlesamples/mlkit/blob/master/android/vision-quickstart/app/src/main/java/com/google/mlkit/vision/demo/GraphicOverlay.java?

我预计下面的值接近 0，但这里的偏移量约为 90：

或者根据框裁剪图像可能更有效？

实际上边界框是正确的。诀窍在于图像长宽比与视口长宽比不匹配，因此图像会被水平裁剪。尝试打开设置（右上角的齿轮）并选择合适的分辨率。

例如，看一下这两个屏幕截图。在第一个中，所选分辨率 (1080x1920) 与我的手机分辨率匹配，因此填充看起来不错 (17px)。在第二个屏幕截图中，长宽比不同（720x720 分辨率为 1.0），因此图像被裁剪并且填充看起来不正确。

所以偏移量应该从图像坐标转换到屏幕坐标。在引擎盖下GraphicOverlay使用矩阵进行此转换。您可以使用相同的矩阵：

    for(barcode in barcodes) {
      barcode.boundingBox?.let { bbox ->
        val offset = floatArrayOf(bbox.left.toFloat(), bbox.top.toFloat())
        graphicOverlay.transformationMatrix.mapPoints(offset)

        val leftOffset = offset[0]
        val topOffset = offset[1]

        ...
      }
    }

唯一的事情是transformationMatrix是私有的，所以你应该添加一个 getter 来访问它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 google mlkit 视觉样本减少跟踪窗口的相关文章

检测到设备正在振动？

我使用下面的代码来振动设备 public void vibrator try Vibrator vibrator Vibrator getSystemService Context VIBRATOR SERVICE vibrator vib
Android 应用程序在后台运行时保存数据

目前我正在开发 xmmp 客户端当应用程序位于前台时该客户端工作得很好但由于事实上当应用程序处于后台时我在 Application 类中保存了大量数据复杂的 ArrayList 字符串和布尔值作为公共静态每个字段都被垃圾收集
导航组件重复 NavArgs 的问题

我有一个片段 class SomeFragment private val args by navArgs
如何从 SQLite 获取记录总数

我正在尝试从 Sqlite DB 获取行的总数以下是我想要做的代码片段我不知道我在这里做错了什么 public static int getTotalCount Context context Cursor c null try c g
如果我们使用后退按钮退出，为什么 Android 应用程序会重新启动？

按住主页按钮并返回应用程序时应用程序不会重新启动为什么使用后退按钮会重新启动如果我们使用后退按钮退出有什么方法可以解决在不重新启动的情况下获取应用程序的问题吗请帮忙当您按下Home按钮应用程序将暂停并保存当前状态最后应用程序
如何查找 Android 设备中的所有文件并将它们放入列表中？

我正在寻求帮助来列出 Android 外部存储设备中的所有文件我想查找所有文件夹包括主文件夹的子文件夹有办法吗我已经做了一个基本的工作但我仍然没有得到想要的结果这不起作用这是我的代码 File files array file
获取 AlarmManager 中活动的 PendingIntents 列表

我有办法获取活动列表PendingIntent在设备中我开始工作AlarmManager我想看看我的PendingIntents 已正确创建和删除也很高兴看到其他什么PendingIntent在那里只是为了看看某些应用程序是否正在做一
如何在 sqlite 中将 2 列合并为新列

我有一个包含 3 列的表我必须将 2 列中的值按降序排列到一列中 A B C z 1 2 f 5 7 s 9 5 使用此示例输出会将 B 列和 C 列中的值放入其中如下所示 A B s 9 f 7 f 5 s 5 z 2 z 1 我当
更新到材质 1.2.0 后，材质按钮上缺少圆角半径属性

这是我的材质按钮代码
minHeight 有什么作用吗？

在附图中我希望按钮列与图像的高度相匹配但我也希望按钮列有一个最小高度它正确匹配图像的高度但不遵守 minHeight 并且会使按钮向下滑动我正在为按钮列设置这些属性
Android 启动器快捷方式

我制作了一个简单的打卡打卡时钟应用程序我想向用户添加在主屏幕上创建快捷方式的选项该快捷方式将切换应用程序的状态超时超时但我根本不希望此快捷方式在屏幕上打开应用程序这是我的 setupShortcut private void
检查 Android 手机上的方向

如何查看Android手机是横屏还是竖屏当前配置用于确定要检索的资源可从资源中获取Configuration object getResources getConfiguration orientation 您可以通过查看其值来检查方向
调节麦克风录音音量

我们正在尝试调整录音时的音量级别麦克风似乎非常敏感会接收到很多静电我们查看了 setVolumeControlStream 但找不到传入其中来控制麦克风的流将您的音频源设置为 MIC using MediaRecorder Audi
如何创建像谷歌位置历史记录一样的Android时间轴视图？

我想设计像谷歌位置历史这样的用户界面我必须为我正在使用的应用程序复制此 UIRecyclerView 每行都是水平的LinearLayout其中包含右侧的图标线条和视图该线是一个FrameLayout具有圆形背景和半透明圆圈Views
使用 Espresso 检查 EditText 的字体大小、高度和宽度

如何使用 Espresso 检查 EditText 的字体大小高度和宽度目前要分割我使用的文本 onView withId R id editText1 perform clearText typeText Amr 并阅读文本 onVi
用于推送通知的设备令牌

我正在实施推送通知服务我需要创建一个数据库来存储 4 个移动平台的所有设备令牌我想根据他们的平台 iOS Android BlackBerry WP7 来组织它们但是有什么方法可以区分平台这样如果我只想向 Android 用户发送消
android Accessibility-service 突然停止触发事件

我有一个 AccessibilityService 工作正常但由于开发过程中的某些原因它停止工作我似乎找不到这个原因请看一下我的代码并告诉我为什么它不起作用 public class MyServicee extends Access
在 Android 中，如何将字符串从 Activity 传递到 Service？

任何人都可以告诉如何将字符串或整数从活动传递到服务我试图传递一个整数 setpossition 4 但它不需要启动时总是需要 0 Service 我不知道为什么我不能通过使用 Service 实例从 Activity 进行操作 publ
无法运行我的应用程序，要求选择 Android SDK

今天我已经安装了Android Studio 金丝雀 1 现在我无法运行我的应用程序将出现以下对话框我已经通过文件 gt 项目结构 gt Android SDK 位置设置了正确的 SDK 位置期待您的帮助来解决这个问题警告对话框
如何删除因 Google Fitness API 7.5.0 添加的权限

将我的 play services fitness api 从 7 0 0 更新到 7 5 0 后我注意到当我将新版本上传到 PlayStore 时它告诉我正在添加一个新权限和 2 个新功能我没有这样做有没有搞错在做了一些研究来

随机推荐

通用二叉树节点析构函数问题

我一直在做一项作业现在我被有问题的析构函数困住了我必须创建一个包含所有常用成员函数和一些特殊运算符的通用二叉树还有一个限制一切都必须迭代地工作所以这次没有令人讨厌的递归黑客 BinTreeNode 类的析构函数显然有一些非常错误的
Laravel 中 detach() 方法也可以应用于一对多关系吗？

在 Laravel 文档中我发现 detach 方法可以分离多对多关系中的所有对象 detach 方法也可以应用于 Laravel 中的一对多关系吗如果不是在这种情况下如何分离所有 n 个对象在多对多关系中 detach 方法仅删除
更改通过文字初始化创建的对象的原型

假设我只想使用不是构造函数我有一个这样的对象 var o name Jack 如果我想创建另一个对象其原型是o我使用这个语法 var u Object create o console log u name prints Jack u
传递具有可变大小的二维数组

我正在尝试将二维数组从一个函数传递到另一个函数然而数组的大小不是恒定的尺寸由用户决定我曾尝试对此进行研究但运气不佳大多数代码和解释都是针对数组的恒定大小在我的函数中A我声明该变量然后对其进行一些操作然后必须将其传递给 Fu
如何使用 shell 始终获取下载 tomcat 服务器的最新链接

我写了一个shell脚本来下载并安装tomcat服务器v 8 5 31 wget http www us apache org dist tomcat tomcat 8 v8 5 31 bin apache tomcat 8 5 31 ta
如何从 f:selectItems 获取标签和值

我正在开发一个 JSF 页面该页面有一个基于List
在 hibernate 中使用 where 子句选择查询

我有班级登录其中有userId username and password 对于要登录的用户我正在检查username and password并得到userId If userId不为零则它将引导至主页我正在尝试在休眠状态下执行此操
AWS CodePipeline 并部署到 EKS

正在开发 AWS CodePipeline 用于构建容器并将其部署到 EKS 集群 AWS CodePipeline 似乎不支持仅 ECS 对 EKS 的部署操作我尝试探索其他选项例如使用 lambda 函数我找到了以下在 lamb
Redmine 和 SVN：如何在提交发生后将修订链接到问题？

这样我们就成功地将Redmine与SVN集成了这是一个成熟的集成已经几个月了 Post commit hook 更新 Redmine 中的存储库 SVN 提交中的评论可以完美地导入到 Redmine 中它能够在问题和修订日志时间整
javascript es6 双箭头函数

我想更好地理解 es6 箭头函数给出以下示例 export default function applyMiddleware middlewares return createStore gt reducer preloadedState
如何计算 MIDI 文件的时间长度

我正在使用名为 midas 的有用库的帮助下读取 as3 flash cs5 中的 midi 文件 http code google com p midas3 http code google com p midas3 midi as3 库
实现托管属性处理程序 Shell 扩展的正确方法是什么？

现在 NET CLR 4 0 支持并行 SxS 操作现在应该可以编写 shell 托管代码中的扩展我已经尝试过并成功编码了属性处理程序实现 IPropertyStore IInitializeWithStream 和 IPropert
SVG 无法在绝对定位的父级中正确调整大小

我遇到一个问题内联
在 CakePHP v2.0 中使用电子邮件地址进行身份验证

好吧这个问题与我最近在 Stack Overflow 上问的问题类似但我基本上只是使用 CakePHP 书中的代码而不是我自己的代码来尝试理解为什么有些东西不起作用基本上这个想法是允许用户在 Cake 2 0 版本中使用他们的电子邮
当 iPhone 处于睡眠模式时，iPhone 应用程序延迟 10 -15 分钟

我创建了一个使用 NSTimer 的应用程序它每秒都会触发一次我的问题是如果 Iphone 处于睡眠模式我会延迟 10 到 15 事件触发前的分钟数我已经 stackoverflowed 并用谷歌搜索了这个其原因似乎是手机在某些
限制或扩展 dart 中的枚举

我正在使用 dart 假设我有一个无法修改的枚举可能很长 enum Animal cat dog lion tigger 是否可以限制这个枚举我想获得 enum DomesticAnimal cat dog with DomesticA
缩放添加到画布的图像

我正在尝试从 svg 创建图像到目前为止我所做的是捕获使用 RaphaelJS 创建的内联 svg 然后使用 svg 代码创建图像然后将其添加到画布中我在这里找到了一篇文章向我展示了如何将图像缩放到适合画布不过我想把图像放大
如何使用宏进行 static_assert ？

我尝试过使用这个建议 https stackoverflow com a 174441 476681进行静态断言但如果我在模板的方法中使用它我不会收到编译错误示例如下 include
在 Eclipse + jboss 5.1.0 中获取“java.lang.ClassNotFoundException：javax.servlet.http.HttpServlet”

我正在尝试让一个简单的 RestEasy 项目在 Eclipse 使用 Jboss Tools 和 Jboss 5 1 0 中工作首先我创建了一个简单的动态 Web 项目在该项目中我在 WEB INF web xml 中包含以下内容
使用 google mlkit 视觉样本减少跟踪窗口

我想在使用 google Vision api 时减少减少条形码跟踪窗口有一些答案here https stackoverflow com questions 36405717 android vision reduce bar code

使用 google mlkit 视觉样本减少跟踪窗口

使用 google mlkit 视觉样本减少跟踪窗口 的相关文章

随机推荐

热门标签

使用 google mlkit 视觉样本减少跟踪窗口的相关文章