【计算机视觉

2023-10-30

一、检测相关(5篇)

1.1 Detecting Manufacturing Defects in PCBs via Data-Centric Machine Learning on Solder Paste Inspection Features

基于焊膏检测特征的以数据为中心的机器学习检测印刷电路板制造缺陷

https://arxiv.org/abs/2309.03113

使用焊膏检测(SPI)和自动光学检测(AOI)机器自动检测印刷电路板(PCB)制造中的缺陷,有助于提高运营效率,并显著减少人工干预的需求。在本文中,使用SPI提取的600万引脚的功能,我们展示了一种以数据为中心的方法来训练机器学习(ML)模型来检测PCB制造的三个阶段的PCB缺陷。600万个PCB引脚对应于15,387个PCB的200万个组件。使用基本极端梯度增强(XGBoost)ML模型,我们迭代数据预处理步骤以提高检测性能。结合使用元件和PCB ID的引脚级SPI功能,我们也在元件和PCB级别开发了训练实例。这允许ML模型捕获在引脚级别可能不明显的任何引脚间、组件间或空间效应。在引脚、元件和PCB级别对模型进行训练,并将不同模型的检测结果组合起来以识别有缺陷的元件。

1.2 Continual Evidential Deep Learning for Out-of-Distribution Detection

基于连续证据深度学习的离散型检测

https://arxiv.org/abs/2309.02995

基于不确定性的深度学习模型因其提供准确可靠预测的能力而引起了人们的极大兴趣。证据深度学习在使用单个确定性神经网络检测分布外(OOD)数据方面表现出色。出于这一事实,在本文中,我们提出了一个证据深度学习方法集成到一个持续的学习框架,以同时执行增量对象分类和OOD检测。此外,我们分析了真空和不和谐的能力,以区分属于旧类和OOD数据的分布数据。所提出的方法,称为CEDL,CIFAR-100考虑两个设置,分别由5和10个任务进行评估。从所获得的结果,我们可以理解,所提出的方法,除了提供相对于基线的对象分类中的可比结果之外,在三个评估度量上与若干事后方法相比在很大程度上优于OOD检测:AUROC、AUPR和FPR 95。

1.3 DMKD: Improving Feature-based Knowledge Distillation for Object Detection Via Dual Masking Augmentation

DMKD:通过双掩蔽增强改进基于特征的知识提取用于目标检测

https://arxiv.org/abs/2309.02719

最近的主流掩蔽蒸馏方法的功能,通过重建选择性掩蔽区域的学生网络的教师对应物的特征图。在这些方法中,需要适当地选择掩蔽区域,使得重构的特征像教师特征那样编码足够的区分和表示能力。然而,以前的掩蔽蒸馏方法只专注于空间掩蔽,使得所得掩蔽区域偏向于空间重要性,而不编码信息信道线索。在这项研究中,我们设计了一个双掩蔽知识蒸馏(DMKD)框架,它可以捕捉空间上的重要性和通道明智的信息线索,全面的掩蔽特征重建。更具体地说,我们采用双重注意机制来引导各自的掩蔽分支,导致重建的特征编码双重重要性。此外,融合重建的特征通过自调整加权策略实现有效的特征提取。我们在目标检测任务上的实验表明,当RetinaNet和Cascade Mask R-CNN分别用作教师网络时,学生网络在我们的方法的帮助下实现了4.1%和4.3%的性能增益,同时优于其他最先进的蒸馏方法。

1.4 SlAction: Non-intrusive, Lightweight Obstructive Sleep Apnea Detection using Infrared Video

SLAction:使用红外视频的非侵入性、轻量级阻塞性睡眠呼吸暂停检测

https://arxiv.org/abs/2309.02713

阻塞性睡眠呼吸暂停(OSA)是一种普遍的睡眠障碍,影响全世界约10亿人。目前诊断OSA的黄金标准,多导睡眠图(PSG),涉及使用多个连接的传感器过夜住院,由于第一夜效应,导致潜在的不准确性。为了解决这个问题,我们提出了SlAction,一个非侵入性OSA检测系统的日常睡眠环境使用红外视频。认识到睡眠视频表现出最小的运动,这项工作研究了基本问题:“呼吸事件是否充分反映在睡眠期间的人体运动中?“通过分析5,098小时的最大睡眠视频数据集,我们建立了OSA事件与睡眠期间人体运动之间的相关性。我们的方法使用低帧速率(2.5 FPS),大尺寸(60秒)和步骤(30秒)的滑动窗口分析,以捕获缓慢和长期的运动相关的OSA。此外,我们还为资源受限的设备使用了一个轻量级的深度神经网络,确保所有视频流都在本地处理,而不会影响隐私。评估表明,SlAction在各种环境中检测OSA时达到了87.6%的平均F1得分。在NVIDIA Jetson Nano上实施SlAction可实现实时推理(60秒视频剪辑约为3秒),突出了其早期检测和个性化治疗OSA的潜力。

1.5 Anatomy-Driven Pathology Detection on Chest X-rays

胸部X线片的解剖驱动病理检测

https://arxiv.org/abs/2309.02578

病理学检测和描绘使得能够自动解释医学扫描(诸如胸部X射线),同时提供高水平的解释性以支持放射科医师做出明智的决定。然而,注释病理学边界框是一项耗时的任务,使得用于此目的的大型公共数据集是稀缺的。因此,当前的方法使用弱监督对象检测来学习来自图像级注释的病理的(粗略)定位,然而,由于缺乏边界框监督,这在性能上是有限的。因此,我们提出了解剖驱动的病理检测(ADPD),它使用易于注释的解剖区域的边界框作为病理代理。我们研究了两种培训方法:使用解剖学级病理学标签的监督训练和具有图像级病理学标签的多实例学习(MIL)。我们的研究结果表明,我们的解剖学水平的训练方法优于弱监督方法和完全监督检测有限的训练样本,我们的MIL方法是竞争的两种基线方法,因此证明了我们的方法的潜力。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉 的相关文章

随机推荐

  • chatgpt(0)-pycharm-vscode安装使用插件Codeium-bito

    1 pycharm codeium 下载插件 codeium 登录 一直出现 Log In Codeium Free AI Code Completion Chat 2 pycharm bito 3 vscode bito 下载安装 注册登
  • 十六进制加法

    十六进制加法逢16进1位 注意 进位的那个位是 和 16 举例 0x21 0x3F 60 而不是 0x21 0x3F 6F
  • Proguard混淆工具使用方法图文说明

    Proguard的理论知识请看这篇文章 http www cnblogs com cr330326 p 5534915 html 1 下载Proguard 官网地址 http proguard sourceforge net 不墙很难打开
  • Sonar代码质量管理

    一 简介 1 1 什么是Sonar Sonar是一个用于代码质量管理的开源平台 用于管理代码的质量 是一个Web系统 展现了静态代码扫描的结果 通过插件形式可以支持二十几种语言的代码质量检测 通过多个维度的检查了快速定位代码中潜在的或者明显
  • fopen 参数'rb' 与'rb+'引发的黑色血案

    目录 一 背景 二 代码说明 1 下面是出错的代码 2 如何变正常的 三 问题分析 1 关于rb与rb 的区别 2 关于fread的两种形式说明 3 原因分析 一 背景 为了把windows上的算法库移植到linux上 文件读写部分去掉了C
  • IO流(异常的处理)

    IO流 概述 IO流 又叫输入输出流 当我们将内存中的数据写到硬盘上时 这个过程叫输出流 Output 当我们将硬盘上的数据读取到内存中时 叫做输入流 Input 流本身是一个抽象概念 是 对数据传输的总称 也就是说 数据在设备键的传输 叫
  • 跟李沐学AI之注意力机制+transformer

    注意力机制 注意力提示 注意力的可视化 注意力汇聚 平均汇聚 非参数注意力汇聚 带参数注意力汇聚 注意力评分函数 掩蔽softmax操作 加性注意力 缩放点积注意力 Bahdanau注意力 多头注意力机制 自注意力和位置编码 transfo
  • (java)leetcode-445 Add Two Numbers II(两数相加 II)

    题目描述 给你两个 非空 链表来代表两个非负整数 数字最高位位于链表开始位置 它们的每个节点只存储一位数字 将这两数相加会返回一个新的链表 你可以假设除了数字 0 之外 这两个数字都不会以零开头 进阶 如果输入链表不能修改该如何处理 换句话
  • jupyter的安装与使用

    目录 一 jupyter的介绍 二 安装与运行 1 使用Anaconda安装 2 使用pip命令安装 1 首先通过win R打开命令符输入pip version 查看电脑python环境 编辑 2 输入jupyter notebook的命令
  • 有时OPEN***提示报错,如下错误及解决方法

    Dec 14 11 40 47 nfs12 open 31685 TLS ERROR BIO read tls read plaintext error error 14090086 SSL routines SSL3 GET SERVER
  • VScode绑定码云并向仓库上传代码

    文章目录 一 下载git 二 使用步骤 1 Git的全局配置 2 配置Git 3 VScode的配置 总结 一 下载git 下载链接 点击download即可 下载完成后 按照默认安装即可 二 使用步骤 1 Git的全局配置 代码如下 示例
  • 卸载Ubuntu自带的Qt4和Qt5

    执行如下操作 首先移除库 sudo apt get remove qtcreator sudo apt get remove qt5 上面是移除qt5 移除qt4的时候把qt5改成qt4就可以了 下面也是一样的 移除依赖文件 sudo ap
  • 《Python进阶系列》一:使用Python包组织代码

    使用Python包 package 组织代码 最近在看 Python入门技能树 时 看到了Python包组织代码觉得很有意思 特地写个笔记总结一下 quad Python 通过包 package 的方式来组织代码 包是一种特殊的模块 mod
  • vue3-ElmentPlus封装通用表格-含单元格操作-多选-分页器

    Sam9029的CSDN博客主页 Sam9029的博客 CSDN博客 JS学习 CSS学习 Vue 2领域博主 恭喜你 若此文你认为写的不错 不要吝啬你的赞扬 求收藏 求评论 求一个大大的赞 已经有很久没有写文章了 贪玩 摆烂 不想动 低情
  • GAN初识

    1 生成对抗网络GAN简介 1 1 生成器 G Z 接受随机噪声Z作为输入生成仿品 并训练自己去欺骗判别器D 让D以为G Z 产生的任何数据都是真实的 1 2 判别器 D Y 可以基于真品和仿品来判断仿造品的仿真程度 通常值越靠近0表示越真
  • 数字信号处理理解

    心得体会 给自己看的 傅里叶变换 FT FS DTFT DFS 傅里叶变换虚部理解 每个函数都可以写成奇分量 偶分量 偶分量用很多cos合成 奇分量用很多sin合成 频谱上 实轴上冲激函数就是由这些cos合成 那如果是sin合成的呢 那就是
  • mkdocs 编辑及启动

    mkdocs 编辑及启动 新建项目以及 md 文件之后 如图 具体代码为 mkdocs 核心配置代码 编写完成之后 编译 cd mkdocs docs make html 成功之后 会自动生成 build文件 启动 firefox buil
  • elementUI中的el-form常用校验规则

    elementUI中的el form常用校验规则 校验使用方式 rules name required true message 请输入活动名称 trigger blur min 3 max 5 message 长度在 3 到 5 个字符
  • 【PTA】跟奥巴马一起画方块

    美国总统奥巴马不仅呼吁所有人都学习编程 甚至以身作则编写代码 成为美国历史上首位编写计算机代码的总统 2014年底 为庆祝 计算机科学教育周 正式启动 奥巴马编写了很简单的计算机代码 在屏幕上画一个正方形 现在你也跟他一起画吧 输入格式 输
  • 【计算机视觉

    文章目录 一 检测相关 5篇 1 1 Detecting Manufacturing Defects in PCBs via Data Centric Machine Learning on Solder Paste Inspection