软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案

2023-05-16

背景

视频帧的黑、花屏的检测是视频质量检测中比较重要的一部分，传统做法是由测试人员通过肉眼来判断视频中是否有黑、花屏的现象，这种方式不仅耗费人力且效率较低。为了进一步节省人力、提高效率，一种自动的检测方法是大家所期待的。目前，通过分类网络模型对视频帧进行分类来自动检测是否有黑、花屏是比较可行且高效的。然而，在项目过程中，视频帧数据的收集比较困难，数据量较少，部分花屏和正常屏之间差异不够明显，导致常用的分类算法难以满足项目对分类准确度的要求。因此本文尝试了一种利用目标检测算法实现分类的方式，帮助改善单纯的分类的算法效果不够理想的问题。

核心技术与架构图

一般分类任务的流程如下图，首先需要收集数据，构成数据集；并为每一类数据定义一个类型标签，例如：0、1、2；再选择一个合适的分类网络进行分类模型的训练,图像分类的网络有很多，常见的有VggNet, ResNet，DenseNet等；最后用训练好的模型对新的数据进行预测,输出新数据的类别。

900×116 38.7 KB

目标检测任务的流程不同于分类任务，其在定义类别标签的时候还需要对目标位置进行标注；目标检测的方法也有很多，例如Fast R-CNN, SSD，YOLO等；模型训练的中间过程也比分类模型要复杂，其输出一般为目标的位置、目标置信度以及分类结果。

900×120 46.2 KB

由于分类算法依赖于一定量的数据，在项目实践中，数据量较少或图像类间差异较小时，传统分类算法效果不一定能满足项目需求。这时，不妨考虑用目标检测的方式来做‘分类’。接下来以Yolov5为例来介绍如何将目标检测框架用于实现单纯的分类任务。

技术实现

除了分类之外，目标检测还可以从自然图像中的大量预定义类别中识别出目标实例的位置。大家可能会考虑目标检测模型用于分类是不是过于繁琐或者用目标检测框架来做单纯的分类对代码的修改比较复杂。这里，我们将用一种非常简单的方式直接在数据标注和输出内容上稍作修改就能实现单纯的分类了。接下来将介绍一下具体实现方法：

no.1

数据的标注

OBJECT_DICT = {"Normalscreen": 0, "Colorfulscreen": 1, "Blackscreen": 2}
def parse_json_file(image_path):
    imageName = os.path.basename(image_path).split('.')[0]
    img = cv2.imread(image_path)
    size = img.shape
    label = image_path.split('/')[4].split('\\')[0]
    label = OBJECT_DICT.get(label)
    imageWidth = size[0]
    imageHeight = size[1]
    label_dict = {}
    xmin, ymin = (0, 0)
    xmax, ymax = (imageWidth, imageHeight)
    xcenter = (xmin + xmax) / 2
    xcenter = xcenter / float(imageWidth)
    ycenter = (ymin + ymax) / 2
    ycenter = ycenter / float(imageHeight)
    width = ((xmax - xmin) / float(imageWidth))
    heigt = ((ymax - ymin) / float(imageHeight))
    label_dict.update({label: [str(xcenter), str(ycenter), str(width), str(heigt)]})
    label_dict = sorted(label_dict.items(), key=lambda x: x[0])
    return imageName, label_dict

no.2

训练过程

# 加载数据，获取训练集、测试集图片路径
with open(opt.data) as f:
    data_dict = yaml.load(f, Loader=yaml.FullLoader)  
    with torch_distributed_zero_first(rank):
        check_dataset(data_dict) 
train_path = data_dict['train']
test_path = data_dict['val']
Number_class, names = (1, ['item']) if opt.single_cls else (int(data_dict['nc']), data_dict['names']) 

# 创建模型
model = Model(opt.cfg, ch=3, nc=Number_class).to(device)

# 学习率的设置
lf = lambda x: ((1 + math.cos(x * math.pi / epochs)) / 2) * (1 - hyp['lrf']) + hyp['lrf']  
scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)

# 训练
for epoch in range(start_epoch, epochs):  
model.train()

no.3

损失的计算

def compute_loss(p, targets, model):
    device = targets.device
    loss_cls, loss_box, loss_obj = torch.zeros(1, device=device), torch.zeros(1, device=device), torch.zeros(1, device=device)
    tcls, tbox, indices, anchors = build_targets(p, targets, model) 
h = model.hyp
    # 定义损失函数
    BCEcls = nn.BCEWithLogitsLoss(pos_weight=torch.Tensor([h['cls_pw']])).to(device)
    BCEobj = nn.BCEWithLogitsLoss(pos_weight=torch.Tensor([h['obj_pw']])).to(device)
    cp, cn = smooth_BCE(eps=0.0)
    # 损失
    nt = 0  
    np = len(p) 
    balance = [4.0, 1.0, 0.4] if np == 3 else [4.0, 1.0, 0.4, 0.1] 
for i, pi in enumerate(p): 
        image, anchor, gridy, gridx = indices[i]  
        tobj = torch.zeros_like(pi[..., 0], device=device) 
        n = image.shape[0]  
        if n:
            nt += n  # 计算目标
            ps = pi[anchor, image, gridy, gridx]
            pxy = ps[:, :2].sigmoid() * 2. - 0.5
            pwh = (ps[:, 2:4].sigmoid() * 2) ** 2 * anchors[i]
            predicted_box = torch.cat((pxy, pwh), 1).to(device)                     giou = bbox_iou(predicted_box.T, tbox[i], x1y1x2y2=False, CIoU=True)                 
       loss_box += (1.0 - giou).mean() 
            tobj[image, anchor, gridy, gridx] = (1.0 - model.gr) + model.gr *   giou.detach().clamp(0).type(tobj.dtype) 
            if model.nc &gt; 1:
                t = torch.full_like(ps[:, 5:], cn, device=device)
                t[range(n), tcls[i]] = cp
                loss_cls += BCEcls(ps[:, 5:], t)  
        loss_obj += BCEobj(pi[..., 4], tobj) * balance[i]  
    s = 3 / np
    loss_box *= h['giou'] * s
    loss_obj *= h['obj'] * s * (1.4 if np == 4 else 1.)
    loss_cls *= h['cls'] * s
    bs = tobj.shape[0]
    loss = loss_box + loss_obj + loss_cls
    return loss * bs, torch.cat((loss_box, loss_obj, loss_cls, loss)).detach()

no.4

对输出内容的处理

def detect(opt,img):
    out, source, weights, view_img, save_txt, imgsz = \
        opt.output, img, opt.weights, opt.view_img, opt.save_txt, opt.img_size
    device = select_device(opt.device)
    half = device.type != 'cpu'
    model = experimental.attempt_load(weights, map_location=device)
    imgsz = check_img_size(imgsz, s=model.stride.max())
    if half:
        model.half()
    img = letterbox(img)[0]
    img = img[:, :, ::-1].transpose(2, 0, 1)
    img = np.ascontiguousarray(img)
    img_warm = torch.zeros((1, 3, imgsz, imgsz), device=device)
    _ = model(img_warm.half() if half else img_warm) if device.type != 'cpu' else None 
    img = torch.from_numpy(img).to(device)
    img = img.half() if half else img.float()
    img /= 255.0
    if img.ndimension() == 3:
        img = img.unsqueeze(0)
    pred = model(img, augment=opt.augment)[0]
    # 应用非极大值抑制
    pred = non_max_suppression(pred, opt.conf_thres, opt.iou_thres, classes=opt.classes, agnostic=opt.agnostic_nms)
    # 处理检测的结果
    for i, det in enumerate(pred): 
        if det is not None and len(det):
            det[:, :4] = scale_coords(img.shape[2:], det[:, :4], img.shape).round()
            all_conf = det[:, 4]
            if len(det[:, -1]) &gt; 1:
                ind = torch.max(all_conf, 0)[1]
                c = torch.take(det[:, -1], ind)
detect_class = int(c)
            else:
                for c in det[:, -1]:
                    detect_class = int(c)
            return detect_class

效果展示

为了将视频帧进行黑、花屏分类，测试人员根据经验将屏幕分为正常屏（200张）、花屏（200张）和黑屏（200张）三类，其中正常屏幕标签为0，花屏的标签为1，黑屏的标签为2。

为了进一步说明该方法的有效性，我们将基于Yolov5的‘分类’效果与ResNet分类效果做了对比。根据测试人员对ResNet分类效果的反馈来看，ResNet模型容易将正常屏与花屏错误分类，例如，下图被测试人员定义为正常屏：

ResNet的分类结果为1，即为花屏，显然，这不是我们想要的结果。

基于Yolov5的分类结果为0，即为正常屏，这是我们所期待的结果。

同时，通过对一批测试数据的分类效果来看，Yolov5的分类效果比ResNet的分类准确度更高，ResNet的分类准确率为88%，而基于Yolov5的分类准确率高达97%。

总结

对于较小数据集的黑、花屏的分类问题，采用Yolov5来实现分类相较于ResNet的分类效果会更好一些。当我们在做图像分类任务时，纯粹的分类算法不能达到想要的效果时，不妨尝试一下用目标检测框架来分类吧！虽然过程稍微复杂一些，但可能会有不错的效果。目前目标检测框架有很多，用它们完成分类任务的处理方式大致和本文所描述的类似，可以根据数据集的特征选择合适目标检测架构来实现分类。本文主要介绍了如何将现有的目标检测框架直接用于单纯的图像分类任务，当然，为了使得结构更简洁，也可以将目标检测中的分类网络提取出来用于分类。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案的相关文章

Python 如何安装Selenium(推荐)

一 Selenium的定义 Selenium 是一个 Web的自动化测试工具最初是为网站自动化测试而开发的 Selenium 可以直接调用浏览器它支持所有主流的浏览器包括PhantomJS 这些无界面的浏览器可以接收指令让浏览器
软件测试开发/全日制/测试管理丨用户端 Web 自动化测试

随着Web应用的普及和不断发展用户端Web自动化测试成为确保Web应用质量的重要手段这种测试方法不仅提高了测试效率也帮助团队及时发现和解决潜在问题确保用户体验的连贯性和稳定性工具选择用户端Web自动化测试的第一步是选择适当的工具
最佳利用Mock提升测试效率的7个技巧！

再聊这个问题之前我们先了解一下公司技术架构的演变过程这样我们才能真正体会到我们为什么要使用 Mock功能单体应用在早期大部分公司的应用技术栈主要可以分为两大类 LAMP Linux Apache MySQL PHP 和 MVC S
软件测试/测试开发/全日制/测试管理丨Python关键字

Python 语言有一些关键字它们具有特殊的含义不能被用作标识符变量名函数名等 False 布尔类型的假值 None 表示一个空对象或无值 True 布尔类型的真值 and 逻辑与操作符 as 用于给导入的模块起别名 assert
测试用例评审流程优化

测试用例评审是QA日常工作流程中的关键一环是QA同学完善测试用例交流测试经验的好机会负责组内测试用例建设以来作者对于评审流程做了一些优化工作本文作者将整个优化过程中的心得体会做了一个总结希望能给大家带来帮助 01 原始流程 1
软件测试|Pydantic详细介绍与基础入门

简介 Pydantic 是一个强大的 Python 库用于数据验证和解析特别是用于处理 JSON 数据它的主要目标是使数据验证和解析变得简单直观和可维护本文将介绍 Pydantic 的基础知识包括如何定义模型验证数据以及处理错
软件测试|SQLAlchemy环境安装与基础使用

简介 SQLAlchemy 是一个强大的 Python 库用于与关系型数据库进行交互它提供了高度抽象的对象关系映射 ORM 工具允许使用 Python 对象来操作数据库而不必编写原生SQL查询本文将介绍如何安装 SQLAlchem
软件测试|web自动化测试神器playwright教程（三十八）

简介在我们使用selenium时我们可以获取元素的属性元素的文本值以及输入框的内容等作为比selenium更为强大的web自动化测试神器 playwright也可以实现对元素属性文本值和输入框内容的抓取并且实现比seleniu
软件测试|Python数据可视化神器——pyecharts教程（九）

使用pyecharts绘制K线图进阶版简介 K线图 Kandlestick Chart 又称蜡烛图是一种用于可视化金融市场价格走势和交易数据的图表类型它是股票外汇期货等金融市场中最常用的技术分析工具之一可以提供关于价格变动趋势
盲猜你不懂H5架构和原生架构的区别

2024软件测试面试刷题这个小程序永久刷题靠它快速找到工作了刷题APP的天花板 CSDN博客文章浏览阅读2 3k次点赞85次收藏11次你知不知道有这么一个软件测试面试的刷题小程序里面包含了面试常问的软件测试基础题 web自
跨平台UI自动化框架：Airtest，游戏开发和应用测试的利器

2024软件测试面试刷题这个小程序永久刷题靠它快速找到工作了刷题APP的天花板 CSDN博客文章浏览阅读2 3k次点赞85次收藏11次你知不知道有这么一个软件测试面试的刷题小程序里面包含了面试常问的软件测试基础题 web自
一篇文章带你了解Python常用自动化测试框架——Pytest

2024软件测试面试刷题这个小程序永久刷题靠它快速找到工作了刷题APP的天花板 CSDN博客文章浏览阅读2 3k次点赞85次收藏11次你知不知道有这么一个软件测试面试的刷题小程序里面包含了面试常问的软件测试基础题 web自
甜蜜而简洁 —— 深入了解Pytest插件pytest-sugar

在日常的软件开发中测试是确保代码质量的关键步骤之一然而对于测试报告的生成和测试结果的可读性一直以来都是开发者关注的焦点 Pytest插件 pytest sugar 以其清晰而美观的输出为我们提供了一种愉悦的测试体验本文将深入介绍
探索自动化测试断言：提升测试效率与质量的关键！

前言断言在自动化测试中起着关键的作用它是验证测试结果是否符合预期的重要手段如果在自动化测试过程中忽视了断言那么这个测试就失去了其本质的意义因为我们无法得知测试结果是否达到了预期的效果因此断言在自动化测试中的重要性不言而喻那么
2024拒绝行业内卷！八年软件测试20K*16薪行业心得想入行必看

目前工作做软件测试工作8年属于高级测试员那个级别吧现在看到各行各业的人都在转行学习软件测试想给大家一些学习建议和忠告很多粉丝都跟我说今年行情很差找不到工资真的找不到工作了吗我们常在网上看到的程序员饱和程序员过剩其实一般是
一文让你了解UI自动化测试

测试都起什么作用是项目的保险但不是项目的救命草测试无实际产出但作用远大于实际产出测试是从项目维度保证质量而不是测试阶段 UI自动化下面简称自动化基于UI进行自动功能测试以Web端作为例子一般的UI功能自动化都是基于HTM
15：00面试，15：06就出来了，问的问题有点变态。。。

从小厂出来没想到在另一家公司又寄了到这家公司开始上班加班是每天必不可少的看在钱给的比较多的份上就不太计较了没想到9月一纸通知所有人不准加班加班费不仅没有了薪资还要降40 这下搞的饭都吃不起了还在有个朋友内推我去了一家互联
Web自动化测试 —— capability参数配置

一 capability概述 capability是webdriver支持的标准命令之外的扩展命令配置信息配置web驱动属性如浏览器名称浏览器平台结合selenium gird完成分布式兼容性测试官网地址 https www
Airtest自动化测试工具

一开始知道Airtest大概是在年初的时候当时看了一下官方的文档大概是类似Sikuli的一个工具主要用来做游戏自动化的通过截图的方式用来解决游戏自动化测试的难题最近移动端测试的同事尝试用它的poco库来做自动化看样子还不错
软件测试面试：还没有自动化测试项目经验，3个项目帮你走入软测职场！

2024软件测试面试刷题这个小程序永久刷题靠它快速找到工作了刷题APP的天花板 CSDN博客文章浏览阅读2 3k次点赞85次收藏11次你知不知道有这么一个软件测试面试的刷题小程序里面包含了面试常问的软件测试基础题 web自

随机推荐

Vue中值得关注的21个开源项目（推荐）

Vue 相对不于 React 的一个优点是它易于理解和学习 xff0c 且在国内占大多数咱们可以在 Vue 的帮助下创建任何 Web 应用程序因此 xff0c 时时了解一些新出现又好用的Vue 开源项目也是挺重要 xff0c 一方面可以
javaScript面向对象的三个基本特征介绍

了解过面向对象的同学应该都知道 xff0c 面向对象三个基本特征是 xff1a 封装继承多态 xff0c 但是对于这三个词具体可能不太了解对于前端来讲接触最多的可能就是封装与继承 xff0c 对于多态来说可能就不是那么了解了封装在
7个实用的CSS background-image小技巧

xff08 推荐教程 xff1a CSS教程 xff09 background image可能是我们所有人 xff08 前端开发人员 xff09 在我们的职业生涯中至少使用过几次的CSS属性之一大多数人认为背景图像没有什么不寻常的 xff
值得收藏的css grid构建复杂布局的小技巧！

xff08 推荐教程 xff1a CSS教程 xff09 网格布局是现代CSS中最强大的功能之一使用网格布局可以帮助我们在没有任何外部 UI 框架的情况下构建复杂的快速响的布局在这篇文章中 xff0c 将会介绍所有我们需要了解的 CS
10个值得了解的Chrome开发工具和技巧

1 模拟慢速网络和慢速设备我们可能习惯了在城市的网速 xff0c 那是杠杠的 xff0c 并不意味网速在中国哪个都一样的 xff0c 在一些偏远地方 xff0c 网速依然慢的可怜 xff0c 所以有时候我们所做的产品是需要考虑网速慢的情况
JS中判断变量是否为数字方法

推荐教程 xff1a JavaScript视频教程 JavaScript 是一种动态类型语言 xff0c 这意味着解释器在运行时确定变量的类型实际上 xff0c 这也允许我们在相同的代码中使用相同的变量来存储不同类型的数据如果没有文档和
vue+webpack2实现路由懒加载的方法介绍

下面Vue js教程栏目给大家介绍一下vue 43 webpack2实现路由的懒加载的方法有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望对大家有所帮助当打包构建应用时 xff0c Javascript 包会变得
JS Math对象的10 个实用方法

推荐教程 xff1a JavaScript视频教程 JavaScript中的math 对让我们能够对执行一些数学操作它具有数学常数和函数的属性和方法在今天的文章中将介绍 Math对象的一些有用方法 1 Math min Math min
PDF文档电子公章的初试

PART 1 大家在日常生活中经常会接触到电子公章 xff0c 比如电子发票上一般会包含电子公章信息 xff0c 比如下图发票中就带有两个电子公章 xff0c 顶部的公章是普通的图形公章 xff0c 右下角的电子公章不仅包含图形公章还包含了
css grid构建复杂布局的小技巧

xff08 推荐教程 xff1a CSS教程 xff09 网格布局是现代CSS中最强大的功能之一使用网格布局可以帮助我们在没有任何外部 UI 框架的情况下构建复杂的快速响的布局在这篇文章中 xff0c 将会介绍所有我们需要了解的 CS
vue.js中使用v-for以及获取索引的方法介绍

下面Vue js教程栏目带大家了解一下vue js中v for的使用及索引获取有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望对大家有所帮助 2 x版本 xff1a v for 61 34 item index i
HTML网页自动跳转的5种方法

xff08 推荐教程 xff1a html教程 xff09 在我们进行网站创建时经常会遇到需要进行网页跳转的情况 xff0c 本文就来为大家介绍五种网页自动跳转的方法有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望
深入讨论JavaScript中Set对象如何让代码更快

我确信有很多开发人员坚持使用基本的全局对象 xff1a 数字 xff0c 字符串 xff0c 对象 xff0c 数组和布尔值对于许多用例 xff0c 这些都是需要的但是如果想让你的代码尽可能快速和可扩展 xff0c 那么这些基本类型并不
ES6中的for ... of循环和可迭代对象

推荐教程 xff1a JavaScript视频教程本文将研究 ES6 的 for of 循环有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望对大家有所帮助旧方法在过去 xff0c 有两种方法可以遍历 java
8个编写JS代码的小技巧和窍门

下面js教程栏目给大家介绍8个编写javascript代码的技巧和窍门有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望对大家有所帮助推荐教程 xff1a JavaScript视频教程 1 生成指定区间内的数字有
浅谈css z-index应用

做过页面布局的同学对z index属性应该是很熟悉了 xff0c z index是针对网页显示中的一个特殊属性因为显示器是显示的图案是一个二维平面 xff0c 拥有x轴和y轴来表示位置属性为了表示三维立体的概念如显示元素的上下层的叠加顺
jquery中怎样将类数组对象转换为数组对象

相关推荐 xff1a jQuery视频教程类数组对象的定义 xff1a 所谓 34 类数组对象 34 就是一个常规的Object对象 xff0c 如 34 p 34 但它和数组对象非常相似 xff1a 具备length属性 xff0c 并
理解对象原型和原型链

本篇文章带大家介绍一下JavaScript中的对象原型和原型链有一定的参考价值 xff0c 有需要的朋友可以参考一下 xff0c 希望对大家有所帮助对象原型相信大家都这样用过 map xff1a let arr 61 0 1 2 le
JavaScript中处理异步的几种方式

在网站开发中 xff0c 异步事件是项目必然需要处理的一个环节 xff0c 也因为前端框架的兴起 xff0c 通过框架实现的 SPA 已经是快速建构网站的标配了 xff0c 一部获取数据也就成了不可或缺的一环 xff1b 本文来就讲一讲 J
软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案

背景视频帧的黑花屏的检测是视频质量检测中比较重要的一部分 xff0c 传统做法是由测试人员通过肉眼来判断视频中是否有黑花屏的现象 xff0c 这种方式不仅耗费人力且效率较低为了进一步节省人力提高效率 xff0c 一种自动的检测方法

软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案

软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案 的相关文章

随机推荐

热门标签

软件测试 | 测试开发 | 一种基于目标检测实现黑花屏分类任务的方案的相关文章