【达摩院OpenVI】图像MOS评价协助清理“垃圾”照片

2023-10-29

团队模型、论文、博文、直播合集,点击此处浏览

一、背景

MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。使用基于深度学习模型进行客观MOS评价相比传统的基于主观评价的方法,有以下一些好处:

a.)高效性:相比于传统的主观评价方法需要大量受试者进行评估,使用深度学习模型可以大大减少评估时间和人力成本,从而提高评估效率。

b.)一致性:深度学习模型可以通过训练来学习人类主观评价的规律和模式,从而使得评估结果更加一致和准确。

c.)可重复性:使用深度学习模型进行评价可以使得评估结果具有可重复性,不会像传统的主观评价方法一样受到个体差异的影响。

d.)适配性好:传统的主观评价方法需要大量人力和时间成本,使得其在实际应用中受到一定限制。而深度学习模型可以在大规模数据集上进行训练,从而可以在更广泛的场景下进行应用。

与传统的有参考评价方法PSNR, SSIM, VMAF等指标相比:1.)MOS评价不需要参考图,更契合终端用户的使用场景; 2.)传统评价方法仅仅考虑图像像素的差异,而忽略了人类视觉系统对图像质量的感知。而使用深度学习模型进行视觉MOS评价有效考虑到人类主观评价的因素,从而更加准确地衡量图像质量;

总之,使用深度学习模型进行视觉MOS评价可以提高评估效率和准确性,同时也可以使得评估结果具有更好的可重复性和更广泛的应用范围。效果如下图所示:

二、方法

客观MOS评价模型的原理是通过收集人类主观评估数据,并对数据进行特征提取和建模,自动分析图像的不同特征,例如对比度、清晰度和色彩饱和度等,并生成一个与人类主观意见相似的MOS分数。最终将该模型应用于新的图像、视频数据,实现了客观地评估媒体内容质量的目的。应用到终端用户的手机中,可以但不限于自动评价相册中海量图像、视频质量,并挑选其中的高画质内容进行二次创作,或者移除低画质内容以优化存储空间。

三、体验

体验网址:https://www.modelscope.cn/models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC/summary

方法1:模型即服务

首先打开notebook,可以通过示例右上角快速体验创建账号申领。或者根据本地环境安装(查看文档中“Python环境配置”部分),等到环境ready后,试跑如下示例代码:

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.outputs import OutputKeys

img = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/dogs.jpg'
image_quality_assessment_pipeline = pipeline(Tasks.image_quality_assessment_mos, 'damo/cv_resnet_image-quality-assessment-mos_youtubeUGC')
result = image_quality_assessment_pipeline(img)[OutputKeys.SCORE]
print(result)

这样就完成了模型即服务的AI功能调用了。

方法2:使用在线体验功能

打开模型链接, 按下图所示步骤:

1. 上传图片,将待测图片手动上传。

2. 执行测试,云端推理引擎会对上传图像进行mos预测。

3. 显示结果,最终的结果会显示在框中。结果为浮点数,范围[0, 1]值越大代表图像质量越高。

四、应用

除了上述模型外,modelscope社区还上线了包括去噪、超分、调色、上色等多种视频图像修复增强算法。任何低质量的原始视频,都能够在增强修复后变得焕然一新,让你享受到极致高清、饱满、丝滑的视频观看体验。点击链接https://www.modelscope.cn/models?page=1&tasks=vision-editing&type=cv可体验多种视觉编辑功能。

视觉评价是底层视觉的一部分,能有替代人工高效完成画质评估工作,欢迎大家体验该类其他算法模型:异常帧检测图像画质损伤分析

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【达摩院OpenVI】图像MOS评价协助清理“垃圾”照片 的相关文章

随机推荐

  • 进阶训练技巧提升模型性能

    在深度学习的世界中 训练技巧的重要性不言而喻 进阶训练技巧 包括损失函数 学习率 模型微调和半精度训练 更是对提升模型性能和准确率有着关键作用 下面我们将对这些技巧进行详细的探讨 一 损失函数 Loss Function 损失函数 或者叫作
  • 遍历map

    keySet是键的集合 Set里面的类型即key的类型 entrySet是 键 值 对的集合 Set里面的类型是Map Entry 1 keySet Map map new HashMap Iterator it map keySet it
  • 代码审计之JAVA代码审计洞态IAST系统以及SecExample靶场

    目录 2 JAVA系列代码审计 2 1 工具介绍 2 2 SecExample靶场安装 2 3 洞态IAST安装 2 3 洞态IAST使用 2 JAVA系列代码审计 之前我们都是采用代码审计工具对PHP代码进行审计 但是在实际的工作中对于从
  • unipush2.0教程

    解释一下名词 透传消息 无论手机app 是否在运行 打开了 还是清了后台 关闭 都可以收到消息 通知消息 只能app打开了 才能收到 1 开通unipush 2 点击上图的unipush2 0下面的配置 进入以下页面 选择平台 将其余项配置
  • tidb存储基本原理

    tidb是什么 tidb是分布式关系型数据库 需要从两个方面来理解tidb 分布式数据库 关系型数据库 什么是分布式系统 集中式系统 计算和存储在同一个节点上 分布式系统 计算和存储位于不同的节点上 分布式系统把需要进行大量计算的工程数据分
  • Unity3D持久化存储(一) PlayerPrefabs

    文章目录 PlayerPrefabs介绍 常用方法 存储数据 读取数据 查看数据 删除数据 PlayerPrefabs介绍 PlayerPrefabs是Unity内置的持久化存储类 可存储Float Int和String类型的数据 数据存储
  • AJAX传中文参数乱码问题解决

    当利用XMLHttpRequest提交中文数据到服务器端时候 ajax默认编码为utf8 提交中文会发生乱码 为了解决这个问题 baidu了一天 研究了一天 现在把这些心得写下来 以备忘 我这人健忘 首先明确一点 要想彻底没有乱码的烦恼 那
  • [论文阅读]《Database Maanagement Systems》-第三章

    第三章 THE RELATIONAL MODEL 关系模型 P75 P112 synopsis 概要 大纲 supplanted 代替 排挤掉 by far 到目前为止 Prototype relational database 原型关系数
  • Jetpack学习之Navigation

    Jetpack提供了一个名为Navigation的组件 用来管理页面 Actvity和Fragment 以Fragment为主 和App bar Navigation的优势 可视化的页面导航图 便于理清页面间的关系 通过destinatio
  • Java基础:Java的优点和缺点

    优点 1 跨平台 可移植性 是Java的核心优势之一 Java的运行是通过JVM来实现的 只需要在操作系统上安装对应的虚找机即可运行 节省代码重复编写时间 2 面向对象 Java是完全的面向对象语言 非常适合大型软件的设计和开发 3 简单性
  • 使用Vue调用后台接口

    最近在学习使用vue 看完调接口之后 立马使用springboot作为后台 跃跃欲试 很尴尬 刚刚写完一个后台 vue调用就出错了 1 跨域的问题 我还以为是需要的接口和我的接口不一致 后来知道并不是端口问题 解决办法 前台vue的调用地址
  • 利用script标签实现的跨域名AJAX请求(ExtJS)

    在AJAX应用环境中 由于安全的原因 浏览器不允许XMLHttpRequest组件请求跨域资源 在很多情况下 这个限制给我来带来的诸多不便 很多同行 研究了各种各样的解决方案 1 通过修改document domain和隐藏的IFrame来
  • Java中常见的异常总结,Exception如何捕获和处理

    什么是异常 异常机制 异常机制是指当程序出现错误后 程序如何处理 具体来说 异常机制提供了程序退出的安全通道 当出现错误后 程序执行的流程发生改变 程序的控制权转移到异常处理器 通俗一点来说 就是为了让程序不被中断 继续执行 程序错误 1
  • 13-2_Qt 5.9 C++开发指南_线程同步_QMutex+QMutexLocker(目前较为常用)

    文章目录 1 线程同步的概念 2 基于互斥量的线程同步 3 QMutex实现线程同步源代码 3 1 qdicethread h 3 2 qdicethread cpp 3 3 dialog h 3 4 dialog cpp 4 QMutex
  • AI资讯--2017年资讯汇总

    九个研究方向 持续学习 Continual learning 可解读的决策 Explainable decisions 安全飞地 Secure enclaves 对抗学习 Adversarial learning 在保密数据上共享学习 Sh
  • Beanutils.copyProperties

    BeanUtils提供对Java反射和自省API的包装 其主要目的是利用反射机制对JavaBean的属性进行处理 使用效果 使用前 UserInfo userInfo UserInfo form User user new User use
  • 搭建菜谱应用微信小程序-前后端

    搭建菜谱应用微信小程序 前后端 框架简析 后端使用TP6框架 mysql 前端使用uni app 代码 框架简析 后端使用TP6框架 mysql 使用了这个项目来修改精简 https gitee com jameson512 novelap
  • Spring Cloud学习笔记【消息总线-SpringCloud Bus】

    SpringCloud Bus概述 概述 Spring Cloud Bus是Spring Cloud生态系统中的一个组件 用于实现微服务架构中的消息总线 它利用了轻量级消息代理 如RabbitMQ或Kafka 作为通信中间件 实现了在分布式
  • EaseUS Data Recovery Wizard Technician数据恢复软件安装

    EaseUS Data Recovery Wizard Technician是最好的数据恢复软件 可以解决所有的数据丢失问题 支持从硬盘 外置硬盘 U盘 存储卡 数码相机 手机 音乐播放器等存储介质中恢复因删除 格式化 软件崩溃 硬盘损坏
  • 【达摩院OpenVI】图像MOS评价协助清理“垃圾”照片

    团队模型 论文 博文 直播合集 点击此处浏览 一 背景 MOS Mean Opinion Score 是一种常用的主观质量评价方法 常用于视频 图像等多媒体领域中的质量评价 MOS视觉评价通常是通过让受试者观看视频 图像 对视频的清晰度 锐