无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数

2023-11-17

在自监督深度估计中，一般输入2张图像（若为视频，则输入邻近的两帧图像）frame1和frame2，模型先估计相机拍摄这2张图像是的姿态变化pose，然后根据pose将frame1变换到frame2的视角下，得到合成图像synthetic frame1。

估算的pose越准确，synthetic frame1与frame2的图像相似度就越高。那么，常用SSIM（结构相似性）来评价这两张图片的相似度。

若希望详细了解单目深度估计，可参考文章《动态场景下的单目深度估计》、《Instance-wise Depth and Motion Learning from Monocular Videos》和《MonoDepth2_单目深度估计》。

SSIM

用于检测两张尺寸相同的图像的相似度，它主要通过分别比较两个图像的亮度(l)、对比度(c)、结构(s)，然后对这三个要素加权并乘积表示，在论文中这三个要素用下面公式来表示：

这里 μx 为均值，σ 为方差，σxy 表示协方差。这里 C1、C2、C3 是为了避免当分母为 0 时造成的不稳定问题（所以写算法的时候可以放心，一定不会出现除 0 的情况）。

而 SSIM 的一般方程为：

这里一般 $\alpha$ , $\beta$ , $\gamma$ 取1，并且令 C3=0.5*C2，这样就得到简化的 SSIM 公式：

c_1=(k_1*L)^2，c_2=(k_2*L)^2是用来维持稳定的常数。L是像素值的动态范围。k_1=0.01,k_2=0.03。
结构相似性的范围为-1到+1（即SSIM∈(-1, 1]）。当两张图像一模一样时，SSIM的值等于1。

tensorflow实现代码，戳here，滑至末尾

pytorch code

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数的相关文章

依赖项注入

ASP NET Core 通过依赖关系注入 DI 生成服务如数据库上下文在 Program cs 中向 DI 注册这些服务通过构造函数参数提供给需要它们的组件在 Controllers MoviesController cs 文件
rsyslogd、syslog远程传输、日志存储、转存

一产生本地日志 1 etc resolv conf 配置文件 local0 local7是用户自定义的日志这里我们使用local1 添加以下 local1 www admin admin log web log 配置完需要重启 rsys
DNS 解析一个地址的时候会返回多个 IP 吗？

这是一个或许对你有用的社群一对一交流面试小册简历优化求职解惑欢迎加入芋道快速开发平台知识星球下面是星球提供的部分资料项目实战视频从书中学往事上练互联网高频面试题面朝简历学习春暖花开架构 x 系统设计摧枯拉
nginx php-fpm 分别安装在不同的机器（理解nginx和php-fpm)

先起一个ubuntu的docker docker run ti name test1 ubunt 然后安装php5 fpm apt get install php5 fpm 配置fpm 允许从其他机器访问 listen 9000 默认是12
树实现客户端红点系统

树实现客户端红点系统红点系统总览 demo 设计代码设引用 https zhuanlan zhihu com p 85978429 红点系统总览如上图所示规划红点系统的时候我们将整个系统分为独立的三个部分结构层驱动层和表现层
C++ 循环练习第2题：输出一个整数序列中与指定数字相同的数的个数。输入包含2行:第1行为n和m，表示整数序列的长度n＜=100和指定的数字；第2行为n个整数，整数之间以一个空格分开。输出为n个数中与

C 循环练习第2题输出一个整数序列中与指定数字相同的数的个数输入包含2行第1行为n和m 表示整数序列的长度n lt 100和指定的数字第2行为n个整数整数之间以一个空格分开输出为n个数中与m相同的数的个数 1 题目 2 循环解决
计算机网络——第4章网络层（上）

目录第 4 章网络层上基本概念 IP地址基本概念 IP地址结构 ABC三类IP地址 A类 B类 C类子网地址的结构子网掩码无类域间路由技术CIDR CIDR地址块 CIDR地址规划方法最长前缀匹配 IP地址相关的解题步骤
[Docker]使用Docker部署常见的中间件

theme healer readable highlight xcode 本篇文章给大家介绍如何使用 Docker 部署在企业工作中常用的中间件服务 Nginx shell docker run d p 80 80 name nginx

随机推荐

C++虚函数解析

C 中的虚函数的作用主要是实现了多态的机制关于多态简而言之就是用父类型别的指针指向其子类的实例然后通过父类的指针调用实际子类的成员函数这种技术可以让父类的指针有多种形态这是一种泛型技术所谓泛型技术说白了就是试图使用不变
java进程的远程调试

java进程的远程调试一 jdb调试 mqbroker jvm参数配置 2 利用jdb idea eclipse 远程调试同本地调试一样二 jvisualvm jvm 监视使用jstatd连接 nohup JAVA HOME bin
java读取excel方法是_【转】Java读取Excel文件的几种方法

读取excel文件的常用开源免费方法有以下几种 JDBC ODBC Excel Driver jxl jar jcom jar poi jar 下面分别对这几种方法分别进行探讨 1 JDBC ODBC Excel Driver 这种方法是将
jenkins始终无法正确使用git的解决方案

在安装jenkins后选定git的版本 git版本需要再1 7以上才行在jenkins中设置git的执行路径一定要检查是否是正确的 1 error Peer certificate cannot be authenticated wi
MySQL分表后，如何做分页查询？

点击关注公众号 Java干货及时送达来源 blog csdn net joy tom article details 109857573 随着项目运行的时间越来越长有些数据的存储也会越来越大比如一些点击量浏览量量单表的数据可以到达
辐射定标、辐射校正、大气校正、正射校正等相关概念

作为初学者容易将这几个概念搞混为了较好地理解这几个概念先介绍一下相关的术语 terminology DN值 Digital Number 遥感影像像元亮度值记录地物的灰度值无单位是一个整数值值大小与传感器的辐射分辨率地物发射
Python学习笔记综合

一安装和学习建议 1 使用的2 7 2 环境变量 python的根目录 3 cmd就可以运行执行使用 python xxx py 4 编写代码可以直接python进入代码编辑 5 exit 退出编辑环境安装与学习建议 pycharm专
图像生成王者不是GAN？扩散模型最近有点火：靠加入类别条件，效果直达SOTA

博雯发自凹非寺量子位报道公众号 QbitAI OpenAI刚刚推出的年末新作GLIDE 又让扩散模型小火了一把这个基于扩散模型的文本图像生成大模型参数规模更小但生成的图像质量却更高于是依旧是OpenAI出品论文标题就直接号
【RPA经验分享】远程桌面最小化或关闭状态运行 RPA

了解RPA www i search com cn 学习RPA https support i search com cn 一问题描述当我们使用 window 自带的远程工具连接远程服务器并运行自动化流程最小化远程窗口或关闭窗口后自动
任意输入一长度不超过30的字符串，使用指针编写函数，实现如下功能：将一个字符串str1中的所有小写字母复制成为一个新的字符串str2。

任意输入一长度不超过30的字符串使用指针编写函数实现如下功能将一个字符串str1中的所有小写字母复制成为一个新的字符串str2 例如若str1为 progRam Cczuoye 19 则str2应为 progamczuoye 要求
JMeter 批量接口测试

一背景最近在进行某中台的接口测试准备发现接口数量非常多有6 70个而且每个接口都有大量的参数并且需要进行各种参数验证来测试接口是否能够正确返回响应值想了几种方案后决定尝试使用JMeter的csv读取来实现批量的接口测试接口测
雷辉：让视频会议conferencing like TV

伴随视频会议技术不断成熟其功能已不局限于早期仅仅满足异地会议的需求打破硬件的桎梏提供白板多媒体播放文档协同等更多功能如何为视频会议赋予更强大功能实现更好体验满足更多办公需求成为一个新的课题 LiveVideoStack邀请到
测试人员必备：常用自动化测试工具

Appium 官网 http appium io AppUI自动化测试 Appium 是一个移动端自动化测试开源工具支持iOS 和Android 平台支持Python Java 等语言即同一套Java 或Python 脚本可以同时运行
并发编程系列之CountDownLatch对战Cyclicbarrier

前言前面我们介绍了并发容器和队列今天我们来介绍几个非常有用的并发工具类今天主要讲CountDownLatch和Cyclicbarrier这两个工具类通过讲解并对比两个类的区别 OK 让我们开始今天的并发之旅吧什么是CountDow
Python爬虫学习-第四篇 Scrapy框架抓取唯品会数据

上篇博文讲述了scrapy的框架和组件对于scrapy有了基本的了解那么我们进入今天的正题使用Scrapy框架爬取数据 1 创建Scrapy项目创建Scrapy工程文件的命令 scrapy startproject scrapyte
java实现飞机大战（简单版）

import javafx animation AnimationTimer import javafx application Application import javafx scene Group import javafx sce
java压缩字符串并生成二维码

针对特殊需求需要使用二维码传输数据为了降低二维码的复杂度和提高数据传输量需要先对数据进行压缩然后生成二维码压缩后的数据是byte 如果再转回字符串会严重影响压缩效果因此考虑直接使用byte 生成和解析二维码为了实现使用byte
解决 “/lib64/libc.so.6: version `GLIBC_2.18‘ not found (required by /lib64/libstdc++.so.6)“

https blog csdn net wiborgite article details 87707938
基于RedHat 8.2源码编译升级Kernel 5.8.1

1 基于RedHat 8 2源码编译升级Kernel 5 8 1 1 1 背景只是单纯为了验证工作中遇到的一个bug 才诞生了此文 1 2 先从如下网址下载内核源码包我这里下载的是 linux 5 8 1 tar gz 大家可根据自己需
无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数

在自监督深度估计中一般输入2张图像若为视频则输入邻近的两帧图像 frame1和frame2 模型先估计相机拍摄这2张图像是的姿态变化pose 然后根据pose将frame1变换到frame2的视角下得到合成图像synthetic f

无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数

无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数 的相关文章

随机推荐

热门标签

无监督深度估计、运动估计的深度学习方法(二）——SSIM损失函数的相关文章