机器学习笔记 soft-DTW（论文笔记 A differentiable loss function for time-series）

2023-11-16

1 soft-DTW来由

DTW 算法通过动态规划求解了两个序列的相似度。这个过程1是离散的，不可微的。如果要将其应用作为神经网络的损失函数，这是不行的。因为神经网络通过对损失函数结果进行梯度下降的方法，更新参数，要求损失函数可微。

2 符号说明

论文“A differentiable loss function for time-series”（2017 ICML）中使用了 Soft minimum 来代替 DTW minimum

对于两个序列和，我们定义代价矩阵，其中δ是可微代价函数（某一时刻x上的p维信息+某一时刻y上的p维信息——>一个实数值）【通常δ(·,·)可以用欧几里得距离】

3 soft-DTW原理

定义集合，为路径上的代价和 $r_{i,j}$ 组成的集合（从(0,0)到(i,j)的最小开销路径的cost）

如果是DTW，那么它的动态规划式子为

如1所说，由于min是一个离散的过程，不可微，所以这导致了DTW的离散。

于是Soft-DTW使用了连续的soft-min

当γ=0的时候，就是DTW，否则他就是一个可微的式子

（在max函数的平滑（log-sum-exp trick）_UQI-LIUWJ的博客-CSDN博客中，我们知道

$log(\sum_{i \in [1,n]}e^{x_i})=log(\sum_{i \in [1,n],i \ne j}e^{x_i}+e^{x_j}) \approx log(e^{x_j})=x_j=max \{x_1,\dots,x_n \}$

那么这里也是类似的

$min(a_1,a_2,\dots,a_n)=-max(-a_1,-a_2,\dots,-a_n)$

$=-log (\sum_{i \in [1,n]} e^{-a_i})$

$=-log [\sum_{i \in [1,n]} (e^\frac{{-a_i}}{\gamma})^\gamma]$

这里这篇论文做了一个近似

$\approx -log [\sum_{i \in [1,n]} (e^\frac{{-a_i}}{\gamma})]^\gamma$

也就等于了

3.1 前向传播

定义，这是一个集合，其中的每一个元素A是一个矩阵，该矩阵表示两个时间序列x和y之间的对齐矩阵（alignment matrix）

对于一个特定的对齐矩阵，A中只有在(1,1)到(n,m)路径上的点(i,j)，其 $a_{i,j}$ =1，其他点的 $a_{i,j}$ 都是0。

以DTW中出现过的图为例，那种情况下的A矩阵，在红色箭头上的(i,j)，其 $a_{i,j}$ =1，其余点的 $a_{i,j}$ 均为0DTW 笔记： Dynamic Time Warping 动态时间规整（&DTW的python实现）_UQI-LIUWJ的博客-CSDN博客

换句话说， $A_{n,m}$ 中包含了所有(1,1)到(n,m)的路径（每个路径是一个矩阵，每个矩阵只有路径上的元素为1）

于是矩阵内积<A，Δ(x,y)>表示这条路径下的代价和（非这条路径上的点乘0，这条路径上的点乘1，再求和）

于是，soft-dtw的目标函数为

3.1.1 算法伪代码

如果γ=0的时候，也就退化为了DTW，这里不同的是，我们需要关注γ＞0的情况

3.2 反向传播

soft-DTW的目的是为了计算时间序列x和时间序列y之间的动态扭曲距离，y是目标序列的话，我们反向传播计算的是对时间序列x的梯度，也即

通过链式法则，我们有

这里的分子和分母都是矩阵，所以线性代数笔记：标量、向量、矩阵求导_UQI-LIUWJ的博客-CSDN博客

也就是在我们的问题中， $\frac{\partial \Lambda_i}{\partial x_j}$ 都是一个p×m维矩阵，那么整体上是一个np×nm的矩阵（记

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

论文笔记

机器学习

算法

人工智能

机器学习笔记 soft-DTW（论文笔记 A differentiable loss function for time-series）的相关文章

矩阵基本操作2

题目描述问题描述将方阵 n 行n列 n lt 100 置成下三角矩阵主对角线右上角数字全部清零输入格式第一行输入n 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式 n行n列下三角矩阵每个数字3个占位符左对齐输入样
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
机器学习算法实战案例：LSTM实现多变量多步负荷预测

文章目录 1 数据处理 1 1 数据集简介 1 2 数据集处理 2 模型训练与预测 2
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与
5_机械臂运动学基础_矩阵

上次说的向量空间是为矩阵服务的 1 学科回顾从科技实践中来的数学问题无非分为两类一类是线性问题一类是非线性问题线性问题是研究最久理论最完善的而非线性问题则可以在一定基础上转化为线性问题求解线性变换数域 F 上线性空间V中的变
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
对中国手机作恶的谷歌，印度CEO先后向三星和苹果低头求饶

日前苹果与谷歌宣布合作发布了 Find My Device Network 的草案旨在规范蓝牙追踪器的使用在以往苹果和谷歌的生态形成鲜明的壁垒各走各路如今双方竟然达成合作发生了什么事首先是谷歌安卓系统的市场份额显著下滑数年来

随机推荐

基于python多光谱遥感数据处理、图像分类、定量评估及机器学习方法应用

普通数码相机记录了红绿蓝三种波长的光多光谱成像技术除了记录这三种波长光之外还可以记录其他波长例如近红外热红外等光的信息与昂贵不易获取的高光谱高空间分辨率卫星数据相比中等分辨率的多光谱卫星数据可以免费下载获取例如 l
android pull 解析xml

Pull简介 1 常见的XML解析方式有三种 DOM SAX Pull Android系统中推荐使用Pull 2 Pull解析器是一个开源的Java项目 Android系统内部解析XML文件均为此种方式也可用于JavaEE项目 3 And
Python Pymem 游戏内存基址读取修改 - 获取游戏DLL模块基址

运行环境 python3 9 0 64位安装pymem pip install pymem Pymem 的文档 https pymem readthedocs io en latest 读取游戏模块DLL基址完整代码 import py
Java NIO框架Mina、Netty、Grizzly介绍与对比

目录 Java NIO框架MinaNettyGrizzly介绍与对比 Mina Netty Grizzly 结语 Java NIO框架Mina Netty Grizzly介绍与对比原文链接 http www 24xuexi com w 2
一文带你沉浸式感受黑马实战项目研发过程

我们必须拒绝Demo式项目拒绝技术堆叠式项目要让学生学到真本领在传智研究院严格的项目课程新标准下黑马JavaEE学科再添真实企业级新项目天机学堂历时近1年才能上线的项目课程背后又藏着哪些让学生高薪理想就业的秘密一文带你揭晓
变化多端 – 多种纯CSS的HTML表格设计

介绍在HTML中 Table节点由于其层层嵌套的节点结构一度名声很臭且一度被呼吁用DIV CSS取而代之但在实际项目开发中一碰到规整的数据显示不知不觉又会用起它可见其生命力之顽强这儿就探讨下几种不同的通过CSS实现的Tabl
PCL RANSAC分割提取多个空间圆

目录一概述二代码实现三结果展示 1 原始数据 2 提取结果四测试数据本文由CSDN点云侠原创原文链接如果你不是在点云侠的博客中看到该文章那么此处便是不要脸的爬虫一概述使用PCL分割提取多个空间圆其核心原理仍然
Rancher安装、部署、使用

1 搭建rancher平台 1 通过实训平台进入到操作系统界面在后输入vi etc sysconfig docker命令编辑配置文件示例代码如下 root xxx home vi etc sysconfig docker 按i 小写
刷脸免单打折领红包带动消费者进店二次消费

刷脸自动扣款效率高耗时少避免消费者长时间排队等待不需要拿出手机打开微信打开扫一扫或者收付款等一系类繁杂的动作省去了记密码输密码的麻烦实现了人与钱包或银行卡的合二为一消费者方便也更愿意来您家消费手机没电不拿手机也能付
C精华练习系列（2）

C 练习实例6 题目用号输出字母C的图案程序分析可先用号在纸上写出字母C 再分行输出参考代码为 include
可重入锁简单理解

可重入锁指的是以线程为单位当一个线程获取对象锁之后这个线程可以再次获取本对象上的锁而其他的线程是不可以的 synchronized 和 ReentrantLock 都是可重入锁可重入锁的意义之一在于防止死锁实现原理实现是通过为每
照片怎样变漫画图片？建议收藏这些方法

小伙伴们平时喜欢在社交平台上发布一些照片的动态吗那有没有发现别人的一些照片动态很好看有漫画照片文字照片边框照片等多种多样的效果有小伙伴羡慕别的照片问什么这么多样吗其实你们也可以做到的只需要使用软件就可以帮助我们完成这些照片编
JPM Coin 三部曲 (中) - 摩根大通为何青睐 Quorum 区块链

本篇是三部曲的第二部分聊一聊 JPM coin 背后的区块链网络 Quorum 详解其特点共识机制及其如何满足传统银行业的商业需求 Quorum 被认为是企业级以太坊从2016年起由摩根大通银行启动的开源项目 https gith
为什么有两台计算机WINDOWS,你有两台运行Windows7的计算机分别命名为Computer1和Computer2。这两台计算机都是一个活动目录域的成员,两台计算机上都启用了Windows远程管理...

YourcompanyhastwodomaincontrollersthatareconfiguredasinternalDNSservers AllzonesontheDNSserversareActiveDirectory integr
Git没有权限

Git 没有权限出现下面图片错误的请在系统盘 C盘找到用户文件夹进入后找到管理员文件夹下有个 gitconfig 删除掉然后在用命令进行克隆链接 git clone http XXXXX git 自动会跳出让你输入Git用户名
Python的学习过程中not enough values to unpack (expected 2, got 1)解决方案

这是一篇在自学过程中debug的笔记愿我们一同进步问题描述跟着小甲鱼一起学习Python 在学习到文件的时候有一个代码任务内容是根据两个人物之间的三段对话对话进行分割提取操作运行时报错主要报错为not enough valu
程序员到底在恐慌什么？

点击上方 iOS开发选择置顶公众号关键时刻第一时间送达程序员们会觉得恐慌么有时候我会或者说现在也会这种恐慌大概是在上学的时候就有了上学的时候我不知道怎么入门去书店里看书 C VisualBasic Java C C P
智慧企业转型升级蓝图附下载地址

2020年的猛烈震荡让各行业面临的挑战急剧升级企业经营更是险中求胜各行业都在全力转型以谋求突破对于许多企业来说数字化重塑不再是种选择而是种必然日前 IBM 与各行业专家首次携手共创了共创共赢聚智前行中国智慧企业转型升级蓝
windows忘记mysql5.7密码修改密码

1 打开第一个cmd窗口执行 net stop mysql57 2 在第一个cmd窗口执行 mysqld defaults file C ProgramData MySQL MySQL Server 5 7 my ini skip gran
机器学习笔记 soft-DTW（论文笔记 A differentiable loss function for time-series）

1 soft DTW来由 DTW 算法通过动态规划求解了两个序列的相似度这个过程1是离散的不可微的如果要将其应用作为神经网络的损失函数这是不行的因为神经网络通过对损失函数结果进行梯度下降的方法更新参数要求损失函数可微 2 符号