时序动作分割(temporal action segmentation)任务介绍

2023-05-16

时序动作分割任务: 输入是一个未经裁剪的视频,输出是视频中每一帧的动作类别。所以该任务可以理解为对每一帧视频进行打标签处理(类同于图片分割是给每个像素打标签)。

一、算法介绍

  • MS-TCN/MS-TCN++
  • Global2Local

二、常用数据集介绍

2.1 Breakfast

数据集形式:

  1. 数据集有1712段第三视角的视频。
  2. 所有视频是在18个不同的厨房录制的,视频内容是做早餐的一些动作。
  3. 总共有48个动作类别,且每段视频平均包含6个动作类别。
  4. 视频的平均帧数为2097帧

图示:
在这里插入图片描述

2.2 50Salads

数据集形式:

  1. 数据集有50段视频,视频录制是俯视视角
  2. 视频由25个被拍摄者,每人做两个salad录制下来的
  3. 总共有17个动作类别
  4. 视频的平均帧数为11552

图示:
在这里插入图片描述

2.3 GTEA

数据集形式:

  1. 数据集有28段视频,视频录制是第一人称视角
  2. 视频由4个被拍摄者准备咖啡或者三明治等7种日常活动
  3. 总共有11个动作类别
  4. 视频的平均帧数为1115

图示:
在这里插入图片描述

2.4 MPII Cooking 2

该数据集目前使用较少

数据集形式:

  1. 数据集有273段视频
  2. 视频时长在40秒到40分之间
  3. 总共有67个动作类别,其中有6动作个不在测试集里面

2.5 MERL Shopping

该数据集目前使用较少

数据集形式:

  1. 数据集有96个视频时长为2分钟的视频,60个训练、
  2. 使用HD摄像头俯视拍摄
  3. 总共有32个被拍摄者,每个人3段视频拍摄于不同的日期
  4. 总共有5类动作,Reach to Shelf, Retract from Shelf, Hand in Shelf, Inspect Product, Inspect Shelf

其它视频任务介绍请查看-文章<<主流的视频动作类算法任务介绍>>

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

时序动作分割(temporal action segmentation)任务介绍 的相关文章

  • PHP 表单提交后重定向到新页面

    我有一个表单 在提交表单后将用户重定向到 page1 php 我想要做的是在提交表单后将用户重定向到 page2 php 但我需要确保已发送 POST 请求 例子
  • Android ACTION_VIEW 多张图像

    我希望我的应用程序显示一到三张照片 直到运行时我才知道从互联网上下载了多少照片 我不知道如何创建一个意图来显示照片 现在 我将它们缓存在 SD 卡上的一个文件夹下 该文件夹是我通过执行类似操作 无错误检查 创建的 final File ex
  • 在按钮操作上传递参数:@selector

    我想将动态生成的按钮中的电影 url 传递给 MediaPlayer button addTarget self action selector buttonPressed withObject speakers mp4 objectAtI
  • 双击按钮

    如何添加双击按钮的操作 void buttonTouchDownRepeat id sender event UIEvent event UITouch touch event allTouches anyObject if touch t
  • Magento 管理网格将数据从 Action 发送到 Controller

    我正在尝试编写一个自定义操作来运行我构建的管理网格 是否可以通过 get 或 post 将网格中的列中的值发送到控制器 我尝试过谷歌搜索 但在任何地方都找不到正确的解释 如果可用的话 指向列设置 getter type 等 说明的链接也会很
  • 表示 SMT-LIB 中的时间约束

    我试图在 SMT LIB 中表示时间约束 以检查它们的可满足性 我正在寻找有关我所采取的方向的反馈 我对 SMT LIB 比较陌生 非常感谢您的意见 我所面临的限制是事件的时间和持续时间 例如 考虑以自然语言给出的以下约束 约翰在 13 0
  • 将 ASP.NET MVC 操作参数名称映射到另一个名称

    我可以将操作的参数映射到不同的名称吗 我想使用保留字作为操作的参数 例如 search q someQuery in location for x 所以 in 和 for 不能用作方法的参数名称 是否有内置功能 或者我应该创建一个模型绑定器
  • 在 JSF 中分配“值表达式”代替“方法表达式”

    在我的复合组件中 我迭代了list
  • Action<>多参数语法说明

    有时我无法理解最简单的事情 我确信它就在我的脸上 只是我看不到它 我尝试为这个简单类中的方法创建委托 public static class BalloonTip public static BalloonType BalType get
  • 如何在 Ruby on Rails 中基于每个操作禁用日志记录?

    我有一个 Rails 应用程序 它的一个操作被频繁调用 在我开发时很不方便 因为它会产生大量我不关心的额外日志输出 我如何才能让 Rails 不记录这一操作的任何内容 控制器 操作 参数 完成时间等 我也想在 RAILS ENV 上对其进行
  • 创建新的 Rails 操作不起作用?

    我有一个控制器 应用程序 它由一个动作 索引 组成 现在我想添加一个名为 购买 的新操作 def buy respond to do format format html end end 我在视图中添加了 buy html erb 但是当浏
  • Java - 如果随后定义了 actionPerformed,JButton 文本就会消失

    这已经困扰我一段时间了 如果我定义setText在 JButton 上before定义setAction 文本消失 JButton test new JButton test setText test Before disappears t
  • 多个意图接收器?

    文件指出 如果Intent可以由多个应用程序处理 系统将提示用户一个对话框 要求他选择应用程序来完成操作 有没有办法让用户选择多个应用程序来一一完成操作 例如 如果我想分享一条消息 我将使用ACTION SEND具有指定的 MIME 类型
  • 将 Java 对象从一个 Struts 操作传递到另一个

    在我的一个 Struts 操作中 我在方法中包含以下代码 List retrievedListOfObjects c getListOfObjects return mapping findForward view fw view导致使用另
  • Java Swing KeyStrokes:如何使 CTRL 修饰符起作用

    In the following program why does hitting the a key print hello world while hitting CTRL a doesn t import java awt event
  • UIAlertView按钮操作代码

    有谁知道如何对按钮进行操作UIAlertview 如果是这样 请指导我 void alertView UIAlertView alertView didDismissWithButtonIndex NSInteger buttonIndex
  • Django 检查查询集模型类型的最佳方法

    我有一个 Django 操作函数 我想在基于不同模型的查询集上使用它 检查我的查询集组成的模型类型的最佳方法是什么 假设我想检查 models py 中定义的 Library 类 目前我可以使用它来工作 for object in quer
  • WFFM 8.0 - 缺少保存到数据库操作

    我刚刚安装了 Web Forms For Marketers 8 0 并做了一个测试表单 尝试选择Save to Database从操作列表中但它不存在 另外 我已经检查过 sitecore system Modules Web Forms
  • 通过 LinkedList 实现撤消/重做功能

    我正在编写自己的 魔方 应用程序 主要班级Cube有18种旋转方式 RotateAxisXClockWise RotateAxisXAntiClockWise 顺时针旋转轴 Y 逆时针旋转轴 Y RotateAxisZClockWise R
  • WordPress 使用 GD 图像引擎以编程方式将图像转换为 WebP 格式

    有许多 PHP 解决方案和 WP 插件 它们都带有我不想要 不需要的附加选项 即如何提供转换后的文件 存储它们的位置等 我不需要所有这些 并且正在寻找使用 GD 的纯简单代码 我不想使用插件 谢谢 编码应该什么时候发生 任何时候你知道这是钩

随机推荐

  • linux下DISPLAY和xhost + 作用

    在Linux Unix类操作系统上 DISPLAY用来设置将图形显示到何处 直接登陆图形界面或者登陆命令行界面后使用startx启动图形 DISPLAY环境变量将自动设置为 0 0 此时可以打开终端 输出图形程序的名称 比如xclock 来
  • 配置 maven 编译的 JDK 版本

    两种方式 xff1a 一 可以修改 MAVEN 的 setting xml 文件 xff0c 统一修改 lt profiles gt lt profile gt lt id gt jdk 1 6 lt id gt lt activation
  • 利用redis的setIfAbsent()方法实现分布式锁

    再集群环境中 xff0c 存在定时任务多次执行 xff0c 浪费资源 xff0c 那么如何避免这种情况呢 xff0c 下面就说明一下如何利用一个注解解决问题 xff0c 利用切面配合redis可以简单实现分布式锁 xff0c 解决定时任务重
  • Virtualbox主机和虚拟机之间文件夹共享及双向拷贝(win7——centos7)

    一 双向拷贝 xff1a 然后 xff0c 还需要通过virtualbox上安装一个增强的工具 此时 xff0c 会在centos上安装一些工具 xff1a 鼠标自动在宿主机 虚拟机之间移出 同时 xff0c 在centos上会出现一个安装
  • Record something about DL

    这篇文章算是DL实践杂谈吧 xff0c 主要是想把自己模型调优和复现算法遇到的一些坑总结一下 xff08 里面的一行字可能是我当时花费了一周甚至更长时间得到的总结 xff09 xff0c 希望能对读者有所帮助 一 熟悉数据 模型是数据的浓缩
  • Image captioning任务常用的评价指标计算

    BLEU ACL 2002Meteor AMTA 2004ROUGE L ACL 2004CIDEr CVPR 2015SPICE ECCV 2016
  • Image captioning评价方法之BLEU (bilingual evaluation understudy)

    文章地址 xff1a BLEU a Method for Automatic Evaluation of Machine Translation 代码地址 非官方 xff1a https github com tylin coco capt
  • Image captioning评价方法之Meteor

    项目地址 xff1a http www cs cmu edu alavie METEOR 代码地址 xff08 非官方实现 xff0c 实现的是项目地址中的1 5版本 xff09 xff1a https github com tylin c
  • Image captioning评价方法之ROUGE-L

    文章地址 xff1a ROUGE A Package for Automatic Evaluation of Summaries 代码地址 非官方 xff1a https github com tylin coco caption 文章由U
  • Image captioning评价方法之CIDEr

    文章地址 xff1a CIDEr Consensus based Image Description Evaluation 代码地址 xff08 非官方 xff0c 且代码实现的是CIDEr D xff09 xff1a https gith
  • Image captioning评价方法之SPICE

    项目地址 xff1a https panderson me spice 上述的项目地址包含了论文地址和代码地址 该方法是由The Australian National University和Macquarie University联合发表
  • R3DS Wrap基本使用方法

    中文的R3DS Wrap软件的教程较少 xff0c 最近刚好实操了一遍 xff0c 特此记录下来 为了描述方便 xff0c 下面将R3DS Wrap简称Wrap 软件官网 xff1a https www russian3dscanner c
  • docker使用入门简介

    一 什么是docker xff1f https www docker com resources what container 使用docker时有两个重要概念 xff0c 一个是镜像 xff08 images xff09 xff0c 一个
  • SpringBoot整合Quartz 实现分布式定时任务调度

    一 Quartz 集群架构 Quartz 是 Java 领域最著名的开源任务调度工具 在上篇文章中 xff0c 我们详细的介绍了 Quartz 的单体应用实践 xff0c 如果只在单体环境中应用 xff0c Quartz 未必是最好的选择
  • 《Attention Is All You Need》算法详解

    该篇文章右谷歌大脑团队在17年提出 xff0c 目的是解决对于NLP中使用RNN不能并行计算 xff08 详情参考 译 理解LSTM xff08 通俗易懂版 xff09 xff09 xff0c 从而导致算法效率低的问题 该篇文章中的模型就是
  • 主流的视频动作类算法任务介绍

    动作识别 action recognition xff1a 是对每个输入视频进行分类 xff0c 识别出视频中人物做出的动作 即输入视频序列 xff0c 得到视频对应的类别 时序动作检测 temporal action detection
  • 视频时序动作识别(video action recognition)介绍

    一 视频时序动作识别算法分类 根据网络的工作方式 xff0c 可以将视频时序动作识别算法大致分为四大类 xff1a 采用2D卷积的方法采用3D卷积的方法双流法引入VLAD的方法 1 1 采用2D卷积的方法 TSM Temporal Shif
  • 视频时序动作检测(temporal action detection)介绍

    一 视频时序动作检测算法 本文中动作检测算法也包含了时序动作提名 xff08 Temporal Action Proposal Generation xff09 时序动作提名与检测的类别不一样的地方是 xff0c 检测一般指定位出动作的边界
  • 《Channel-wise Knowledge Distillation for Dense Prediction》论文详解

    原文地址 xff1a Channel wise Knowledge Distillation for Dense Prediction 代码地址 xff1a https git io Distille xff08 由原文提供 xff0c 好
  • 时序动作分割(temporal action segmentation)任务介绍

    时序动作分割任务 输入是一个未经裁剪的视频 xff0c 输出是视频中每一帧的动作类别 所以该任务可以理解为对每一帧视频进行打标签处理 xff08 类同于图片分割是给每个像素打标签 xff09 一 算法介绍 MS TCN MS TCN 43