视频时序动作检测(temporal action detection)介绍

2023-05-16

一、视频时序动作检测算法

本文中动作检测算法也包含了时序动作提名(Temporal Action Proposal Generation)。时序动作提名与检测的类别不一样的地方是,检测一般指定位出动作的边界并给出动作类别(可能是多类),而提名一般只有有动作和没有动作两类。

1.1 提名类算法(temporal action proposal generation)

  • CTAP算法详解
  • TSA-Net论文详解

1.2 检测类算法(temporal action detection / localization)

  • R-C3D论文详解

二、常用数据集介绍

ActivityNet

官网:http://activity-net.org/download.html

该数据集,单视频视长短,包含片段较少(一个视频包含少数的类别动作)

v1.2
* 有9682个视频
* 包含100类动作

v1.3
* 19994个视频
* 包含200类动作
* 日常活动,如遛狗、跳远、打扫地板等
* 共计700小时

两个版本的数据集中,training: validation: testing = 2:1:1
THUMOS14

官网:http://crcv.ucf.edu/THUMOS14/

该数据集,单视频时长可能较长,包含的片段也较多

* 只有验证集和测试集,官方推荐UCF101为训练集(UCF101都是裁剪好的视频)
* 大量的人类动作在真实环境中开源视频。 动作包括日常生活动作(例如,“吹干头发”和“刷牙”)对体育动作(例如,“驾驶”和“高尔夫挥杆”)
* 验证集有200个视频,测试集有213个视频
* 包含20类动作

其它视频任务介绍请查看-文章<<主流的视频动作类算法任务介绍>>

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

视频时序动作检测(temporal action detection)介绍 的相关文章

  • 检测复制或相似的文本块

    我有很多关于 Markdown 格式编程的文本 有一个构建过程能够将这些文本转换为 Word HTML 并执行简单的验证规则 例如拼写检查或检查文档是否具有所需的标题结构 我想扩展该构建代码以检查所有文本中的复制粘贴或类似块 是否有任何现有
  • 如何确定 QAction 的来源?

    我想知道是否有任何简单 优雅的方法来确定 QAction 的来源 我的意思是我有一个 QAction 它被添加到多个 QWidget 带有QWidget addAction http doc qt nokia com latest qwid
  • 如何在OpenCV中检测已知物体?

    我尝试在窗口中实时绘制形状 屏幕上的形状如缠结 矩形 圆形 半圆形和 Z 使用黄色 尺寸和形状可能与原始图像不同 但程序知道所有原始形状 因为它们是预定义的 我想知道如何识别正确的形状 举个例子 有可能做到这一点的方法吗 我可以为此使用模板
  • JSF 1.2 Action 和 ActionListener 中的异常之间的区别

    我注意到 JSF 1 2 当actionListener方法中抛出异常时不返回错误页面 但当action方法中抛出异常时返回错误页面 这是为什么 在这两种情况下它都能返回错误页面吗 任何抛出的异常FacesEvent http downlo
  • 带 URL 操作的 JSF 表单?

    有没有什么方法可以调用 URL 操作
  • iOS / C:检测音素的算法

    我正在寻找一种算法来确定实时音频输入是否与 144 个给定 且完全不同的 音素对之一匹配 最好是完成这项工作的最低级别 我正在为 iPhone iPad 开发激进 实验性音乐培训软件 我的音乐系统包含 12 个辅音音素和 12 个元音音素
  • 创建新的 Rails 操作不起作用?

    我有一个控制器 应用程序 它由一个动作 索引 组成 现在我想添加一个名为 购买 的新操作 def buy respond to do format format html end end 我在视图中添加了 buy html erb 但是当浏
  • 动作和动作监听器之间的区别

    有什么区别action and actionListener 我应该什么时候使用action versus actionListener 动作监听器 Use actionListener如果你想要一个钩子before真正的业务行动得到执行
  • 提交时设置表单的操作属性?

    单击提交按钮后如何立即更改表单的操作属性
  • 将 Java 对象从一个 Struts 操作传递到另一个

    在我的一个 Struts 操作中 我在方法中包含以下代码 List retrievedListOfObjects c getListOfObjects return mapping findForward view fw view导致使用另
  • 如何触发(window).focus页面加载?

    加载页面时 不会激活焦点 模糊状态 例如切换到另一个选项卡时blur显示 然后切换回页面focus激活 但在第一次加载页面时 没有任何状态被激活 为什么 这是预期的行为还是我搞砸了 function window focus functio
  • 未捕获的 RangeError:Temporal.Instant 不支持持续时间字段天(在不使用幻数的情况下向临时瞬间添加 1 天)

    背景关于Temporal https tc39 es proposal temporal docs 我正在尝试添加 1 天Temporal Instant 用作expJWT 的值 最明显的方法是 Temporal Now instant a
  • jQuery:检测 cmd+click / control+click

    我在选项卡中有我的网络应用程序的选项 ul li a href a php aaa a li li a href b php bbb a li li a href c php ccc a li li a href d php ddd a l
  • Java Swing KeyStrokes:如何使 CTRL 修饰符起作用

    In the following program why does hitting the a key print hello world while hitting CTRL a doesn t import java awt event
  • UIAlertView按钮操作代码

    有谁知道如何对按钮进行操作UIAlertview 如果是这样 请指导我 void alertView UIAlertView alertView didDismissWithButtonIndex NSInteger buttonIndex
  • 通过 LinkedList 实现撤消/重做功能

    我正在编写自己的 魔方 应用程序 主要班级Cube有18种旋转方式 RotateAxisXClockWise RotateAxisXAntiClockWise 顺时针旋转轴 Y 逆时针旋转轴 Y RotateAxisZClockWise R
  • 如何使用文本操作

    使用目的是什么文本动作 http docs oracle com javase 6 docs api javax swing text TextAction html from 抽象动作 http docs oracle com javas
  • UrlHelper.Action("Edit", "Ad") 返回 id 参数?

    Hi 我使用以下代码生成 URL UrlHelper urlHelper new UrlHelper htmlHelper ViewContext RequestContext urlHelper Action Edit Ad 如果我当前在
  • android 从图库中选择图像

    我想从图库创建一个图片选择器 我使用代码 intent new Intent Intent ACTION PICK android provider MediaStore Images Media EXTERNAL CONTENT URI
  • ZF2 - 从路线生成 URL

    我无法弄清楚在 zend 2 中从我想要的任何地方生成 Url 我得到了动作和控制器 所以我尝试这个 this gt url myControllerName array action gt myActionName 但这返回一个对象 我只

随机推荐

  • 解决VS平台迁移时报错error MSB8020:The build tools for v141

    将在VS2017上编译的程序放到VS2013中 xff0c 报错 xff1a error MSB8020 The build tools for v141 Platform Toolset 61 39 v141 39 cannot be f
  • C++ 中的char型变量

    最简单的字符数据类型是 char 数据类型 该类型的变量只能容纳一个字符 xff0c 而且在大多数系统上 xff0c 只使用一个字节的内存 以下示例即声明了一个名为 letter 的 char 变量 请注意 xff0c 这里的字符常数就是赋
  • linux下DISPLAY和xhost + 作用

    在Linux Unix类操作系统上 DISPLAY用来设置将图形显示到何处 直接登陆图形界面或者登陆命令行界面后使用startx启动图形 DISPLAY环境变量将自动设置为 0 0 此时可以打开终端 输出图形程序的名称 比如xclock 来
  • 配置 maven 编译的 JDK 版本

    两种方式 xff1a 一 可以修改 MAVEN 的 setting xml 文件 xff0c 统一修改 lt profiles gt lt profile gt lt id gt jdk 1 6 lt id gt lt activation
  • 利用redis的setIfAbsent()方法实现分布式锁

    再集群环境中 xff0c 存在定时任务多次执行 xff0c 浪费资源 xff0c 那么如何避免这种情况呢 xff0c 下面就说明一下如何利用一个注解解决问题 xff0c 利用切面配合redis可以简单实现分布式锁 xff0c 解决定时任务重
  • Virtualbox主机和虚拟机之间文件夹共享及双向拷贝(win7——centos7)

    一 双向拷贝 xff1a 然后 xff0c 还需要通过virtualbox上安装一个增强的工具 此时 xff0c 会在centos上安装一些工具 xff1a 鼠标自动在宿主机 虚拟机之间移出 同时 xff0c 在centos上会出现一个安装
  • Record something about DL

    这篇文章算是DL实践杂谈吧 xff0c 主要是想把自己模型调优和复现算法遇到的一些坑总结一下 xff08 里面的一行字可能是我当时花费了一周甚至更长时间得到的总结 xff09 xff0c 希望能对读者有所帮助 一 熟悉数据 模型是数据的浓缩
  • Image captioning任务常用的评价指标计算

    BLEU ACL 2002Meteor AMTA 2004ROUGE L ACL 2004CIDEr CVPR 2015SPICE ECCV 2016
  • Image captioning评价方法之BLEU (bilingual evaluation understudy)

    文章地址 xff1a BLEU a Method for Automatic Evaluation of Machine Translation 代码地址 非官方 xff1a https github com tylin coco capt
  • Image captioning评价方法之Meteor

    项目地址 xff1a http www cs cmu edu alavie METEOR 代码地址 xff08 非官方实现 xff0c 实现的是项目地址中的1 5版本 xff09 xff1a https github com tylin c
  • Image captioning评价方法之ROUGE-L

    文章地址 xff1a ROUGE A Package for Automatic Evaluation of Summaries 代码地址 非官方 xff1a https github com tylin coco caption 文章由U
  • Image captioning评价方法之CIDEr

    文章地址 xff1a CIDEr Consensus based Image Description Evaluation 代码地址 xff08 非官方 xff0c 且代码实现的是CIDEr D xff09 xff1a https gith
  • Image captioning评价方法之SPICE

    项目地址 xff1a https panderson me spice 上述的项目地址包含了论文地址和代码地址 该方法是由The Australian National University和Macquarie University联合发表
  • R3DS Wrap基本使用方法

    中文的R3DS Wrap软件的教程较少 xff0c 最近刚好实操了一遍 xff0c 特此记录下来 为了描述方便 xff0c 下面将R3DS Wrap简称Wrap 软件官网 xff1a https www russian3dscanner c
  • docker使用入门简介

    一 什么是docker xff1f https www docker com resources what container 使用docker时有两个重要概念 xff0c 一个是镜像 xff08 images xff09 xff0c 一个
  • SpringBoot整合Quartz 实现分布式定时任务调度

    一 Quartz 集群架构 Quartz 是 Java 领域最著名的开源任务调度工具 在上篇文章中 xff0c 我们详细的介绍了 Quartz 的单体应用实践 xff0c 如果只在单体环境中应用 xff0c Quartz 未必是最好的选择
  • 《Attention Is All You Need》算法详解

    该篇文章右谷歌大脑团队在17年提出 xff0c 目的是解决对于NLP中使用RNN不能并行计算 xff08 详情参考 译 理解LSTM xff08 通俗易懂版 xff09 xff09 xff0c 从而导致算法效率低的问题 该篇文章中的模型就是
  • 主流的视频动作类算法任务介绍

    动作识别 action recognition xff1a 是对每个输入视频进行分类 xff0c 识别出视频中人物做出的动作 即输入视频序列 xff0c 得到视频对应的类别 时序动作检测 temporal action detection
  • 视频时序动作识别(video action recognition)介绍

    一 视频时序动作识别算法分类 根据网络的工作方式 xff0c 可以将视频时序动作识别算法大致分为四大类 xff1a 采用2D卷积的方法采用3D卷积的方法双流法引入VLAD的方法 1 1 采用2D卷积的方法 TSM Temporal Shif
  • 视频时序动作检测(temporal action detection)介绍

    一 视频时序动作检测算法 本文中动作检测算法也包含了时序动作提名 xff08 Temporal Action Proposal Generation xff09 时序动作提名与检测的类别不一样的地方是 xff0c 检测一般指定位出动作的边界