人体活动识别总结

2023-11-08

人体活动识别

活动识别过程

数据采集→数据预处理→窗口分割→特征提取→特征选择→活动分类
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

面临问题

人类活动识别(HAR),仍有许多问题促使新技术的发展,以提高在更现实的条件下的准确性。
其中一些挑战是:
1.要度量的属性选择
2.便携的、不显眼的、廉价的数据采集系统的构造
3.特征提取及推理方法的设计
4.在现实的条件下收集数据
5.支持新用户而无需对系统进行再训练的灵活性
6.在满足能量和处理需求的移动设备上实现

一、检测方法

基于传感器(加速度计、惯性传感器、陀螺仪等)“可穿戴”:该可穿戴技术使用安装在受试者上的传感设备来收集来自传感器的数据。由于人体活动包含着不同身体位置的动作,因此对人体活动的研究需要从安装在人体不同部位的多个传感器中获取信息。可穿戴设备的设计必须考虑到用户的易用性。轻便、现代、舒适的嵌入式传感器穿戴设备用于活动监测。活动监测传感器用于多个数据集。最常用的传感器是加速度计、陀螺仪、磁力计.通过统计可以识别人类活动,并应用机器学习算法。另一方面,可穿戴设备正变得越来越受欢迎,因为它们易于操作,价格低廉,在恶劣的环境下也能工作,不会干涉别人的隐私。如何将低级传感器数据映射到高级抽象是活动识别的关键。尽管可穿戴传感器仍然有很多优点,但它也有一些缺点。HAR载体系统通常需要在身体的不同部位佩戴或安装多个传感器,这对受试者来说是麻烦的、令人不安的和不舒服的。

基于图像的(计算机视觉方法):它以整个图像作为输入,显示身体关键点的像素坐标。身体有15个关节:颈、膝、踝关节、肩、腕、弓、肩、臀、肘、腕、胸,还有14个关节连接处。尽管使用摄像机识别任何活动是有用的,但最重要的是,它们需要基础设施支持,因为它需要在监视场所安装摄像机,并且高度依赖于照明。

二、数据集

数据集中一般:
一行数据称为一个样本,一列数据称为一个特征
数据类型为特征值+标签值(标签值是离散值)

升降数据集(https://sites.google.com/up.edu.mx/har-up/)。使用5个Mbientlab元传感器穿戴式传感器(IMU)、1个脑电图仪(EEG)和6个红外传感器(IR)捕获数据。包括简单的人类日常活动(行走、站立、举起物体、坐着、跳着和躺着)和五种摔倒(手向前跌倒、膝盖向前跌倒、向后跌倒、坐在空椅子上着地和侧身跌倒)。

★(SCUT-NAA数据集)A naturalistic 3D acceleration-based activity dataset & benchmark evaluations

数据基本处理:数据分割,一般训练集:测试集=7:3/(8:2)

三、数据预处理

滤波、去噪→分割窗口

SVD(奇异值分解):
通过SVD对数据的处理,我们可以使用小得多的数据集来表示原始数据集,这样做实际上是去除了噪声和冗余信息,以此达到了优化数据、提高结果的目的。
优点:简化数据,去除噪声点,提高算法的结果;
缺点:数据的转换可能难以理解;
适用于数据类型:数值型。

一般地,当人们在进行各项日常活动时,身体加速度最能反映活动的变化情况。通常人体活动所产生的身体加速度的有效频率成分出现在25Hz以下,大于25Hz的频率成分基本上为噪声数据,而重力仅具有低频分量且其频率成分通常分布在0Hz附近[17],这是因为其对总加速度的影响变化相当小。基于以上分析,本文使用了两个三阶的巴特沃斯滤波器对原始加速度数据进行滤波处理,其中一个是截止频率为25Hz的低通滤波器,另外一个是截止频率分别为0.3Hz的高通滤波器,目的是分别实现对噪声成分与重力成分的滤除。如图3所示,表示某一实验者骑车时所采集的原始数据沿x轴方向的分量与经过两次滤波后获取的x轴方向的身体加速度。

窗口分割:
选择相当短的窗口可能会提高特征提取的性能,但由于识别算法被更频繁地触发,将需要更高的开销。此外,短时间窗口可能不能提供足够的信息来完全描述所执行的活动。相反,如果窗口太长,在一个时间窗口中可能有多个活动。当然,窗口大小的决定取决于要识别的活动和度量的属性。

四、特征工程

特征提取

将数据转换为可用于机器学习的数字特征

特征集

最小值、min
最大值、max
均值、mean
中值、median
均方根、RMS():Root mean square
四分位数、Quartile(25%, 50% , 75%)
轴间相关系数、cc_axis(): Correlation coefficient between axis
皮尔逊相关系数
小波包变换子带能量及其子带能量之和
过零率、ZCR(Zero crossing rate)
偏度、Skewness
峰度,Kurtosis
小波能量谱
有效的频率成分、(参考:李辉—A类)
功率谱密度的峰值及其所在位置 value and location of the peaks of psd
标准差、std(): Standard deviation
中值绝对偏差、mad(): Median absolute deviation
信号幅值面积、sma(): Signal magnitude area
energy(): Energy measure. Sum of the squares divided by the number of values.
样本熵、Sample entropy
近似熵、Approximate entropy
信号熵、entropy(): Signal entropy
四分位间距、iqr(): Interquartile range
自回归系数(Burg阶等于4)、arCoeff(): Autorregresion coefficients with Burg order equal to 4
两信号间的互相关系数、correlation(): correlation coefficient between two signals
最大幅值所对应的频率成分、maxInds(): index of the frequency component with largest magnitude
通过计算频率成分的加权平均,获取平均频率、meanFreq(): Weighted average of the frequency components to obtain a mean frequency
向量夹角、angle(): Angle between to vectors.
每个窗口的FFT的64个bin内的频率间隔的能量、bandsEnergy(): Energy of a frequency interval within the 64 bins of the FFT of each window.
梯度直方图、HOG Histogram of gradient
傅里叶描述子、FD Fourier description
局部二值特征、LBP Local Binary Pattern
直方图:最大值与最小值之差,分成N等份,求取信号数据落入每一等份内的概率
倒谱系数、MFCC , Cepstrum Coefficient (CC)
起点平均值或前0.5秒的数据平均值,终点平均值或后0.5秒的数据平均值:starting point mean or the mean of the data in the first 0.5 seconds, and ending point mean or the mean of the data in the last 0.5 seconds
谱能量、Spectrum energy

加速度信号的特征提取方法

时域——均值、标准差、方差、四分位数范围(IQR)、平均绝对偏差(MAD)、轴间相关性、熵和峰度。[19]、[23]-[25]、[27]、[36]、[45]、
子空间池的技术(将原始复杂的输入数据建模/投影到新的维度中)《A Comparative Study of Feature Selection Approaches for Human Activity Recognition Using Multimodal Sensory Data.》。

频域——傅里叶变换[27],[36]和离散余弦变换[51]。

其他——主成分分析(PCA)[35],[51],线性判别分析(LDA)[36],自回归模型(AR), HAAR滤波器[28]。

优化特征集(特征预处理)

通过预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。(归一化,标准化。。。)

为了筛选出显著的特征、摒弃非显著特征,需要运用特征有效性分析的相关技术,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。

EFFS集合特征的方法(信息增益、增益率、卡方统计量、ReliefF)《Robust human activity recognition using single accelerometer via wavelet energy spectrum features and ensemble feature selection》

基于线性预测分析的启发式特征提取方法(linear predictive analysis)。该方法简化了特征提取过程,减少了特征的数量。采用信号系统分析方法,从信号的时域和频域将加速度信号与信号系统相关联,通过建立信号系统,获取系统参数作为活动识别的特征向量。

特征降维

特征约简方法主要是无监督特征提取方法(PCA和CPCA)和判别分析特征提取方法(KDA和LDA)等。

特征选择

数据集中的一些特征可能包含冗余或不相关的信息,会对识别精度产生负面影响。
建议实现选择最合适的特征的技术,以减少计算,简化学习模型。

贝叶斯信息准则(BIC)和最小描述长度[49]被广泛应用于一般机器学习问题。

在HAR中,一种常见的方法是[59]【20】中使用的最小冗余和最大相关性(MRMR)[59]。在该工作中,特征之间的最小互信息被用作最小冗余的标准,类与特征之间的最大互信息作为最大相关性的标准。

Maurer等人[46]利用了WEKA构建的基于相关的特征选择(CFS)方法[60][61]。CFS的工作原理是假定特征与给定的类高度相关,但彼此不相关。

我们还评估了迭代方法来选择特性。由于特征子集的数量为O(2n),计算所有可能的子集在计算上是不可行的。因此,多目标进化算法等元启发式方法被用于探索可能的特征子集空间[62]。

五、分类器

人类活动识别系统使用的分类算法:
在这里插入图片描述

监督学习(Supervised learning)

1.决策树——一种层次模型,将属性映射到节点上,边表示可能的属性值。从根到叶节点的每个分支都是一个分类规则。C4.5可能是应用最广泛的决策树分类器,它基于信息增益的概念来选择应该放置在顶部节点中的属性[70]。决策树可以对n个属性以O(logn)的形式进行评估,通常生成的模型容易被人类理解。

2.贝叶斯方法——通过估计训练集的条件概率来计算每个类的后验概率。贝叶斯网络(BN)分类器和朴素贝叶斯(NB)分类器是这类分类器的主要代表。贝叶斯网络的一个关键问题是拓扑结构,因为它需要对特征之间的独立性做出假设。例如,NB分类器假设给定一个类值,所有的特征都是条件独立的,但是这种假设在很多情况下并不成立。事实上,加速度信号以及心率、呼吸频率、ECG振幅等生理信号都是高度相关的。

3.基于实例的学习(IBL)方法——根据训练集中最相似的实例对实例进行分类。为此,它们定义了一个距离函数来度量每一对实例之间的相似性。因为每个要分类的新实例都需要与整个训练集进行比较,使得IBL分类器在评估阶段的开销很大。

4.支持向量机(SVM)和人工神经网络(ANN)在HAR中也被广泛使用。然而,知识隐藏在模型中,这可能会阻碍分析和合并额外的推理。支持向量机依赖于将所有实例投射到高维空间的核函数,目的是找到一个线性决策边界(即超平面)来划分数据。神经网络复制人类大脑中生物神经元的行为,在网络链接中传播激活信号并编码知识。此外,ANN被证明是通用函数逼近器。神经网络的两个普遍缺点是计算成本高和需要大量的训练数据。

5.集成分类器——结合多个分类器的输出以提高分类精度。分类器集成显然在计算上更昂贵,因为他们需要对几个模型进行培训和评估

评价指标(Evaluation metrics)

绝大多数研究使用交叉验证与统计测试来比较特定数据集的分类器性能。特定方法的分类结果可以组织在n×n的混淆矩阵中显示出来,由混淆矩阵可以得到以下值:
True Positives (TP)、True Negatives (TN)、False Positives (FP)、False Negatives (FN)。
准确性是总结所有类别总体分类性能的最标准的指标:在这里插入图片描述
查准率:在这里插入图片描述
查全率:在这里插入图片描述
F-measure(F1)将精度和召回率合并为一个值:
在这里插入图片描述
ROC、AUC曲线

六、优化算法

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人体活动识别总结 的相关文章

随机推荐

  • 通讯协议022——全网独有的OPC AE知识四之接口(六)

    本文简单介绍OPC AE规范的接口IConnectionPointContainer的相关知识 更多通信资源请登录网信智汇 wangxinzhihui com OPC AE规范描述了OPC事件服务器应该实现的对象和接口 实现在多个OPC客户
  • 计算机视觉——利用openCV调用本地摄像头采集图片并截图保存

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 前言 一 采集方式 二 代码部分 三 效果演示 前言 由于本人研究生课题是深度学习目标检测方向 因此需要大量的数据集 在本地采样时 可以利用openCV提供的库函数
  • Failed to create SubnetManager: error retrieving pod spec for ‘kube-system/kube-flannel-ds-amd64-xxx

    kubelet报错如下 kubelet 3807 E1215 18 01 25 516905 3807 aws credentials go 77 while getting AWS credentials NoCredentialProv
  • 从UE4到UE5:工程及资产迁移的原理和一般方法

    按照官方建议 明年早些时候发布UE5正式版本 UE5EA仅用于新技术探索和尝鲜 项目开发还是应该在UE4上进行 现在迁移只是为了解新的features 提前规划哪些可能用于现在的工程 2022 4 8更新 UE5正式版已经发布 喜大普奔 赶
  • Java线程:新特征-有返回值的线程

    本文转载至 http lavasoft blog 51cto com 62575 222082 在Java5之前 线程是没有返回值的 常常为了 有 返回值 破费周折 而且代码很不好写 或者干脆绕过这道坎 走别的路了 现在Java终于有可返回
  • pandas数据处理基础——筛选指定行或者指定列的数据

    pandas主要的两个数据结构是 series 相当于一行或一列数据机构 和DataFrame 相当于多行多列的一个表格数据机构 本文为了方便理解会与excel或者sql操作行或列来进行联想类比 1 重新索引 reindex和ix 上一篇中
  • SPP空间金字塔池化(spatial pyramid pooling, SPP)原理与pytorc实现

    1 为什么需要SPP 过去的卷积神经网络CNN由卷积层 全连接层组成 其中卷积层对于输入数据的大小并没有要求 唯一对数据大小有要求的则是第一个全连接层 因此基本上所有的CNN都要求数据数据固定大小 例如著名的VGG模型则要求输入数据大小是
  • "ORA-00942: 表或视图不存在 "的原因和解决方法

    采用Oracle数据库 使用Powerdesigner设计 生成Sql文件导入后查询出现 ORA 00942 表或视图不存在 很是郁闷 这个问题以前出现过 当初解决了 但因好久没有使用 这次竟然忘了 害得我浪费了好些时间 为了避免再次忘记
  • 消息中间件(MQ)

    一 什么是消息中间件 关注于数据的发送和接收 利用高效可靠的异步消息传递机制集成分布式系统 通过提供消息传递和消息排队模型 它可以在分布式环境下扩展进程间的通信 二 为什么需要消息中间件 1 系统解耦 假设你有个系统A 这个系统A会产出一个
  • 数据治理总结

    项目背景 前提 参与人员均了解熟悉数据中心 业务痛点 始于一次吐槽大会 1 开发及使用人员信息不对称 2 表中字段增减随意 3 相似数据冗余 4 定制化表过多 扩展功能不足 维护成本高 5 缺少注释 全凭猜测 浪费时间 项目计划 1 确定治
  • [North Central NA Contest 2018] Rational Ratio

    Description Every positive rational number can be expressed as a ratio of two positive integers However in decimal form
  • 【目标检测】Towards Accurate One-Stage Object Detection with AP-Loss

    摘要 one stage目标探测器通过同时优化分类损失和定位损失进行训练 前者由于锚的数量众多而遭受极端的前景 背景类别失衡问题 本文提出了一个新颖的框架 以分级任务代替one stage检测器中的分类任务 并采用平均精度损失 AP los
  • flink学习39:tableAPI应用实例

    实例
  • linux下串口的安装和使用(ubuntu+usb转串口)

    转自 http blog csdn net u014416516 article details 39482183 安装 在终端中输入sudo apt get install minicom 配置 输入sudo minicom s 注意前边
  • 成功 打不开_【2019】Adobe XD 闪退白屏打不开的解决方法

    原文是微信公众号文章 原文链接 2019 关于 Adobe XD 闪退白屏打不开的解决方法 mp weixin qq com Adobe XD 作为一款战略地位超越 Photoshop 的一站式 UI UX 设计平台软件 每天有无数 UI
  • 电路(1) ——LC谐振电路

    最近小菜转行了 不再做软开 博客会更新一些电路分析的内容 从零开始学电分的第一天 加油
  • 元宇宙改变人类工作模式的四种方式

    想象一个世界 你可以与同事在海边交谈 在空间站周围漂浮时做会议记录 或者从你在伦敦的办公室传送到纽约 所有这些都无需走出你的前门 由于今天安排的会议太多而感到压力 那么为什么不发送支持 AI 的数字双胞胎来减轻你的负担呢 这些例子只是对 元
  • Echarts图表不显示

    Echarts图表不显示 div标签的style属性设置有问题 div style width 500px height 500px div
  • C++课程基础语法小结

    前言 每个人的记忆是有限的 学过的东西很快就会遗忘 因此 在即将升大二之际 对大一学习的C 的基础语法进行整理归纳 并附上一年里写过的一些重要代码 方便今后回顾 声明 本文参考教材提供的网络学习资料 非常感谢 网址已注明 代码为博主本人大一
  • 人体活动识别总结

    人体活动识别 活动识别过程 数据采集 数据预处理 窗口分割 特征提取 特征选择 活动分类 面临问题 人类活动识别 HAR 仍有许多问题促使新技术的发展 以提高在更现实的条件下的准确性 其中一些挑战是 1 要度量的属性选择 2 便携的 不显眼