模式识别——特征提取(表达)

2023-11-07

特征表达

特征是机器学习系统的原材料,对最终模型的影响是毋庸置疑的;如果数据被很好地表达成了特征,通常线性模型就能达到满意的精度。关于特征,需要考虑以下三方面:

(1)特征表示的粒度

需要考虑,模型在一个什么程度上的特征表示,才能发挥效果?以图片为例,像素级的特征完全没有价值,从中得不到任何可用于分类或识别的信息。

当特征具有结构性(有意义)的时候,算法才能起作用,即将输入空间通过某种规则映射到特征空间,使得有助于分类。如下图所示,当可以判断是否有车把手,是否有车轮,就可以很容易的把摩托车和非摩托车区分开。
在这里插入图片描述

(2)初级(浅层)特征表示

1995 年前后,Bruno Olshausen和 David Field收集了很多黑白风景照片,提取出400个小碎片,每个小碎片的尺寸均为 16x16 像素,对这400个碎片标记为 S i , i = 0 , ⋯   , 399 S_i,i=0,\cdots,399 Si,i=0,,399;再从这些黑白风景照片中,随机提取另一个碎片,大小为 16 × 16 16\times16 16×16 像素,把这个碎片标记为 T。

问题:如何从这400个碎片中,选取一组碎片 S k S_k Sk,通过叠加的办法,合成出一个新的碎片,而这个新的碎片应当与随机选择的目标碎片 T 尽可能相似,同时, S k S_k Sk 的数量尽可能少。该问题的属性描述为: ∑ k a k ⋅ S k → T \displaystyle\sum_k a_k\cdot S_k\to T kakSkT,其中 a k a_k ak 为叠加碎片 S k S_k Sk 时的权重系数。

因此,他们提出了 稀疏编码(Sparse Coding)算法,这是一个重复迭代的过程,每次迭代分两步:

A. 选择一组 S k S_k Sk ,然后调整 a k a_k ak ,使得 ∑ k a k ⋅ S k \displaystyle\sum_k a_k\cdot S_k kakSk 最接近 T;
B. 固定 a k a_k ak,在 400 个碎片中,选择其他更合适的碎片 S k ′ S'_k Sk,替代原先的 S k S_k Sk,使得 ∑ k a k ⋅ S k ′ \displaystyle\sum_k a_k\cdot S'_k kakSk 最接近 T。
经过多次迭代后,选出最佳的 S k S_k Sk 组合。令人惊奇的是,被选中的 S k S_k Sk 基本上都是照片上不同物体的边缘线,这些线段形状相似,区别在于方向

这表明,复杂图像往外由一些基本结构组成任意一幅图可以用 64 种正交的 e d g e s edges edges(正交的基本结构)线性表示。如下图所示:
在这里插入图片描述

实际上,不仅图像中存在这个规律,声音中也存在。从未标注的声音中发现了20种基本的声音结构,其余的声音可以由这20种基本结构合成
在这里插入图片描述

(3)结构性特征表示

小块的图形可以由基本edge构成,更结构化,更复杂的,具有概念性图形的表示就需要更高层次的特征表示,比如V2,V4。V1看像素级是像素级。V2看V1是像素级,是层次递进的,高层表达由底层表达的组合而成;以图像的基basis说明。V1层提出的basis是边缘,然后V2层是V1层这些basis的组合,这时候V2区得到的又是高一层的basis,上上层又是上一层的组合basis结果 ⋯ ⋯ \cdots\cdots 在这里插入图片描述

直观的,以Bruno Olshausen和 David Field的实验为例,就是就是找到有意义的小碎片(patch),再将其进行组合(combine),就得到了上一层的特征(feature),递归地向上学习特征(learning feature)。在不同对象(object)上做训练时,所得的边缘基(edge basis)是非常相似的,但对象部分(object parts)和模式(models)完全不同。这样便于图像的准确识别
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

模式识别——特征提取(表达) 的相关文章

随机推荐

  • Tomcat 启动速度优化

    本文简单介绍如何让 Tomcat 更快启动 同时提供一些建议 一般建议 问题一般分为2类 一类是BUG 还有一类是性能问题 首先提醒一点 如果碰到 Tomcat hang 住或者请求不响应 必须先诊断和排查问题 而不要急着去优化 可以执行
  • 基于51单片机PH值测量液晶lcd1602显示报警设计

    视频演示地址 https www bilibili com video BV1FA41137sa 开机后显示PH值的大小 校准后可直接使用
  • 嵌入式线激光测距传感器

    一 分步说明 摄像头的标定 Small Camera Calibration 1 准备标定图片 标定图片需要使用标定板在不同位置 不同角度 不同姿态下拍摄 最少需要3张 以10 20张最好 标定板需要是黑白相间的矩形构成的棋盘格图 制作精度
  • Matlab获取文件夹下所有指定后缀的文件(包含子文件夹)

    1 要求 获取指定文件夹下 包含子文件夹 所有指定后缀 如txt 的文件路径 即文件所在目录 文件名 返回一个字符串数组 2 代码 获取C Users Administrator Desktop文件夹下 包含子文件夹 的所有 m文件 cle
  • laravel Cros 跨域问题

    我们在用 laravel 进行开发的时候 特别是前后端完全分离的时候 由于前端项目运行在自己机器的指定端口 也可能是其他人的机器 例如 localhost 8000 而 laravel 程序又运行在另一个端口 这样就跨域了 而由于浏览器的同
  • vite预构建解决了三个问题

    1 不同第三方包不同的导出格式 2 对路径上的处理直接使用 vite dep 3 解决了网络多包传输的性能问题 也是esmodule不支持node module的原因 有了依赖构建后 无论每个依赖里面存在多少个export或者import都
  • RobotFramework入门(一)简要介绍及使用

    前言 本章主要讲述Robotframework的简要介绍及使用 一 简要介绍 Robotframework 是一个基于Python语言开发的 可扩展的 是关键字驱动模式的自动化测试框架 Robotframework最新的版本是2019年7月
  • python用神经网络进行二分类,并用网格搜索进行调参,写出代码

    在 Python 中使用神经网络进行二分类的一般流程如下 导入所需的库 如 numpy 和 keras 准备好训练数据和测试数据 定义神经网络模型 在训练数据上训练神经网络 在测试数据上评估神经网络的准确度 如果要使用网格搜索来调参 可以使
  • 千万数据量下的真实业务场景SQL性能优化!

    V xin ruyuanhadeng获得600 页原创精品文章汇总PDF 前 言 通过前几期文章的积累 现在我们的理论知识已经极为扎实了 这个时候就可以动手开始sql优化了 sql优化是非常重要 因为即使再好的MySQL设计架构 也扛不住一
  • mysql8.0 mysqld: File './binlog.index' not found

    2019独角兽企业重金招聘Python工程师标准 gt gt gt mysql8 0启动时报错 mysqld File binlog index not found OS errno 13 Permission denied 修改数据库的路
  • Linux静态库与动态库

    Linux动态库与静态库 前言 Linux动态库与静态库介绍 静态库与动态库的优缺点 代码说明 静态库演示 静态库的命名规则 静态库的制作步骤 静态库的使用 动态库演示 动态库的命名规则 动态库的制作步骤 动态库的使用 静态库与动态库的使用
  • 怎么用Wireshark抓包QQ的到对方的IP地址

    怎么用Wireshark抓包QQ的到对方的IP地址 通过wireshark抓包工具得到对方的IP 一 wireshark Wireshark 前称Ethereal 是一个网络封包分析软件 网络封包分析软件的功能是撷取网络封包 并尽可能显示出
  • matlab 画图

    转 matlab 画图plot 标记符大小调整和填充 2014 01 15 21 00 23 转载 标签 it 分类 Matlab 原文地址 http xiangyan0212 blog 163 com blog static 207037
  • ajax代码复用,可重用的JS ajax模式(jquery)

    我想知道是否有更好的方法来为jquery创建可重用的ajax对象 这是我未经测试的代码 var sender function ajax url type dataType callback ajax url url type type d
  • 【计算机视觉40例】案例22:目标检测(YOLO方法、SSD方法)

    导读 本文是专栏 计算机视觉40例简介 的第22个案例 目标检测 YOLO方法 SSD方法 该专栏简要介绍李立宗主编 计算机视觉40例 从入门到深度学习 OpenCV Python 一书的40个案例 目前 该书已经在电子工业出版社出版 大家
  • 21天Jenkins打卡Day10-自动触发项目构建

    参考文档 http istester com jenkins 437 html
  • 【atlas】atlas 编译报错整理(全)

    前言 最近在编译 apache altas 1 1版本 在编译过程中遇到很多报错 这里整理并记录一下 问题一 org restlet jee 包找不到 问题原因 Maven主仓库中找不到包的解决办法 如org restlet jee not
  • Linux 管道pipeline

    管道符 tar归档目录 gzip压缩 ssh传输并用cat读取标准输入到文件 tar cf kernel linux 6 4 7 gzip ssh user 192 168 123 144 cat gt destination tar gz
  • PyQt学习笔记:使用QtWidgets.qApp实现在程序中随时访问应用的方法

    PyQt学习笔记 使用QtWidgets qApp实现在程序中随时访问应用的方法 在PyQt中 QtWidgets qApp是一个全局变量 它提供了一种在程序中随时访问应用的方法 通过使用qApp 我们可以轻松地获取到应用的实例 并且可以使
  • 模式识别——特征提取(表达)

    特征表达 特征是机器学习系统的原材料 对最终模型的影响是毋庸置疑的 如果数据被很好地表达成了特征 通常线性模型就能达到满意的精度 关于特征 需要考虑以下三方面 1 特征表示的粒度 需要考虑 模型在一个什么程度上的特征表示 才能发挥效果 以图