论文总结——Cluster Canonical Correlation Analysis

2023-10-30

原文链接:

http://xueshu.baidu.com/s?wd=paperuri:(ba0044ede74ce3a08eb2f83cc970284b)&filter=sc_long_sign&sc_ks_para=q%3DCluster+Canonical+Correlation+Analysis&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=15456908664490711842

一、引出问题

CCA是一个常见的处理脑电信号(SSVEP、P300等)的算法,但是CCA算法要求处理的信号必须是配对的,当每个类别有一些数据点有两种不同的方式进行配对时,CCA就无法直接应用。在这篇文章中,对该算法做了拓展和改进,包括Kernel canonical correlation analysis(KCCA)、Mean Canonical Correlation Analysis(Mean-CCA)、Cluster Canonical Correlation Analysis(Cluster-CCA)和Cluster Kernel Canonical Correlation Analysis(cluster-KCCA)

下图表示了各种获取集合之间相关子空间的方法,其中‘’和‘〇’分别代表每个集合中的两个聚类。

 

aCCA:使用集合之间的成对对应关系,不能分离两个集群,(bCCA for sets:计算两个子空间之间的主角,不能处理多个集群,(ccluster-CCA:使用集群内的所有成对对应 (d)Mean-CCA:计算平均聚类向量之间的CCA

二、研究方法


2.1 CCA

首先,先了解一下CCA,两个零均值的多元随机变量\[X\epsilon R^{D_{x}}\]和\[Y\epsilon R^{D_{y}}\],设集合Sx={X1,......,Xn}和Sy={y1,......,yn},CCA的目标是通过选择一个的方向\[w\epsilon R^{D_{x}}\]找到一个新的坐标x,同样通过选择一个方向       \[v\epsilon R^{D_{y}}\],使得在w和v上Sx和Sy的投影之间的相关性最大,


其中,

          

         

       

2.2 KCCA

Kernel canonical correlation analysis通过使用“核技巧”,重新定义CCA来提取非线性关系。


其中,是n*n的核矩阵,kx()和ky()是核函数

         是投影系数 。

注意:CCA和KCCA 都要求数据是成对对应的!

考虑一下,如果有两组数据,每组数据分为C个不同但相互对应的类,令Tx={X1,......,Xn}和Ty={y1,......,yn},其中分别为集合中第C类的数据点。通过选择方向w和v找到X和y的新坐标,使得Tx和Ty在w和v上的投影有最大的相关性,同时,类之间可以很好地分离。但是无法直接计算这些投影之间的相关性,因为他们在w和v上的投影没有任何直接的对应关系。因此提出了Mean-CCA与Cluster-CCA。

2.3 Mean-CCA

Mean-CCA是通过建立两个集合的平均聚类向量之间的对应关系来使之产生一对一的对应关系,令聚类均值

 


其中,

2.4 Cluster-CCA

Cluster-CCA不是建立类均值之间的对应关系,而是建立两个集合中给定类中所有数据点之间的一一对应关系。

其中,

其中,,是成对对应的总数。

注意:Mean-CCACluster-CCA,都假定协方差矩阵是针对零均值随机变量计算的!

Cluster-CCA不适用于大型数据集,因为M随着每个集合的数据数量成二次增长(例如,当|Xc|=|Yc|=L时,M=C(L*L)),其实,协方差矩阵可以定义为:


其实,Mean-CCA与Cluster-CCA相比较来说,忽略了数据本身的一些信息,Cluster-CCA是对数据中的所有点进行估计,因此,Cluster-CCA相对于Mean-CCA来说,性能好很多。

2.5 cluster-KCCA

类似于KCCA,Cluster-CCA也可以扩展到高维空间的非线性投影来观察两个集合间的关系:


其中,

            

三、实验

3.1 实验设计

下面是对通过实验对Cluster-KCCA性能的评估,在所有实验中使用的都是KCCA的正则化版本,通过交叉验证获得正则化常数,文本和图像的核化方法都采用径向X^2(卡方)核,归一化参数被设置为训练集中X^2(卡方)距离的平均值。最后,利用归一化相关得分计算低维投影向量之间的相似性,所有的实验都用随机试验分组重复了十次。

评估是在五个公开的数据集上进行的,分别是Pascal VOC 2007 、TVGraz 、 WikiText-Image Dataset 、Heterogeneous Face Biometrics(HFB) 和Materials Dataset 。

Pascal VOC 2007:包含5011/4952(训练/测试)个图像及其注释,分为20个类别。图像由Pascal挑战提供,图像注释用作文本模式,并且定义在804个关键词的词汇表上。我们将实验限制在属于单个类别的图像和注释中,从而将数据降至2954/3192。其中,一些注释是空的,即不包含关键字,因此形成了两个不同的数据集,即VOC和VOCfull。在VOC 中,删除了所有带有空注释的图像,以保持图像和文本之间的平衡,共得到1905/2032(训练/测试)个数据。在VOCfull中,保留了无注释的图像。VOC和VOCfull的测试集是相同的。

TVGraz:由Khan等人编辑,包含了检索了Caltech-256数据集的10个类的网页,由于版权问题,TVGraz数据集存储为URL列表,并且必须由每个新用户重新编译,我们从网页(2592个网址)中收集了2058个图像和文字,并随机分为1588/500(训练/测试)。

WikiText-Image Dataset:由Rasiwasia等编译。使用维基百科网站上的精选文章。它由2173/693(训练/测试)个图像和10个来自不同类别的文本文章组成。

Heterogeneous Face Biometrics(HFB):包括四个近红外(NIR)图像和四个视觉(VIS)图像,他们各自没有任何自然配对,其中,这两种模式都是图像,但是来自不同的感觉。我们遵循协议,70名受试者的图像用来训练,其余30名作为测试集。

Materials Dataset :由图像以及来自17中不同材料的音频组成,我们与已发表的分类任务和跨模式检索任务的结果进行了比较。

3.2 实验结果

3.2.1 cluster-(K)CCA

使用Pascal数据集的‘bus’、‘car’和‘motorbike’的类构建玩具数据集,下图为Pascal VOC数据集的图像和文本的低维映射和类别区分。


从图中可以清楚地看到,CCA虽然产生了文本与图像之间高度相关的映射,但无法实现类别的区分。而Cluster-KCCA可以实现类别的区分。

3.2.2 跨模态检索

下表为各方法分别在各数据集上的性能


从表中,我们可以看到,mean-CCA的性能高于CCA,KCCA的性能也不是太好,而cluster-CCA和cluster-KCCA的性能明显优于其他算法。

下图为在TVGraz数据集上,各个算法的PR曲线


下图展示了使用cluster-KCCA检索的一些例子,前三行为图像检索到文本的示例,后三个为文本检索到图像的示例




3.2.3 cluster-(K)CCA在VOC(full)上的性能比较

我们在上面已经提到,VOCfull是没有删除无注释图像的数据集,CCA无法应用于这个数据集,因为有一些图像相对应的文本不存在,而cluster-KCCA不需要成对的对应关系,下表列出了cluster-CCA与cluster-KCCA在同样数据集上的检索结果,他们的测试集都是相同的,所以不会因为数据集的差异对结果造成的影响。


从表中可以看出,当有额外的图像(无额外文本)的时候,cluster-(K)CCA算法的性能高于数据完全对应(无任何额外的图像和文本)的数据集,即:额外的图像或者文本有助于提高该算法的性能。

四、结论

将CCA和cluster-CCA核化后,可以将其应用范围扩展至非线性,将CCA改进至cluster- CCA后,可以改进CCA只能应用于所有数据必须成对对应的数据集的性能,即:拓宽了应用范围。当然,也是有一定弊端的,就是在大型数据集上使用时,计算量很大,因为它在计算协方差的时候对数据的数量呈平方的关系增长。

各数据集参考文献:

Pascal VOC 2007 :M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn,
and A. Zisserman. The PASCAL Visual Object Classes
Challenge 2007 (VOC2007) Results. http://www.pascalnetwork.
org/challenges/VOC/voc2007/workshop/index.html.

链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/htmldoc/voc.html

TVGraz :I. Khan, A. Saffari, and H. Bischof. Tvgraz: Multi-modal
learning of object categories by combining textualand visual
features. In Proceedings 33rd Workshop of the Austrian Association

for PatternRecognition, 2009

链接:

http://xueshu.baidu.com/s?wd=paperuri:(8f22858b81aabbd7707db189279d9a4f)&filter=sc_long_sign&sc_ks_para=q%3DTVGraz%3A+Multi-Modal+Learning+of+Object+Categories+by+Combining+Textual+and+Visual+Features&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=9275424831294604053

 WikiText-Image Dataset :N. Rasiwasia, J. Costa Pereira, E. Coviello, G. Doyle,
G.and Lanckriet, R. Levy, and N. Vasconcelos. A new approach
to cross-modal multimedia retrieval. In Proceedings

18th ACM International Conference on Multimedia, 2010

链接:http://xueshu.baidu.com/s?wd=paperuri:(341c8e50c52e1b9a84297fd786343ff9)&filter=sc_long_sign&sc_ks_para=q%3DA+new+approach+to+cross-modal+multimedia+retrieval&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=14965492576112519918

Heterogeneous Face Biometrics(HFB):S. Z. Li, Z. Lei, and M. Ao. The HFB face database for
heterogeneous face biometrics research. In IEEE Conf. on
Computer Vision and Pattern Recognition Workshops, 2009,

pages 1–8.

链接:

http://xueshu.baidu.com/s?wd=paperuri:(dae80635d08b082f8cf0db8404b7b14a)&filter=sc_long_sign&sc_ks_para=q%3DThe+HFB+Face+Database+for+Heterogeneous+Face+Biometrics+research&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=2875153112935655430

Materials Dataset:C. H. Lampert and O. Krmer. Weakly-paired maximum covariance
analysis for multimodal dimensionality reduction
and transfer learning. In Proceedings of the 11th European

conference on Computer vision, pages 566–579, 2010.

链接:

http://xueshu.baidu.com/s?wd=paperuri:(ff0a8601c17f027b59c7393281fccce7)&filter=sc_long_sign&sc_ks_para=q%3DWeakly-Paired+Maximum+Covariance+Analysis+for+Multimodal+Dimensionality+Reduction+and+Transfer+Learning&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=7723943620216524500

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文总结——Cluster Canonical Correlation Analysis 的相关文章

  • DataSpell学习

    今天刚发现一个有用的数据分析软件DataSpell 下载地址 https www jetbrains com zh cn dataspell features 安装很简单 按照步骤一路来就行了 支持ipynb文件 其实和jupyter no
  • pip3 install命令执行时指定源+指定版本

    1 指定源 用法 pip3 install i https pypi tuna tsinghua edu cn simple 3rd MODULE NAME 例如 pip3 install i https pypi tuna tsinghu
  • Ubuntu下为可执行文件和脚本文件(.sh)生成桌面快捷方式

    1 前言 在Ubuntu中 有些软件是安装的 如deb的安装包 用dpkg i安装 有些软件可能是不需要安装 直接解压tar gz这类文件直接就可以运行了 但是每次运行的时候都要输入一遍命令十分麻烦 因此想把它建个快捷方式放到桌面或启动栏里
  • Segformer网络数据流机制

    代码来源 https github com bubbliiiing segformer pytorch 网络特点 结合了Transformers与轻量级的多层感知机 MLP 解码器 包含一个新颖的分层结构的Transformer编码器 该编
  • Anaconda虚拟环境,更新库

    以管理员身份启动 Anaconda Prompt 1 升级Anaconda前需要先升级conda 升级conda conda update conda 2 升级anaconda conda update anaconda base环境 直接
  • qnap安装Linux程序,[Troy]瞎折腾 篇一:【智能家居】威联通QNAP TS-251A安装Ubuntu+Hassio+Samba经验分享...

    原标题 Troy 瞎折腾 篇一 智能家居 威联通QNAP TS 251A安装Ubuntu Hassio Samba经验分享 Home Assistant是一款基于 Python 的智能家居开源系统 支持众多品牌的智能家居设备 可以轻松实现设
  • win11 vs2019下的qt5.15安装配置

    一 vs2019 先前安装过的版本 在此不做赘述 仅为前提条件 二 qt安装 1 qt版本选择 目前qt更新到6 3 但因为6的版本太新 而5 15是一个LTS长期维护版本 维护期一直到2025年 所以在此选择qt5 15版本 2 qt在线
  • 给Tomcat添加第三方jar包、如何在IDEA中启动部署Web模板

    给Tomcat添加第三方jar包 第一种方式 1 将jar包放到lib目录中 2 将jar包加入到模块中 Add as Library 第二种方式 1 可以打开项目结构菜单项目操作界面 添加一个自己的类库 2 添加你类库需要的jar包 3
  • 美国读研计算机 回国后好就业吗,美国留学归国就业前景如何

    很多在美国留学的小伙伴们都会选择在毕业后回国发展 那么 美国留学归国的就业前景如何呢 感兴趣的小伙伴快来阅读出国留学网的这篇文章吧 希望可以为大家提供参考 美国留学回国就业前景 1 医药领域专业人才和相关人才需求量增加比重最大 其中对应的包
  • LaTex加入新package方法

    1 前几天去 https www ctan org 下载booktabs宏包 下载的文件中没有sty文件 有ins文件 用winedit打开ins文件 用late编译 同一个文件夹中得到了一个sty文件 2 将sty文件拷贝到相应的late
  • numpy--广播及np.shape的案例

    numpy广播 最近有一个小需求 给定 a 0 1 2 M 1 1 1 1 求得 T 0 0 0 0 1 1 1 1 2 2 2 2 经过尝试 终于采用如下代码成功 a reshape 3 1 M reshape 1 4 reshape 3
  • PID算法,计算的是差值,是差值

    typedef struct float Kp 比例系数Proportional float Ki 积分系数Integral float Kd 微分系数Derivative float Ek 当前误差 float Ek1 前一次误差 e k
  • JAVA代码实现抖音转载视频无水印视频,亲测通过

    许多小伙伴想做抖音视频 无奈没有摄影器材 也没有取景材料 就想着去用别人人气视频来提高自己的粉丝量 可问题又来了 别人的视频通过分享 或者链接根本不是原创 上面还带着水印 视频一挂上去就被发现了 小则视频不通过 给出警告 大则封号 降低视频
  • Linux centos8安装docker

    1 下载docker ce的repo curl https download docker com linux centos docker ce repo o etc yum repos d docker ce repo 2 安装依赖 yu
  • vue3实现导航栏绑定内容锚点+滚动动画

    目前用的两种方法实现 第一种 原生js实现 注意 因为移动端可滚动区域可能会嵌套在其他架子下 所以需要用到ref获取滚动区域 正常获取scrollTop 前者基于html 后者基于body scrollTop document docume
  • 017-Java-008

    实例变量 实例变量声明在一个类中 但在方法 构造方法和语句块之外 当一个对象被实例化之后 每个实例变量的值就跟着确定 实例变量在对象创建的时候创建 在对象被销毁的时候销毁 实例变量的值应该至少被一个方法 构造方法或者语句块引用 使得外部能够
  • STM32移植lwip之建立web服务器

    本篇目标 在之前能ping通pc机的工程基础上搭建web服务器 借鉴官方web服务器的程序与网页 能够用pc机浏览器访问web服务器 并返回设置的网页 材料准备 基础工程 修改后能ping通pc机的工程 STM32官方移植lwip修改代码
  • Redis中使用Lua的一些优化和注意事项

    EVAL EVALSHA命令 Redis从2 6 0版本开始提供了eval命令 通过内置的Lua解释器 可以让用户执行一段Lua脚本并返回数据 因为Redis单线程模型的特点 可以保证多个命令的原子性 因为最近的项目才想到用Lua 详细的使
  • 火牛(STM32) 多路ADC采样数据经过RS485传输到另一块ARM板路虎(LPC1768)

    调试了好几天终于搞定ADC多路的数据采集 然后通过RS485传输到另一块ARM板上 上程序 火牛开发板基础实验 串口实验 在串口1中输出实验标题 并打印串口1输入的字符 串口中断接收 include stm32f10x h include

随机推荐

  • 嵌入式Linux webserver: Boa+CGI程序设计技术

    摘要 在详细介绍一种嵌入式Web服务器BOA的实现与配置方法的基础上 以一个Web在线远程监控GPIO 通用输入 输出 的程序为实例 介绍嵌入式Linux系统下CPU程序设计技术 关键词 嵌入式系统Linux BOA CGI GPIO 1
  • java中strictfp关键字,java strictfp关键字用法大全详解

    一 strictfp关键字简介 strictfp是Java中提供的一个保留关键字 该关键字是从这第java JDK2版本儿开始出现的一直沿用到现在 只不过很多情况下都不怎么使用 所以容易被大家遗忘 因此今天我们来介绍一下这个关键字的用法和使
  • 【深度学习环境-2】nvidia驱动、cuda安装配置

    一 ubuntu系统安装nvidia驱动 方法一 禁用nouveau驱动 1 打开文件 sudo vim etc modprobe d blacklist conf 2 在末尾添加 blacklist nouveau 3 更新设置 sudo
  • abap append 用法

    转自http blog chinaunix net uid 7982817 id 91999 html Append用法总结 2008 11 14 11 42 19 分类 Syntax APPEND wa INITIAL LINE LINE
  • molloc/free和new/delete的区别

    malloc free和new delete的区别 malloc free和new delete的共同点是 都是从堆上申请空间 并且需要用户手动释放 不同的地方是 malloc和free是函数 new和delete是操作符 malloc申请
  • CSP-S第二轮认证总结——提高组算法总结

    目录 0 前言 一 动态规划 必考必考必考 1 背包 1 01背包 2 完全背包 2 线性DP 3 多维DP 二 贪心 三 模拟 四 图论 很灵活 1 最短路 1 spfa 2 Dijkstra 堆优化 时间复杂度远快于spfa 2 最小生
  • 聚类算法dbscan

    k means k medians 初始化k个类的中心 计算样本点到k个类中心的距离 以此为根据 将这些样本点归类为k类中距离最近的那个类 重新计算k类的中心 直到k类的中心收敛 缺点 需提前知道类数量 优点 速度快 均值漂移 它的原理就是
  • openwrt 中调用json

    对于这种写法 json require json print json encode 1 2 fred first mars second venus third earth 还是这种写法 local json require json p
  • git 提交到某分支,如何将某些提交移动到git中的另一个分支?

    The situation master is at X quickfix1 is at X 2 commits Then I started working on quickfix2 but by accident took quickf
  • python调用搜狗OCR接口实现图片文字识别

    import requests multiple files pic 1111111 jpg open r QQ截图20180905172943 jpg rb image jpg resp requests post r http ocr
  • 自适应控制---自校正PID控制器

    PID算法 其中e 期望输出 实际输出 自校正PID控制器参数的确定 注 F q 1 中有 1 f1q 部分是为了提高分母的次数 便于实现 PID自校正控制算法 对于PI或者P控制 只要将对应的系数去掉即可
  • Android:开启一个服务循环ping服务器,记录ping 5次均失败触发某条件

    import android app Service import android content Intent import android os Handler import android os IBinder import andr
  • SpringMVC(07) -- RESTful

    SpringMVC学习笔记 源码地址 7 1 RESTful简介 REST Representational State Transfer 表现层资源状态转移 7 1 1 资源 资源是一种看待服务器的方式 即 将服务器看作是由很多离散的资源
  • 3、数组——二维数组中的查找(python版)

    剑指Offer 题目描述 在一个二维数组中 每个一维数组的长度相同 每一行都按照从左到右递增的顺序排序 每一列都按照从上到下递增的顺序排序 请完成一个函数 输入这样的一个二维数组和一个整数 判断数组中是否含有该整数 重要信息 二维数组 每行
  • Java合并两个有序的整数数组

    题目描述 给出两个有序的整数数组 A和B 请将数组B 合并到数组 A中 变成一个有序的数组 注意 可以假设A 数组有足够的空间存放 B数组的元素 A和 B中初始的元素数目分别为 m和Nn public class Solution publ
  • 泛微oa主表赋值明细表_Java学习第89天--OA系统

    学习主题 OA系统 学习目标 1 掌握web开发项目实战 熟练使用web开发基础技术 对应作业 1 报销管理 添加报销单 业务层 1 在报销主表和明细表中都有一个字段叫expid 这个字段在数据库中是利用序列获取的 但是在业务层中 我们要控
  • 将postgresql数据库内容导出至sqlite数据库

    上周为应对去外地投标演示网站demo时可能没网的问题 经理让我把远程服务器的postgresql数据库上的数据导出至access或sqlite数据库中 几经波折 终于完成 现将过程记录如下 demo所用S2SH框架 经查询了解hiberna
  • (python 毕业设计)基于“协同过滤”算法的订餐推荐小程序

    B站小程序演示视频 https www bilibili com video BV1Lg411D7mP spm id from 333 337 search card all click 总体架构 核心功能 美食推荐 根据学号查询该学生的消
  • 在linux中DATAX和DATAX-WEB安装指引

    DATAX介绍 DataX 是一个异构数据源离线同步工具 致力于实现包括关系型数据库 MySQL Oracle等 HDFS Hive ODPS HBase FTP等各种异构数据源之间稳定高效的数据同步功能 DATAX WEB介绍 DataX
  • 论文总结——Cluster Canonical Correlation Analysis

    原文链接 http xueshu baidu com s wd paperuri ba0044ede74ce3a08eb2f83cc970284b filter sc long sign sc ks para q 3DCluster Can