通过三种方法计算 CCA

2024-03-02

我最近研究了 CCA 的概念，并想在 MATLAB 中实现它。但是有一个现有的 matlab 命令佳能 http://in.mathworks.com/help/stats/canoncorr.html展示。我想编写自己的代码。我对其进行了广泛的研究，发现了三种方法：

1：哈同：该方法使用拉格朗日乘子将问题分解为广义特征值问题。代码可以在这里找到：cca_hardoon http://www.davidroihardoon.com/Professional/Code_files/cca.m为了理智起见，我还在这里给出了代码：数据必须事先居中。

function [Wx, Wy, r] = cca(X,Y)

% CCA calculate canonical correlations
%
% [Wx Wy r] = cca(X,Y) where Wx and Wy contains the canonical correlation
% vectors as columns and r is a vector with corresponding canonical
% correlations.
%
% Update 31/01/05 added bug handling.

if (nargin ~= 2)
  disp('Inocorrect number of inputs');
  help cca;
  Wx = 0; Wy = 0; r = 0;
  return;
end


% calculating the covariance matrices
z = [X; Y];
C = cov(z.');
sx = size(X,1);
sy = size(Y,1);
Cxx = C(1:sx, 1:sx) + 10^(-8)*eye(sx);
Cxy = C(1:sx, sx+1:sx+sy);
Cyx = Cxy';
Cyy = C(sx+1:sx+sy,sx+1:sx+sy) + 10^(-8)*eye(sy);

%calculating the Wx cca matrix
Rx = chol(Cxx);
invRx = inv(Rx);
Z = invRx'*Cxy*(Cyy\Cyx)*invRx;
Z = 0.5*(Z' + Z);  % making sure that Z is a symmetric matrix
[Wx,r] = eig(Z);   % basis in h (X)
r = sqrt(real(r)); % as the original r we get is lamda^2
Wx = invRx * Wx;   % actual Wx values

% calculating Wy
Wy = (Cyy\Cyx) * Wx; 

% by dividing it by lamda
Wy = Wy./repmat(diag(r)',sy,1);

2.MATLAB方法请注意，数据的居中是在代码本身内完成的。

3. CCA by Normal SVD only : This approach does not require the qr decomposition and utilizes the svd decomposition only. I have referred top this article here : cca by svd http://www.cs.columbia.edu/~stratos/research/pca_cca.pdf. Please refer to the text articles below which are taken from the referred article. CCA Algorithm 1 CCA Algorithm 2

我尝试自己编写这个程序，但没有成功。

function [A,B,r,U,V] = cca_by_svd(x,y)
% computing the means
N = size(x,1); mu_x = mean(x,1); mu_y = mean(y,1);
% substracting the means
x = x - repmat(mu_x,N,1); y = y - repmat(mu_y,N,1);

x = x.'; y = y.';
% computing the covariance matrices
Cxx = (1/N)*x*(x.');  Cyy = (1/N)*y*(y.'); Cxy = (1/N)*x*(y.');

%dimension
m = min(rank(x),rank(y));
%m = min(size(x,1),size(y,1));

% computing the quare root inverse of the matrix
[V,D]=eig(Cxx); d = diag(D);
% Making all the eigen values positive
d = (d+abs(d))/2; d2 = 1./sqrt(d); d2(d==0)=0; Cxx_iv=V*diag(d2)*inv(V);

% computing the quare root inverse of the matrix
[V,D]=eig(Cyy); d = diag(D);
% Making all the eigen values positive
d = (d+abs(d))/2; d2 = 1./sqrt(d); d2(d==0)=0; Cyy_iv=V*diag(d2)*inv(V);

Omega = Cxx_iv*Cxy*Cyy_iv;
[C,Sigma,D] = svd(Omega);
A = Cxx_iv*C; A = A(:,1:m);
B = Cyy_iv*D.'; B = B(:,1:m);
A = real(A); B = real(B);
U = A.'*x; V = B.'*y;
r = Sigma(1:m,1:m);

我正在运行这个代码片段：

clc;clear all;close all;
load carbig;
X = [Displacement Horsepower Weight Acceleration MPG];
nans = sum(isnan(X),2) > 0;
x = X(~nans,1:3);
y = X(~nans,4:5);
[A1, B1, r1, U1, V1] = canoncorr(x, y);

[A2, B2, r2, U2, V2] = cca_by_svd(x, y);

[A3, B3, r3] = cca(x.',y.',1);

投影向量如下：

>> A1
A1 =
    0.0025    0.0048
    0.0202    0.0409
   -0.0000   -0.0027
>> A2
A2 =
    0.0025    0.0048
    0.0202    0.0410
   -0.0000   -0.0027
>> A3
A3 =
   -0.0302   -0.0050   -0.0022
    0.0385   -0.0420   -0.0176
    0.0020    0.0027   -0.0001
>> B1
B1 =
   -0.1666   -0.3637
   -0.0916    0.1078
>> B2
B2 =
   -0.1668   -0.3642
   -0.0917    0.1079
>> B3
B3 =
   0.0000 + 0.0000i   0.3460 + 0.0000i   0.1336 + 0.0000i
   0.0000 + 0.0000i  -0.0967 + 0.0000i   0.0989 + 0.0000i

问题：有人可以告诉我哪里出了问题吗？我提到的三种方法都解决相同的问题，理想情况下它们的解决方案应该收敛。我承认我的代码'cca_by_svd'可能是错误的，但hardoon的代码和matlab的输出应该是相同的。请指出我哪里出错了。edit我已经重新检查并更正了我的代码。现在对于这个数据集，方法 2 和 3 收敛。

有几件事是cca(X,Y)不这样做canoncorr does:

一是对数据进行标准化。如果你添加X = normc(X')'（也为Y）到你的cca(X,Y)函数，输出r将匹配canoncorr。如果你调查canoncorr的代码，你会看到它从 QR 分解开始X and Y.

另一个区别是eig按升序对特征值进行排序，因此cca(X,Y)应该翻转输出eig(Z).

注意：尽管纠正了这些差异，我无法完全恢复 Wx 和 Wy 以匹配的输出canoncorr。理想情况下，Wx'*Wx 之间应该完全相同cca and canoncorr.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MATLAB

correlation

通过三种方法计算 CCA 的相关文章

如何选择面积最大的对象？

我用过bwconvhull检测图像的某个部分正如您在图像中看到的那样有许多具有特定质心的对象我想做的是检测面积最大的物体左起第一个大物体并忽略其他物体我应该遵循哪种方法我将非常感谢您的帮助以下是代码由于我仍在努力所以写得
MATLAB：将当前文件夹设置为脚本位置

我在不同的文件夹中有一些脚本和数据我使用addpath和相对路径经常我的问题是只有当我的当前文件夹是我执行的脚本所在的位置时这才有效例如如果我执行添加路径 X 的脚本 A 然后执行位于路径 X 中的脚本 B 则 Matlab 不
斯皮尔曼相关性和联系

我正在一小组配对排名上计算斯皮尔曼的 rho 斯皮尔曼因处理领带不当而闻名例如取2组8个排名即使两组中有6个是平局相关性仍然很高 gt cor test c 1 2 3 4 5 6 7 8 c 0 0 0 0 0 0 7 8 met
通过颜色渐变修补圆

我正在尝试绘制一个颜色渐变我希望它沿轴均匀在下图由角度定义的情况下 pi 7 当我使用patch命令绘图与所需的梯度方向匹配但沿其方向并不均匀沿圆的点之间形成各种三角形这是代码 N 120 theta linspace pi p
如何从 matlab 调用 Qtproject？

我在 matlab 中有一个函数可以写入一个 file txt 我在 qt 项目中使用它 So 当我使用 unix 获取要运行的 qt 编译可执行文件时我有一个 Matlab 文件但出现错误代码 unix home matt Desk
Mathworks 生成 Matlab HTML 文档的方法是什么？

我正在开发共享的 Matlab 代码我们希望在本地网络中将生成的文档作为可搜索的 HTML 文档共享我知道以下生成文档的方法编写一个类似于 C 文件的转换器这是在中完成的将 Doxygen 与 Matlab 结合使用 http ww
绘制布朗运动 matlab

首先我只想说我不太习惯使用matlab 但我需要一个作业我应该创建一个布朗运动我的代码目前如下所示 clf hold on prompt Ge ett input size input prompt numParticles inp
在 Pari-GP 中嵌套特定递归

每个人我最初在 Stackexchange 上发布了类似的问题它已移至此处可以在链接中找到在 Matlab 中声明函数递归序列 https stackoverflow com questions 67146061 declaring
MATLAB问题：在图块中引用变量的值[重复]

这个问题在这里已经有答案了可能的重复 matlab 绘图标题中的变量 https stackoverflow com questions 5629458 matlab variable in plot title 我想在图中引用 m 文件
Matlab strcat 不返回字符串？

imgstr 无法识别 strcat 的输出字符串 homedir C Users images for img 01 bmp 02 bmp 03 bmp imgstr strcat homedir img I imread imgstr
MATLAB：图像角坐标和引用元胞数组

我在比较不同元胞数组中的元素时遇到一些问题这个问题的背景是我正在使用bwboundariesMATLAB 中的函数可追踪图像的轮廓该图像是结构横截面我试图找出整个部分是否具有连续性即只有一个轮廓由bwboundaries命令完成
计算给出数组中最小标准差的子集

让我们有一个大小的向量N 例如 x rand N 1 我想计算长度子集的最小标准差K在向量中 When N and K很小很容易找到最好的子集因为我可以使用nchoosek N K 枚举所有可能的子集但是当值N and K比我们说的要
如何从 Matlab 运行 R 脚本 [重复]

这个问题在这里已经有答案了我有 m 文件我想用它来运行 R 脚本我怎样才能做到这一点 Matlab文件 caller m some matlab code need to call a R script some matlab cod
MATLAB 子图标题和轴标签

我有以下脚本来最终绘制 4 x 2 子图 files getAllFiles preliminaries n size files cases cell 1 n m cell 1 n for i 1 1 n S load files i c
在 numpy/scipy 中查找 matlab 函数

是否有一个等价的函数find A gt 9 1 来自 numpy scipy 的 matlab 我知道有nonzeronumpy 中的函数但我需要的是第一个索引以便我可以在另一个提取的列中使用第一个索引 Ex A 1 2 3 9 6 4
MATLAB - 从目录读取文件？

我希望从目录中读取文件并对每个文件迭代执行操作此操作不需要更改文件我知道我应该为此使用 for 循环到目前为止我已经尝试过 FILES ls path to folder for i 1 size FILES 1 STRU pdbre
使用正常数据直方图与直接公式进行熵估计（matlab）

假设我们已经绘制了n 10000标准正态分布的样本现在我想使用直方图计算其熵来计算概率 1 计算概率例如使用matlab p x hist samples binnumbers area x 2 x 1 sum p p p area b
Matlab 错误：()-索引必须出现在索引表达式的最后

我有这段代码想要在制表符分隔的 txt 文件中写入一个数组 fid fopen oo txt wt for x 1 length s fprintf fid s t n s x 1 end fclose fid 但我收到此错误 Error
如何使用 MATLAB 的“等值面”函数创建三角球体

如何创建一个三角球体其中每个三角形的面面积相同我想要这样的东西 http imageshack us a img198 5041 71183923 png http imageshack us a img198 5041 7118392
如何使用神经网络保存 Sift 特征向量进行分类

SIFT 特征的 Matlab 实现发现于http www cs ubc ca lowe keypoints http www cs ubc ca lowe keypoints 在 stackoverflow 的帮助下我想将功能保存到 m

随机推荐

Java 关闭连接和 findbugs

在我们的代码中我们通常使用以下模式 Connection conn try conn getConnection Do databasey stuff catch Exceptions that get thrown finally tr
如何在内核模块代码中添加poll函数？

据我所知要从内核空间通知用户空间一种方法是使用 poll 这意味着内核驱动程序应该首先提供 poll 方法下面的代码是从网上找到的确实有效 include
Codeigniter：下拉验证 set_rules

我可以知道如何确保用户选择了 Dr Mr Ms Mdm 当他们提交表单时如果称呼为空白它将返回 set rules 的错误消息 Code echo p Salutation salutationOptions array gt Dr g
全局变量sencha touch 2.1

您好我需要定义一个全局变量以在我的应用程序的任何位置使用我声明了一个全局变量baseUrl in my app js 请看下面应用程序 js
HTML5，div，隐藏，点击显示

我有一个 div 末尾有一个按钮我希望当有人按下该按钮时另一个 div 前一个 div 下方应该出现其中包含我将其放入 div 内的内容我正在使用以下代码 HTML div a href REGISTER a div br br
具有两个或多个当前值的 Delphi 进度条

我想在我的软件中制作一种多色条一种进度条但有两个当前值这就是我需要它的原因我有一些预算部分每个部分都有自己的限制 100 美元 1000 美元等我还有一个用于添加新账单并将账单链接到预算部分的编辑表单在这个编辑器中我想
Hibernate 在 ManyToOne 关系中处理长 0 值而不是 NULL

我使用 Hibernate 来访问旧数据库对于某些表不强制执行父子引用完整性并且long对于子表中的某些父列使用 0 值代替 NULL 以表示无父我仍然想使用这些关系 ManyToOne and OneToMany字段但得
无法通过 RIA 服务访问 EntityObject 类型

我的实体框架模型是从 SQL Server 数据库生成的由于我需要从 Silverlight 访问数据库因此我根据 EF 模型为 RIAServices 生成了一个 DomainService Product是自动生成的之一Entity
一次对多个属性使用“转换为自动属性”

我发现自己经常使用 Resharper 的转换为自动属性重构来删除 C 3 0 之前的样板代码有什么方法可以将其应用到单个类中的所有属性立刻 ReSharper 可以做到这一点 Options gt Code Cleanup gt U
Pygame：display.update() 在时钟延迟后才会更新

我正在使用 pygametime Clock以较低的 FPS 运行我的游戏我注意到我的输入似乎需要额外一帧才能生效我做了一些调试发现这不是问题pygame event get 而是与pygame display update 我编写了
DynamoDBScanExpression withLimit 返回的记录多于限制

必须列出 DynamoDB 表中的所有记录无需任何过滤表达式我想限制记录数量因此将 DynamoDBScanExpression 与 setLimit 结合使用 DynamoDBScanExpression scanExpressio
在 Visual Studio 2012 中以编程方式指定专用扩展库

VS 2012 的最新功能之一是能够创建私人延伸画廊 http blogs msdn com b visualstudio archive 2011 10 03 private extension galleries for the ent
异步管道不会将对象数据填充到模板中

谁能帮我看看我的模板中是否存在语法错误它不会给出错误但也不会将数据填充到模板中 div h2 hero h2 h2 hero name details h2 div div div
将额外参数传递给 C# 回调

如何向以下回调添加额外参数 objXmpp OnLogin new ObjectHandler objXmppArun OnLogin private void objXmppArun OnLogin object sender 是否可以向
如何在 JavaScript 中查找到已知位置的距离

在浏览器中使用 JavaScript 如何确定从我当前位置到另一个我有纬度和经度的位置的距离如果您的代码在浏览器中运行您可以使用 HTML5 地理定位 API window navigator geolocation getCurren
Angular JS：如何绑定到 Promise

我正在尝试将承诺与视图绑定我不知道你是否可以直接这样做但这就是我正在尝试做的有什么想法我做错了吗注意源代码在超时方面做了一些设计并使用了静态数据但这是为了使代码更易于诊断 EDIT JSFiddle 页面 http jsfid
与 REST-assured 相比，使用 SOAP UI 来自动化 CI 的 REST 服务是否有优势

我必须在我的项目中自动化 REST API 测试并将其集成到 jenkins 中的现有 CI 中我即将开始使用 REST assured 进行编码但是我碰巧看到 SOAP UI REST 教程并了解到 SOAP UI 中有一个 Mave
如何在 C# 中读取二进制文件？

我有一个存在于文本和二进制图像中的文件我需要从 0 到 30 位置读取相关文本而 31 上的位置将是二进制格式的图像我必须遵循哪些步骤才能解决该问题目前我正在尝试使用它来阅读它FileStream 然后我将 FileStream
.NET 使用错误的 2.0 machine.config 而不是 4.0

我在 IIS 7 0 Windows Server 2008 R1 上安装了 NET Web 应用程序我已在服务器上安装了 NET 4 0 并为 4 0 配置了应用程序池和集成管道由于某种原因我收到以下错误 500 19 The co
通过三种方法计算 CCA

我最近研究了 CCA 的概念并想在 MATLAB 中实现它但是有一个现有的 matlab 命令佳能 http in mathworks com help stats canoncorr html展示我想编写自己的代码我对其进行了广泛

通过三种方法计算 CCA

通过三种方法计算 CCA 的相关文章

随机推荐

热门标签