假设我有向量:
y = [1 1.01 1.02 1.03 2 2.01 2.02 3 3.01 3.02 3.03];
c = [0 0 0 0 1 1 1 2 2 2 2 ];
有没有一种矢量化的方法来获得“分组平均值”,即平均值y
对于每个唯一值c
? (这是一个简化的示例;我有类似的东西,但向量大小为数千个,并且 c 的值有数百个)
我可以在 for 循环中完成它,只是想知道它是否可以矢量化。这是我的 for 循环实现:
function [my,mc] = groupmean(y,c)
my = [];
mc = [];
for ci = unique(c)'
mc(end+1) = ci;
my(end+1) = mean(y(c==ci));
end
简短回答:
>> y = [1 1.01 1.02 1.03 2 2.01 2.02 3 3.01 3.02 3.03];
>> c = [0 0 0 0 1 1 1 2 2 2 2 ];
>> groupmeans = accumarray(c'+1,y',[],@mean)
groupmeans =
1.015
2.01
3.015
对上述内容进行解释:accumarray
有点神秘,但是非常有用并且值得了解(而且非常快)。第一个输入是一个向量(它们需要是列向量,这就是为什么它是c'
and y'
)对第二个输入向量的行进行分组。这些元素必须是正整数(出于某种原因),这就是为什么我添加了 1c'
。最后一个输入是函数的句柄,该函数作为累加器应用于 y 中的每组值。
希望这是有道理的!如果不,doc accumarray
:)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)