2.虽然导入进去了,但是文本是无法和数值进行比较的
所以我采用了一个替换的方式,就是把sex里面的male与female换成数字的“1”和“2”,这样再把“1”和“2”换成double型就可以进行回归分析了,因为sex是cell型,是无法与double直接进行比较的,所以要替换,这是我能想出来最笨的方法啦,如果有好的方法,请大神赐教。
代码用replace函数。
如:
A=importdata('insurance.csv')
o=A.textdata
f=o(:,2)
newStr = replace(f,'female','2')%这里就用到了replace函数
newStr2 = replace(newStr,'male','1')
a=newStr2
a1=str2double(a)
charge=csvread('insurance.csv',1,6)
a1(any(isnan(a1)'),:)=[]
n=length(a1);
X=a1
X1=[ones(n,1),X]
charge(any(isnan(charge)'),:)=[]
Y=charge;
[b,bint,r,rint,stats]=regress(Y,X1);
Z=b(1)+b(2)*X;
plot(X,Y,'rp',X,Z,'b');
title(' sex与charges的散点图与回归线');
set(0,'defaultfigurecolor','w');
运行截图:
它的残差图: