1、PROC MEANS分析
PROC MEANS DADA = <数据集名>[<统计量关键字列表>];
[VAR <分析变量列表>;]
[BY|CLASS<分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;
- 统计关键字列表:指定要计算的统计量,省略此项,过程会自动计算观测值、均值、标准差、最大值、最小值5个统计量;
- 分析变量列表:指定所要分析的所有变量,多个变量之间用空格隔开;
- 分组变量列表:指定统计分组变量,多个变量之间用空格隔开;
- means过程中可以使用class和by两个语句进行分组统计,其区别为:
- 使用by时,必须按分组变量排序,使用class无此要求;
- 使用by时,统计结果每组一张表,使用class语句将所有统计结果放在一张表中
统计学生体检表中身高的观测数、均值、标准差、最大值、最小值
proc means data=sashelp.class;
var height;
run;
2、PROC UNIVARIATE分析
PROC UNIVARIATE DATA=<数据集名>[选项];
[VAR<分析变量列表>;]
[BY|CLASS <分组变量列表>;]
[OUTPUT OUT=<输出数据集名> <关键字>=<变量名>...;]
RUN;
UNIVARIATE过程,相比MEANS过程,能够进行更为全面的描述性统计分析;
计算学生体检数据表中体重的各种统计量
proc univariate data=SASHELP.class;
var weight;
run;
在SAS中,必须采用proc univariate过程中的normal命令来检验正态性
3、SGPLOT过程制图
3.1 条形图
proc sgplot [data=数据集];
var|hbar 分类变量名/[选项];
选项:
-
group=变量名 指定数据分组变量
-
groupdisplay=cluster|stack 分组柱形图的方式,默认为satck堆叠
-
response=响应变量名 指定要汇总的数值变量
-
stat=means|freq|sum 未指定响应变量时,默认统计量是freq;指定了响应变量时,默认sum
-
datalabel = 变量名 该变量的值显示为每个bar的标签值
-
Barwidth=n 指定条形的宽度,范围为0.1-1,默认值为0.8
绘制条形图坐标轴:
proc sgplot[data=数据集];
XAXIS|YAXIS [选项]; /*定义坐标轴*/
选项:
3.2 盒形图
proc sgplot[data=数据集];
VBOX|HBOX 连续变量名/[选项];
选项:
3.3 直方图
proc sgplot[data=数据集];
Histogram 连续变量名/[选项];
选项:
4、GPLOT制作点线图
绘制散点图和连线图
PROC GPLOT DATA=<数据集名>;
PLOT<纵轴变量>*<横轴变量>[=<分组变量>][/<选项1>];
[SYMBOL<N> <选项2>];
RUN;
5、GCHART过程制图
GCHART可以绘制方块图、条形图、饼图、环形图等
PROC GCHART DATA=<数据集名>;
<图形关键字><变量名>/<选项列表>;
RUN;
图形关键字 | 图形类型 |
---|
block | 方块图 |
hbar | 水平条形图 |
hbar3d | 三维水平条形图 |
vbar | 垂直条形图 |
vbar3d | 三维垂直条形图 |
pie | 饼图 |
pie3d | 三维饼图 |
donut | 环形图 |
star | 星型图 |
<选项列表>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)