一、为什么要学stata
- 对经济统计、计量比较友好,经济学读博必备、必会
- 窗口菜单和代码完成一定的功能,简单
- 上手简单
- 可靠性强-这里指的是权威性
- 模型种类丰富-类似R包、python模块
二、软件基本解释
1.软件界面
![在这里插入图片描述](https://img-blog.csdnimg.cn/a589445c5033422ba688adcc7c4745df.png)
2.导入示例数据
![在这里插入图片描述](https://img-blog.csdnimg.cn/adac3d98602c4deb96ab1035cf434640.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/127b8f5b378c4e53b53b9bd5e75494ff.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/9b07c1d0cc304a028ef1250722cd4f7e.png)
输入summarize price
,有时候可简写为sum price
![在这里插入图片描述](https://img-blog.csdnimg.cn/499e734c45654c0c87d057ddfee7305f.png)
3.认识几个重要的功能符号
![在这里插入图片描述](https://img-blog.csdnimg.cn/45ba192f43214af6a46e6c16736b02f6.png)
- 1.保存日志
- 2.帮助文档
- 3.绘图编辑
- 4.生成do-file文档
- 5.数据编辑
- 6.数据浏览
三、数据的基本观测
-
describe
返回数据的基本情况,如右下角属性窗口
语法:describe [变量]
,或者不加,注意[]
表示可以加可不加
例子:describe, price
-
count
查看观测变量个数,可以加逻辑判断
语法:count if [变量]>80
,或者不加
例子:describe if price>500
\ describe if missing(rep78)
-
isid
类似于索引,独特的区分出每一个观测值
语法:isid 变量
例子:isid price
,如果报错,这说明不可以独立区分出每一个观测值,这里说明,每个观测值可能存在重复值
-
unique
语法:unique 变量
找唯一
例子:unique mpg weight
四、统计性描述
1.codebook 数据字典使用
可以用于查看数据类型、简单统计量、缺失值、异常值
codebook [] [] [] [,options]
[]
:代表不是必须的
varlist
:变量名单
if
:逻辑判断
in
:第几个到第几个观测值
options
:跟在逗号后面,一些自定义选项
![在这里插入图片描述](https://img-blog.csdnimg.cn/5856c1e2f7db4da7bb9d702d0e81a7b6.png)
l
last
f
first
2.summarize
![在这里插入图片描述](https://img-blog.csdnimg.cn/1b59dfd312ee4452874c8ee25e62e263.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/3afa4a46949048d1b1c4d62922257bca.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/0cd9282e939641e88b9c4108a873b314.png)
Skewness
:偏度
Kurtosis
:峰度
五、图像初步探索
1.histogram 直方图
histogram varname[if] [] [] [,[continuous_opts | discrrte_opts]options]
注意这里的varname是个单独变量
语法:
hist varname
朴素的图
hist varname, freq bin(5) normal
连续的 如果离散的discrete
hist varname, by(varname2)
分组
2.graph box /hbox 箱线图
graph box var
![在这里插入图片描述](https://img-blog.csdnimg.cn/1c4ab199a8f1403ba809acdb03e8166b.png)
hbox
表示横向的直方图
graph box pirce, over(foreign)
分组的直方图
3.vioplot小提琴图
一般情况下,小提琴图比箱线图更好,因为可以看到每一个分位下,数据的观测值数量
![在这里插入图片描述](https://img-blog.csdnimg.cn/0206fdf58bba46bab10038a460749608.png)
语法和图像展示