如何用Stata完成(shui)一篇经济学论文(十二):描述性统计、回归与结果保存

2023-11-03

描述性统计

描述性统计的命令我一般使用summerize,用法为summerize加上你所想要总结的变量名称,如果summerize后什么都不加,则表示描述所有变量。

sysuse auto
* 表示描述性统计所有变量 *
summarize
* 表示描述统计mpg,weight两个变量 *
summarize mpg weight

论文中数据部分一般要报告描述性统计和数据说明。描述性统计一报告均值、标准差、最大值、最小值,而数据说明则报告数据指标说明(可省略),单位及数据来源。有些论文会把两个部分合在一起报告,也有的论文直接在正文里报告数据来源,只放描述性统计的表。这个没有统一标准。(表来源在最后)在这里插入图片描述

在这里插入图片描述

描述性统计的主要作用为确认数据是否准确,有无出现极端异常值,主要通过观察:
1. 数据的最大最小值。 通过数据的最大最小值,结合数据本身的一些特性,我们可以初步判断数据是否有问题,比如AQI设定的最大值为500,而且空气污染值一般不会出现0,如果数据中出现AQI超过500,或者等于0,就说明数据有问题。顺带提一句,因为AQI可能出现500“爆表”后浓度与数据不再成正比上升的现象,所以空气污染衡量一般辅以其他的几个指标共同观察。
2. 均值和标准差。 如果标准差>>均值,则数据中可能已经出现极端值和异常值,这时就要对数据进行其他的一些处理。具体可以参考经管之家上的数据预处理

回归命令

回归我一般使用reg命令,关于随机效应、固定效益、DID、RD之类的貌似有已经专门的命令,不过我还是习惯自己用reg这个最原始的命令写:

* 基本命令 *
reg y x1 x2 x3
* 可以与if连用 *
reg y x1 x2 x3 if x3=0

另外reg后加","可以加上option选项,常用的有robust和vce(cluster variable)。
robust 表示考虑了异方差后对标准误进行调整,一般适用于大样本。从目前我的经验来看,这个用用对回归显著性不会有太大影响。
vce(cluster )是聚类标准误,如果某个变量在一个层级上高度相关时,就要用聚类标准误,具体参考这个讨论。聚类标准误会让回归更不容易显著(真的把我结果一下拉低了几个档次!),如果是投期刊一般会被审稿人要求使用,但如果大家是水论文,也就不一定要虐待自己了。
使用方法:

reg y x1 x2 x3,r
reg y x1 x2 x3, vce(cluster var)

结果保存

把回归结果导入到word,我用的asdoc命令,好处是导出结果美观,使用也简单,坏处是,这个命令比较小众,像outreg2的结果好像就可以直接导进latex(我没试过),但如果你的论文全程word操作,也就影响不大。使用方法:

* 第一次使用前要下载 stata命令栏中直接输入*
ssc install asdoc
* 具体命令 *
asdoc 你的命令, 相关选项
* 举个例子 *
asdoc reg y x1 x2 x3, nest vce(cluster var) replace/append drop(x1 x2) cnames(regression1) dec(2) save(filename)

我们把选项具体来说明一下:
1.replace/append,使用replace意思是替换原有文件(如果原来没有就新建一个);append是在原有文件里继续加回归结果,但append不能在同一个word里加太多,加太多会出现Bug,所以建议大家还是多用replace, 多创建几个文件。
2. drop(),意思是导出结果中不导出这几个变量的回归结果,像我经常会加城市或者时间固定效应的哑变量,这些哑变量的回归系数不重要,通常就会用drop(i.citycode i.date)把这些哑变量的结果省略掉。
3. cnames()是在导出结果后,你的给这一列命的名字,会出现在回归列的上方。
4. dec()是保留几位小数,这里保留两位。
5. save()是你保存这个word回归文件所使用的名字,像这里把这个回归的word命名为filename。
6. nest是将回归以压缩格式保存,如果不加这个,导出来的就是stata里显现的那个表格
回归结果用asdoc导出后就长这样:在这里插入图片描述
这个命令不仅可以用来导出回归,描述性统计的结果也可以这样导出,就用类似asdoc summarize var_list,dec(2)的命令,大家可以自己探索。

References
曹静, 王鑫, 钟笑寒. 限行政策是否改善了北京市的空气质量?[J]. 经济学 (季刊), 2014, 13(3): 1091-1126.
陈诗一,陈登科.雾霾污染、政府治理与经济高质量发展[J].经济研究,2018,(2):20-34.
https://bbs.pinggu.org/thread-3651449-1-1.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何用Stata完成(shui)一篇经济学论文(十二):描述性统计、回归与结果保存 的相关文章

  • Turbo跨平台开源渲染引擎

    Turbo跨平台开源渲染引擎 基于Vulkan开发的跨平台渲染引擎 欢迎来参观 使用 提意见 o o Turbo开源引擎地址 Turbo开源引擎开发记录视频
  • NodeJs安装与全局配置

    1 首先我们要到nodejs官网 https nodejs org 上下载node 选择一个自己喜欢的版本下载 我这里选择的是最新版 2 下载完了就直接双击安装 安装过程中可以另外指定安装路径 我的安装路径是E FRONT nodejs 3

随机推荐

  • poi添加倾斜线

    添加倾斜线 org junit Test public void main1 try Workbook wb new XSSFWorkbook Sheet sheet wb createSheet XX销售对照表 CreationHelpe
  • Glide3.7.0源码详解

    基于的Glide版本 3 7 0 本文分析的是Glide最基本的一行代码 Glide with this load url into imageView 我们认准这一个功能点 来看看Glide默默为我们做了什么 这篇文章会分析这行代码背后的
  • 树莓派vlc配置

    本文目的是用树莓派播放一个MP4视频 硬件版本 树莓派3b 系统版本 2018 04 18 raspbian stretch vlc版本 3 0 3 换源 etc apt sources list deb http mirrors aliy
  • java的h2是什么_什么是H2数据库

    展开全部 H2是Thomas Mueller提供的一个开源的 纯java实现的关系数据库 e68a84e8a2ad3231313335323631343130323136353331333366306436 H2是一个开源的嵌入式数据库引擎
  • 《数学之美》——机器学习最佳入门教程

    本文转载至 http www cricode com 3095 html 数学之美系列 目录 作者 吴军 Google研究员 来源 Google黑板报 快课网整理 数学之美 一 统计语言模型 数学之美 二 谈谈中文分词 数学之美 三 隐含马
  • [Python学习] 专题二.条件语句和循环语句的基础知识

    前面讲述了 专题一 函数的基础知识 而这篇文章讲述的Python的条件语句和循环语句的基础知识 主要内容包括 1 条件语句 包括单分支 双分支和多分支语句 if elif else 2 循环语句 while的使用及简单网络刷博器爬虫 3 循
  • ENSP网络综合实验(WALN+隧道+NAT)

    实验拓扑 https wwa lanzoub com ivTyH0w8vz6d 设备接入 汇聚交换机 S3700 S5700 路由器 AR3200 为例 接入层 用户角色包括员工 接入方式包括有线和无线 和访客 仅能通过无线接入 办公WIF
  • java注解反射之自定义Retrofit 项目实战

    java注解反射之自定义Retrofit 项目实战 前言 一 自定义注解 二 自定义按钮事件 三 功能实现 总结 前言 前面我用了两篇的文章 来讲解注解与反射的原理 简单的项目实战 本篇文章我将带领大家 进一步的深入学习 我们将通过代理的方
  • Redis的线程模型,单线程和多线程的抉择

    Redis单线程就应对了大多数场景 但是用户的需求总是无止境的 其次硬件 操作系统均有较高的配置 如果一直使用单线程 也是对硬件的一种浪费了 所以在redis 6 0之后 可以开启多线程 所以面试题又多了一项 简单了解了解就可以了 1 Re
  • 基于MegEngine实现语义分割【附部分源码及模型】

    文章目录 前言 语义分割发展史及意义 一 数据集的准备 二 基于MegEngine的语义分割框架构建 1 引入库 2 CPU GPU配置 3 数据标准化 4 解析数据集到列表中 5 设置数据迭代器 6 获取loader 7 模型构建 8 模
  • 从源代码编译安装 Mono 2.4 和 MonoDevelop 2.0

    从源代码编译安装 Mono 2 4 和 MonoDevelop 2 0 虽然现在几乎所有的Linux发行版都预置了Mono软件 但是大多数都比较旧 因此要体验最新版本的Mono 还是要用源代码自己进行编译安装的 先说几句废话 Mono 2
  • F12打断电调试

    举例 比如一个系统查询信息 点击 查询 显示需要 工号为纯数字 此刻需要F12开发者工具调试 第一步 按下键盘F12 找到Sources 对应的代码 打断点 第二步 在页面右键单击 重新加载框架 此刻会在打断点的地方停止 点击Console
  • [已解决]ln: failed to create symbolic link ‘/usr/bin/python’: File exists

    安装python3 在添加软链时报错如下 翻译过来的意思就是 创建符号链接失败 文件存在 root VM 12 15 centos Python 3 7 6 ln s usr local python3 bin python3 7 usr
  • git学习记录3-----分支操作

    git学习记录3 分支操作 从master分支创建feature A 分支和 fix B 分支 查看分支 创建 切换分支 培育分支实操 首先在READEME md进行修改 切换回master分支 切换回上一个分支 特性分支 主干分支 分支合
  • 判断子序列(C语言)

    判断子序列 思路简单 所用知识比较基础 题目 给定字符串 s 和 t 判断 s 是否为 t 的子序列 字符串的一个子序列是原始字符串删除一些 也可以不删除 字符而不改变剩余字符相对位置形成的新字符串 例如 ace 是 abcde 的一个子序
  • 【OpenCV图像处理】1.18 拉普拉斯算子 - Laplance算子

    文章目录 1 相关理论 2 代码 运行效果 1 相关理论 在上一节已经提到过 f t f t f t 的一阶导就是 f
  • Makefile语法详细总结及示例解析(快速掌握)

    文章目录 一 简介 二 常用规则介绍 2 1 递归扩展变量 2 2 常见的自动化变量解析 2 3 常用的编译器宏定义 2 4 条件语法 2 5 其他特殊变量 1 VPATH变量 2 PHONY变量 3 include变量 4 Q 变量 2
  • 一定要看的VS code安装keil插件的常见问题

    前几天安装了VS code 想在里面写单片机程序 碰到了很多人都会问的问题 看了网络上好多文章都没有解决 后来问了一个学长 才终于解决 一 打开keil工程出现波浪线 出现红色波浪线的主要原因是 没有找到路径 学长说的是 没有包标准C库的两
  • C语言程序设计教程习题和答案-C语言期末复习必看资料

    C语言期末复习必看资料 喜欢的点个赞再走呗 万分感谢
  • 如何用Stata完成(shui)一篇经济学论文(十二):描述性统计、回归与结果保存

    文章目录 描述性统计 回归命令 结果保存 描述性统计 描述性统计的命令我一般使用summerize 用法为summerize加上你所想要总结的变量名称 如果summerize后什么都不加 则表示描述所有变量 sysuse auto 表示描述