数据分析应用统计学之分散性与变异性的测量【极差、四分位差、偏态系数、峰态系数、统计指标】

2023-05-16

文章目录

      • 1、极差与四分位差(R)
      • 2、方差与标准差(西格玛、V)
      • 3、偏态系数与峰态系数(SK、β)
      • 4、统计指标类型

1、极差与四分位差(R)

1)极差:称为全距,极大值减去极小值所得;主要用于衡量能否代表一组数据

2)四分位差:上四分位数-下四分位数所得;反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。

3)极差与四分位差都用来判断数据的离散程度。

2、方差与标准差(西格玛、V)

1)总体方差与标准差(数据未分组时使用)
2.1
2)样本方差与标准差(数据分组过后使用)
2.2
3)方差和标准差是应用最广泛的离散程度测度值,能表明平均数是否可以代表整组数据。

4)离散系数(分析波动)
越小差异性也越小,是标准差与其均值之比:
2.4

3、偏态系数与峰态系数(SK、β)

1)偏态系数(SK)是以标准差为计量单位的算数平均数与众数之差:
3.1

  • SK通常取值为-3 ~ +3之间,其绝对值大,表明偏斜程度大;反之表明偏斜程度越小。

  • 当SK=0时,分布为对称分布; SK<0时,分布呈左偏分布,或称负偏态; SK>0时,分布呈右偏斜分布,或称为正偏态。
    3.2

2)峰态系数(β)
是峰度的测量指标,可以用四阶中心距除以标准差的四次方来计算:
3.3

  • 当β = 3时,数据的分布峰度表现为与正态相同;
  • 当β > 3时,为尖顶分布,表明数据分布曲线的顶部较正态分布曲线更为陡峭,且越大,顶部就越陡峭;
  • 当β < 3时,为平顶曲线,表明数据分布在众数附近比较分散,使得频数分布曲线的峰顶较正态分布曲线平缓,且值越小,顶部就越加平坦。

4、统计指标类型

1)绝对数
统计数据的基本形式,现象的总体规模和水平一般用绝对数形式展现。如总下载量、成交总额、货物周转量等。

2)相对数
两个相互联系的绝对数对比得到,反映事物的相对数量。如结构相对数、动态相对数、比较相对数、计划完成相对数。

3)平均数
反映现象总体的一-般水平。如人均使用时长、日均浏览量、人均订单数等。

4)数量指标
数量指标包括标志总量和总体单位总量,用来反映客观事物的规模或水平的指标。如下载量、 成交总额、留存数等。

5)质量指标
质量指标由两个数量指标对比求得,它由数量指标派生而出,用来反映客观现象之间的相互联系。如投资回报率、人均使用时长、人均订单数等。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析应用统计学之分散性与变异性的测量【极差、四分位差、偏态系数、峰态系数、统计指标】 的相关文章

随机推荐