缘由
在进行数据分析时,经常会遇到一些分析指标或术语。这些术语是帮助我们打开思路,通过多个角度对数据进行深度解读,可以说是前人已经总结和使用的数据分析方法。下面是数据统计分析常用的指标或术语:
1.平均数
一般指算术平均数。算术平均数是指,全部数据累加除以数据个数。它是非常重要的基础性指标。
几何平均数:适用于对比率数据的平均,并主要用于计算数据平均增长(变化)率。
加权平均数:普通的算术平均数的权重相等,算术平均数是特殊的加权平均数(权重都是1)。
例如,某人射击十次,其中二次射中10环,三次射中8环,四次射中7环,一次射中9环,那么他平均射中的环数为:(10×2+9×1+8×3+7×4)÷10=8.1
2.绝对数与相对数
绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,如GDP。此外,也可以表现在一定条件下数量的增减变化。
相对数是指两个有联系的指标对比计算得到的数值,他是用以反映客观现象逐渐数量联系程度的综合指标。
相对数=比较数值(比数)/基础数值(基数)
基数:对比标准的指标数值。
比数:是用作与基数对比的指标数值。
3.百分比与百分点
百分比表示一个数是另一个数的百分之几的数,也叫百分率。
百分点是用以表达不同百分数之间的“算术差距”(即差)的单位。
用百分数表达其比例关系,用百分点表达其数值差距。1个百分点=1%,表示构成的变动幅度不宜用百分数,而应该用百分点。
举例说,0.05和0.2分别是数,而且可分别化为百分数(5%和20%)。于是比较这两个数值有几种方法:
①0.2是0.05的四倍,也就是说20%是5%的四倍,即百分之四百(400%)。
②0.2比0.05多三倍,也就是说20%比5%多三倍,即百分之三百(300%)。
③0.2比0.05多出0.15,也就是说20%比5%多十五个百分点。
4.频数与频率
频数是指一组数据中个别数据重复出现的次数。
频数是绝对数,频率是相对数。
5.比例与比率
两者都是相对数。
比例是指总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。这一指标经常会用在社会经济领域。
6.倍数与番数
同属于相对数。倍数是一个数除以另一个数所得的商。A÷B=C,A就是C的倍数。(倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。)
番数是指原来数量的2的N次方倍。比如翻一番就是原来数的2倍,翻二番就是原来数乘以4,翻三番就是原来数乘以8。
7.同比与环比
同比是指与历史同时期进行比较得到的数据,该指标主要反映的是事物发展的相对情况。如2012年12月与2011年12月相比。英文翻译同比为year-on-year ratio。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。2010年12月与2010年11月相比。环比英文可翻译为compare with the performance/figure/statistics last month。
同比是与上年的同期水平对比,环比是同一年连环的两期对比。
8.基线和峰值、极值分析
峰值:增长曲线的最高点(顶点),如中国总人口2033年将达峰值15亿,性别比严重失衡。
拐点:在数学上指改变曲线向上或向下方向的点。在统计学中指趋势开始改变的地方,出现拐点后的走势将保持基本稳定。
9.增量与增速
增量是指数值的变化方式和程度。如3增大到5,则3的增量为+2;3减少到1,则3的增量为-2。
增速是指数值增长程度的相对指标。