数据的统计量【均值、中位数、众数】

什么是数据?

什么是信息?

数据:通过某种方式获取的原始事实或数字。

信息:加入了某种意义的数据。

比如说,33,65;但看这2个数,没有数目意义,因为我们不知道有什么意义,只能叫数据;但是如果说33表示某人的年龄,65标识某人的体重。现在的数字就有意义了。可以成为信息。

————————

数据如何做统计?【均值计算】

常见的统计,都会对数据进行相加,然后有平均数、中位数、众数等;

求和:(西格玛)∑x = x1 + x2 + x3 + …..+ xn 

那么均值:我们这样来标记:

(缪)μ = ∑x /n (所有的数字相加之和 ∑)/(数字个数n)

其中均值的专用符号是: (缪)μ ; 是最广泛的统计量之一。

1,2,3,4,4,4,5这些数字的均值是:(1+2+3+4+4+4+5)/7 =33/7=4.7

其实里面的4有好几个重复相加,显得有些傻,我们可以这些来写:

μ = ∑fx/∑f

  fx: 每个数字x频数,然后所有乘积相加

f : 频数和

μ = (1x1+2x1+3x1+4x3+5x1)/(1+1+1+3+1) = 4.7

_______

有些异常数据?数据偏移了!【中位数】

如:公司员工工资2k,2k,2k,还有个10k(老板)我们说公司平均工资:4k;

但是员工工资居然都没过平均工资,,不合理啊。。。。

主要是因为什么?就是一个老板超高工资把平均工资拉起来了!这个老板工资我们可以成为异常值!!!

10 |                 O

8  |

6  |

4  |

2  |     O   O   O   

   _ _ _ _ _ _ _ _ _ _ _

工资      屌丝1 屌丝2 屌丝3 BOSS

++++++中位数+++++

说白了。就是数据行(2,2,2,10)中间那个,总数是奇数:正中间,总数是偶数:中间2个的平均数;

上面中位数:20

1,从小打到排血;2,奇数或者偶数来决定算法;

何时用均值?何时用中位数?

————————————

众数【第三种平均数】,它是一批数字中最常见的数值,即频树最大的数值。

  

    原文作者:doupi520
    原文地址: https://blog.csdn.net/doupi520/article/details/54347990
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞