什么是数据?
什么是信息?
数据:通过某种方式获取的原始事实或数字。
信息:加入了某种意义的数据。
比如说,33,65;但看这2个数,没有数目意义,因为我们不知道有什么意义,只能叫数据;但是如果说33表示某人的年龄,65标识某人的体重。现在的数字就有意义了。可以成为信息。
————————
数据如何做统计?【均值计算】
常见的统计,都会对数据进行相加,然后有平均数、中位数、众数等;
求和:(西格玛)∑x = x1 + x2 + x3 + …..+ xn
那么均值:我们这样来标记:
(缪)μ = ∑x /n (所有的数字相加之和 ∑)/(数字个数n)
其中均值的专用符号是: (缪)μ ; 是最广泛的统计量之一。
1,2,3,4,4,4,5这些数字的均值是:(1+2+3+4+4+4+5)/7 =33/7=4.7
其实里面的4有好几个重复相加,显得有些傻,我们可以这些来写:
μ = ∑fx/∑f
fx: 每个数字x频数,然后所有乘积相加
f : 频数和
μ = (1x1+2x1+3x1+4x3+5x1)/(1+1+1+3+1) = 4.7
_______
有些异常数据?数据偏移了!【中位数】
如:公司员工工资2k,2k,2k,还有个10k(老板)我们说公司平均工资:4k;
但是员工工资居然都没过平均工资,,不合理啊。。。。
主要是因为什么?就是一个老板超高工资把平均工资拉起来了!这个老板工资我们可以成为异常值!!!
10 | O
8 |
6 |
4 |
2 | O O O
_ _ _ _ _ _ _ _ _ _ _
工资 屌丝1 屌丝2 屌丝3 BOSS
++++++中位数+++++
说白了。就是数据行(2,2,2,10)中间那个,总数是奇数:正中间,总数是偶数:中间2个的平均数;
上面中位数:20
1,从小打到排血;2,奇数或者偶数来决定算法;
何时用均值?何时用中位数?
————————————
众数【第三种平均数】,它是一批数字中最常见的数值,即频树最大的数值。