中位数、众数和均值都是描述数据集中趋势的统计量,他们各有特点。例如,对于某种商品的各种售价,中位数处在中间的价格,大于和小于中位数的价格各为一半;众数为众多价格中出现频数最多的那个价格;而均值在大部分情况下,数值上不会等于其中的任何一个价格,但是将所有的价格都放在数轴上,均值刚好位于平衡点,即在所有价格的重心上,该点两侧的力矩是相等的,恰好使数轴保持平衡。
当数据为单峯的对称分布时,其中位数、众数与均值是相同的。但如果是单峯的偏态分布,则在均值的两侧,数据的个数不同。显然,中位数在数据个数较多的一侧;由于均值位于平衡点,两侧的力矩相等,则数据个数较多的一侧,每个点相对于均值的力矩(即距离)要小一些。也就是说,数据较多的一侧分布在较小的区间里,更容易出现频数较大的数据(众数)。所以中位数和众数会出现在均值的同侧。
下面利用皮尔森(K.Pearson)经验公式给出更加准确的关系描述。
中位数(median)一般介于均值(mean)和众数(mode)之间,且众数近似地等于3倍的中位数减去2倍的均值,即
mode = 3 median - 2 mean
还可以进一步得到如下两个公式。
*将等式两端同时减去mean,得到
mode - mean = 3(median - mean)
这说明众数与均值的距离约等于中位数与均值距离的3倍。
*将等式两端同时减去median,得到
mode - median = 2(median - mean)
这说明众数与中位数的距离约等于中位数与均值距离的2倍.