基本数据统计方法

背景:
12月份有的同学参加了新工联盟一级的测评考试,一级的内容主要是包括一些计算机基础、大数据基本知识、数据操作和处理、数据分析方法和数据可视化方法,今天就简单分享其中一部分内容(持续更新)。

一、中心位置
1.众数:在一个数据集中出现的次数最多的数。
2.中位数:就是在一组按大小排列好的数列中,位于中间的那个数,如果有两个数,就求中间两个数的平均值。
3.均值:即数据集中数据的平均值,平均数和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值。

二、分散程度
1.方差:
《基本数据统计方法》

2.极值:在数学分析中,函数的最大值和最小值被统称为极值,是给定范围内的函数的最大值和最小值或函数的整个定义域。

三、分布程度
1.偏度:偏度衡量随机变量概率分布的不对称性,是相对于均值不对称程度的度量。
表示:若偏度为负,则均值左侧的离散度比右侧强;若偏度为正,则均值左侧的离散度比右侧弱。对于正态分布(或严格对称分布)偏度等于 0。

2.峰度:峰度是表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。
表示:
①Mesokurtic(峰度= 3):此分布显示峰度3接近零, 极值(离群值)的分布与正态分布相似。
②Leptokurtic(峰度> 3):这种分布显示出比Mekokurtic更大的峰度。 该峰比中胚层更高且更尖锐,表明离群值较大。 在投资世界中,Leptokurtic发行意味着它是高风险的投资。
③Platykurtic:(Kurtosis < 3):此分布显示峰度比中侧偏低。 它的两侧均显示平坦的尾巴,表示离群值较小。 在投资世界中,platykurtic发行意味着它是一种低风险的投资。
《基本数据统计方法》

    原文作者:Do.it
    原文地址: https://blog.csdn.net/qq_40769121/article/details/110530351
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞