大部分的数据分析都希望原始数据是满足正态分布的定距变量。然而,显示是残酷的,在各种研究中,常常需要面对非正态分布的定距数据。为了解决数据的正态性问题,数学家们总结了很多转化方法,但是没有万能神药,都需要对症下药(根据数据…
标签:统计学
统计数据收集方式与收集方法
统计数据收集方式 统计数据来源 直接来源(一手数据):观察实验、统计调查 间接来源(二手数据):网络数据、公开出版物 二手数据收集方式 1.公开出版物 (《 中国统计年鉴》、《中国统计摘要》、《中国 人口统计年鉴》、《世…
数据集中趋势度量:众数、平均数、中位数、几何平均数
即一组数据距离数据中心的靠近程度,反应了一组数据中心的位置所在 数据集中趋势度量的指标有:众数、平均数、中位数、几何平均数等。 众数:即出现次数最多的,常用在不同类别的数量统计中,不受峰值的影响,一组数据中可能会存在多个…
参数估计(点估计和区间估计)
“参数估计是以抽样分布为中介,用样本的参数特征对总体的参数进行数值估计的过程。” 一、点估计 1.点估计就是用样本统计量来估计总体参数。 概念理解:当我们想知道某一总体的某个指标的情况时,测量整体该指标的数值 的工作量太…
统计学知识——标准与标准误差
by:ysuncn(欢迎转载,请注明原创信息) 什么是标准差(stan…
一文详解假设检验、两类错误和p值
我们在生活中会遇到很多带有不确定性的问题,比如什么样的男孩子更容易找到女朋友,拥有什么样的品质更易成功。科学方法告诉我们,面对这些问题,要“大胆假设,小心求证”。而假设检验就是这样的一套方法论。 假设检验的定义 假设检验…
数据的分布形态描述
WK3 数据的分布形态描述 1、事件 必然事件:在条件S下,一定发生的事件,叫做相对条件S的必然事件,简称必然事件。必然事件发生的概率为1,但概率为1的事件不一定是必然事件。 不可能事件:在条件S下,一定不可能发生的事件…
统计学系列——数据分布特征与适用的描述统计量
统计学——数据分布特征与适用的描述统计量 数据分布特征 1、集中趋势 (1)分类数据:众数 (2)顺序数据:中位数 (3)数值型数据:平均数 2、离散程度 (1)分类数据:异众比率 (2)顺序数据:四分位差 (3)数值型…
数据的集中趋势
数据的集中趋势 众数 一组数据中出现频次最高的数 中位数 一组数中间的数 分位数 极差 算数平均数 加权平均数 几何平均数 数据的离散趋势 方差 标准差 极差 平均差 四分位数 第一四分位数 (Q1),又称“较小四分位数…
三阶段DEA方法
转载自:https://blog.csdn.net/weixin_43266960/article/details/99624729 补充: 三阶段DEA模型理论框架 传统DEA基本模型(CCR、BBC、DEA优缺点)三…
分类变量回归: R语言中哑变量编码本质
本篇描述分类变量如何进行回归(翻译自http://www.sthda.com/english/articles/40-regression-analysis/163-regression-with-categorical…
三种T检验的详细区分
关于T检验的方法区分及使用场景介绍如下: 01. 概念 T检验是通过比较不同数据的均值,研究两组数据之间是否存在显著差异。 02. 分类 不同的T检验方法适用于不同的分析场景,具体…