统计学梳理

今天听师兄做的统计学的专题报告,总结一下学习内容。

一 均值检验

  • 2组样本时:
  1. t检验:参数检验,适用于小样本,正态分布,方差齐性。
  2. 秩和检验: 非参数检验,不是正态分布,更加保守
  • 3组以上样本时:
  1. 方差分析:参数检验,适用于小样本,正态分布,方差齐性
  2. K-W检验:非参数检验,不是正态分布,更加保守
  • PS:
  • 很多代谢组数据用秩和检验会好一些
  • 若T检验的样本量大于30时,改用Z检验
  • T检验里有BH矫正,更加严厉

二 分布检验

很多时候,样本的均数无差别,但是分布有差别。
比如说,均匀分布和正态分布的均值都是1,你能说这两个分布是一样的吗?此时要做分布检验

  1. 卡方检验: 多用于列联表
  2. fisher精确检验
  3. 正态性检验

三 回归 (本质是相关)

  1. 线性回归
  2. 逻辑回归: 往回归里放太多东西的时候,可以用前进法,后退法,逐步回归进行处理
  3. 生存分析: 本质是线性回归,处理截尾数据会更好。做的时候一定要把癌症分期和分级加上
  4. 高维回归:一次处理很多变量
  5. 岭回归
  6. 多元回归:引入混杂变量与协变量。协变量:年龄,性别等等

四 矫正

  1. 归一化:除极差
  2. 标准化:除方差
    让数据进入一个量纲,更加稳定

日后我会针对每一个统计学方法,推出详细的教程,欢迎关注~

    原文作者:PriscillaBai
    原文地址: https://www.jianshu.com/p/25d7a61a66a6
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞