【r<-基础|实战|统计|转载】统计中的样本检验基础和R实践

2019年10月20日 92次阅读来源: 王诗翔

看到一个博客上写的一般检验的R应用总结，挺不错的，分享一下。

本文总结了R in Action一书中提到的关于样本检验的内容，以概要的形式提供给读者以及自己参考。
注: H0表示空假设，即样本检测的假设对象。
独立性检验（列联表）
卡方检验：H0:假设二维表的行和列变量相互独立。stats
包的chisq.test()*

Fisher精确检验: H0:边界固定的二维列联表行和列独立。stats
包的fisher.test()*

Cochran-Mantel-Haenszel检验：*H0:两个名义变量在第三个变量的每一层中都是条件独立的。stats
包的.test()

相关性检验
常用系数：Pearson, Spearman, Kendall, 偏相关系数, 多分格polychoric,多系列polyserial

PSK: 相关系数cor(), 协方差cov(),psych
包的corr.test()

偏相关：控制一个或多个定量变量，检验另外两个变量之间的相关性。ggm
包的pcor()

其他类型：polycor
包的hetcor()有多种其他类型的相关函数

相关显著性检验
PSK: cor.test(), corr.test().后者可同时检测多种相关关系。

其他类型：psych
包的pcor.test() & r.test()

分组检测

非独立样本t检验：两组观测相关，一般通过非独立组设计获得，如pre-post design, repeated measures design。 H0：假定组间差异呈正态分布，且均值相等。stats
包的t.test(.。, paired=TRUE)*

多于两组的非独立样本：如果对比组大于2且满足数据是从正态总体中独立抽样获得的假设，可采用ANOVA方差分析。

非参数检验: 通常独立样本也被称作单样本(one-sample)检验，非独立样本被称作双样本(two-sample) 检验。单样本检验的自由度是n1+n2-1，双样本检验自由度是n/2-1.
两组独立样本：可以使用Wilcoxon秩和检验(Mann-Whitney U检验), wilcox.test()

两组非独立样本：可以使用Wilcoxon符号秩检验。它适用于两组成对数据且无法保证正态性假设的情景。stats
包的wilcox.test(.., paired=TRUE)

多于两组的样本：如果各组样本独立，则可使用Krushkal-Wallis检验；如果不独立，可使用Friedman检验。H0:各组的平均值相同。stats
包的kruskal.test() &friedman.test()。npmc
包的npmc()*函数可实现非参数的多组比较。

样本检验的一般步骤
提出研究问题，总结出需要通过数据分析得出的问题。

描述空假设和被选假设。空假设的提出通常需要能够通过数据分析得出“接受”或“拒绝”的结论，如均值相等，均值大于X0等。

清楚假设条件。检验过程是在一定的假设条件下进行的，比如通常需要考虑，样本是否独立分布，均值和方差的统计分布等。

根据样本数量和假设条件，选择合适的检验方法，如t检验，以及检验统计量T。

在空假设和观测样本的基础上，计算检验的统计分布，如学生分布或正态分布。

选择合适的统计显著水平p-value，常用的5%和1%。

计算检验统计量T的拒绝区间(critical region)，即在该区间内，空假设即被拒绝为真。

根据观测样本，计算检验统计量的观测直t_obs。

得出结论：如果t_obs落在拒绝区间里，则拒绝空假设；否则，无法拒绝空假设。

    原文作者：王诗翔
    原文地址: https://www.jianshu.com/p/b0536cfd549d
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。