【r<-基础|实战|统计|转载】 统计中的样本检验基础和R实践

看到一个博客上写的一般检验的R应用总结,挺不错的,分享一下。

本文总结了R in Action一书中提到的关于样本检验的内容,以概要的形式提供给读者以及自己参考。
注: H0表示空假设,即样本检测的假设对象。
独立性检验(列联表)
卡方检验:H0:假设二维表的行和列变量相互独立。stats
包的
chisq.test()*

Fisher精确检验: H0:边界固定的二维列联表行和列独立。stats
包的
fisher.test()*

Cochran-Mantel-Haenszel检验:*H0:两个名义变量在第三个变量的每一层中都是条件独立的。stats
包的.test()

相关性检验
常用系数:Pearson, Spearman, Kendall, 偏相关系数, 多分格polychoric,多系列polyserial

PSK: 相关系数cor(), 协方差cov(),psych
包的corr.test()

偏相关:控制一个或多个定量变量,检验另外两个变量之间的相关性。ggm
包的pcor()

其他类型:polycor
包的hetcor()有多种其他类型的相关函数

相关显著性检验
PSK: cor.test(), corr.test().后者可同时检测多种相关关系。

其他类型:psych
包的pcor.test() & r.test()

分组检测

  1. 参数检验
    独立样本t检验:H0:被检验的两组样本独立且均值相等,并且从正态总体中抽的。stats
    包的
    t.test()*

非独立样本t检验:两组观测相关,一般通过非独立组设计获得,如pre-post design, repeated measures design。 H0:假定组间差异呈正态分布,且均值相等。stats
包的
t.test(.。, paired=TRUE)*

多于两组的非独立样本:如果对比组大于2且满足数据是从正态总体中独立抽样获得的假设,可采用ANOVA方差分析。

  1. 非参数检验: 通常独立样本也被称作单样本(one-sample)检验,非独立样本被称作双样本(two-sample) 检验。单样本检验的自由度是n1+n2-1,双样本检验自由度是n/2-1.
    两组独立样本:可以使用Wilcoxon秩和检验(Mann-Whitney U检验), wilcox.test()

两组非独立样本:可以使用Wilcoxon符号秩检验。它适用于两组成对数据且无法保证正态性假设的情景。stats
包的wilcox.test(.., paired=TRUE)

多于两组的样本:如果各组样本独立,则可使用Krushkal-Wallis检验;如果不独立,可使用Friedman检验。H0:各组的平均值相同。stats
包的
kruskal.test() &friedman.test()。npmc
包的
npmc()*函数可实现非参数的多组比较。

样本检验的一般步骤
提出研究问题,总结出需要通过数据分析得出的问题。

描述空假设和被选假设。空假设的提出通常需要能够通过数据分析得出“接受”或“拒绝”的结论,如均值相等,均值大于X0等。

清楚假设条件。检验过程是在一定的假设条件下进行的,比如通常需要考虑,样本是否独立分布,均值和方差的统计分布等。

根据样本数量和假设条件,选择合适的检验方法,如t检验,以及检验统计量T。

在空假设和观测样本的基础上,计算检验的统计分布,如学生分布或正态分布。

选择合适的统计显著水平p-value,常用的5%和1%。

计算检验统计量T的拒绝区间(critical region),即在该区间内,空假设即被拒绝为真。

根据观测样本,计算检验统计量的观测直t_obs。

得出结论:如果t_obs落在拒绝区间里,则拒绝空假设;否则,无法拒绝空假设。

相关链接:
Statistical hypothesis testing
Exploratory data analysis
Quick-R: t-test

原地址:http://xiaming.me/posts/2014/05/06/%E7%BB%9F%E8%AE%A1%E4%B8%AD%E7%9A%84%E6%A0%B7%E6%9C%AC%E6%A3%80%E9%AA%8C%E5%9F%BA%E7%A1%80%E5%92%8CR%E5%AE%9E%E8%B7%B5/

    原文作者:王诗翔
    原文地址: https://www.jianshu.com/p/b0536cfd549d
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞