10万+文章推荐的科研神器,秒杀“谷歌翻译”。不够用?再送两个
介 绍
数值变量如果服从正态分布,采用均数±标准差进行统计描述,采用方差分析进行组间比较,如果组间差异有统计学意义,进一步采用LSD法(也可以是其它方法)进行两两比较。如果不服从正态分布,采用中位数(四分位数间距)进行统计描述,组间比较采用非参数检验(Kruskal-Wallis秩和检验),当组间总的有统计学差异,进一步采用Dunn法(也可以是其它方法)进行多重比较。
我们想比较不同BMI组人群的年龄是否有差异,经正态性检验,年龄不符合正态分布,故选用非参数检验(Kruskal-Wallis秩和检验)。
软件操作
1、导入数据
使用read.delim命令读取剪贴板上的数据,str命令查看数据的样本量和变量数及每个变量的类型,head命令查看数据集的前6行。
2、分类变量因子化
使用factor命令把sex、bmig、work和disease因子化,并添加值标签,使用str命令查看数据类型,使用head命令查看前6行。
3、Kruskal-Wallis秩和检验
使用kruskal.test命令进行Kruskal-Wallis秩和检验,结果显示统计量H=12.365,p=0.002<0.05,提示不同BMI组人群的年龄有差异,但具体是哪两组有差异,还需进一步两两比较。
4、Dunn法进行两两比较
安装并调用FSA包,使用dunnTest命令进行Dunn法,实现对不同BMI组人群年龄的两两比较,p值校正方法选择bonferroni法,可以直接看P.adj列,即为校正后的p值,可以与0.05直接比较。
结果显示Overweight组与Obese组年龄存在差异,统计量Z=3.30,校正后p=0.003<0.05。
注:统计量保留两位小数,p值保留三位小数。
#install.packages(“FSA”)library(FSA)
技能拓展
1、如果要发表SCI,统计方法可以描述为:
Differences in characteristics between groups were analyzed using the Kruskal–Wallis test with Dunn post hoc tests (for continuous variables, R package FSA) or χ2 tests with post hoc tests (for categorical variables, R package fifer).
2、我们之前介绍了如何快速生成研究对象基本特征的Table1(参考《对中文期刊友好的,临床基线资料table快速生成,不学就OUT了》),非常方便,但遗憾的是,对于多组比较,不能提供进一步两两比较的p值。好在,R在实现Kruskal-Wallis秩和检验和两两比较方面还是比较方便的,在得到结果后,我们可以手动把相应p值标注在Table1上。
精品内容介绍
小白学统计训练营,广受好评,如果你正在因为不会数据分析而发愁,加入训练营绝对是一个好的选择,详见《第三期小白变统计高手训练营,开班在即》。
如果你想显著提升统计分析和作图效率,可以考虑加入小白学R技能训练营。
以上两个训练营,这两天都将开班,可联系老师咨询。