3分钟了解GO/KEGG功能富集分析(三)

3分钟搞定GO/KEGG功能富集分析(二)文章的结尾,我们得到了一个基因列表的功能富集结果(如下图所示)。但如果想把结果最展示在文章中(箭头所指),还需要一些绘图的操作。今天,我们就重点来讲解如何将DAVID中的功能富集的结果转换成正式的Figure

《3分钟了解GO/KEGG功能富集分析(三)》

阅读文献时,大家遇到最多的就是柱状图(一般是水平柱状图),柱子的高低与p-value相关,柱子越高则越显著。我也问过很多人,喜欢哪种图片来展示功能富集的结果,曾经有人跟我说,特别喜欢那种大大小小的彩点图……

《3分钟了解GO/KEGG功能富集分析(三)》

我想了一下,觉得这位耿直的同学说的应该是高级气泡图,想必有不少人见过气泡图,却不知道应该怎么做,连现成的工具也找不到。那么,今天的绘图操作,我们就分为两部分:柱状图 and 气泡图,来给大家详细讲讲如何通过这两种图来展现GO/KEGG功能富集的结果。

                                   柱状图

本文所用的数据即上次演示DAVID操作时所用的数据(大家可以通过识别文末的二维码,向“折耳猫小姐姐”索取)。话说柱状图的制作相当简单,方法也众多,比如Excel,Graphpad prism,SPSS,SAS,Matlab,R等众多软件,这里我们就说最简单实用的—Excel。下面是实战演示,依旧是分步讲解:

Step1:保存数据

将DAVID的结果保存到我们的本地电脑当中,保存文件我推荐用文本文件,即txt文件。原因是用各种编程语言和软件处理起来比较方便。怎么保存呢?非常简单。在你的电脑文件夹中新建一个空白的文本文件,在结果页面中点击“Download File”,进入到结果详情页面,然后一次运行几个快捷键即可,Ctrl+A(全选)- Ctrl+C(复制)-打开空白的文本文件- Ctrl+V(粘贴)- Ctrl+S (保存)- 关闭文本文件即可。

Step2:导入数据

打开Excel,导入数据,将文本文件导入Excel当中。这个步骤相信大家都能操作吧,如果是Windows系统,直接把文件拖过去就好了。为了避免有些时候打开不成功,我们通过“数据”-“自文本”的方法导入数据。

DAVID功能富集作图教程1/5。公众号:科研猫_腾讯视频

Step3:数据转换

在作图之前的我们需要对数据进行一定的处理。假定我们就按照最常见的水平柱状图来做,那么图片的x轴就是-log10(P value),我们需要使用函数把P value转换一下,需要用到一个Excel当中的函数叫做-LOG10(),同时图片的y轴是GO term或者KEGG pathway,这些语义词汇的前缀都带有GO:xxxxxxx~或者hsa:xxxxxx~,为了让我们的figure更简洁明了,我们需要把这些没用的前缀删除,怎么删掉呢?我们需要用到MID()函数。具体操作如下。

DAVID功能富集作图教程2/5。公众号:科研猫_腾讯视频

Step4:绘制图形

得到转换好的数据之后,我们就开始作图啦!一般情况下,GO/KEGG富集出来的结果常规显示top10或top15的数据,因此我们这里选择前10行展现出来。怎么做呢?这个相信大家都会的,直接Excel中“插入”-“图表”即可。

DAVID功能富集作图教程3/5。公众号:科研猫_腾讯视频

                                      

                                    气泡图

气泡图的制作相当复杂,如果手上有现成的文献使用了气泡图来表征功能富集分析的结果,也可以拿出来看一下。首先我们看x轴是Gene Ratio,对应的就是DAVID结果表格中的“%”一列;y轴是富集出来的通路或者GO Term;点的大小表示Gene数;点的颜色最为重要,代表P值的高低。

《3分钟了解GO/KEGG功能富集分析(三)》

所以,图确实很好看,但是做起来实属不易,目前还没有遇到有现成的绘图软件可以帮我们做这样的图片。那怎么办呢?嘿嘿,让小猎豹来教教大家吧。前面的推文中,我们也讲解过R语言,R语言可以说是目前最为流行、最为强大的统计绘图工具,相信我们大家都听说过。即使你对R语言了解不深,不要紧,我们帮大家把代码都写好了,直接运行即可。如果你还没有安装R语言,请参考我们前面的推文(关注微信公众号:科研猫)。在运行这个R代码之前呢,需要安装两个R包ggplot2和Hmisc,然后直接运行bubblePlot.R即可。具体运行过程可见下面短视频,可谓一气呵成,无需数据转换等繁琐步骤,而且最终生成的图极其细致,把首字母大写,字段截取,数字下标等细节都做好了。

DAVID功能富集作图教程4/5。公众号:科研猫_腾讯视频

相信有不少同学对R语言还是不太熟悉,在运行代码的过程当中可能还会遇到不同的问题,可以在文末的留言板中留言哦,小猎豹会及时帮大家解决的。再次强调,操作所需的代码(话说这个代码曾经买到几百块哦)和测试数据可免费获取,识别文末二维码,联系折耳猫小姐姐即可。

到现在为止,关于GO/KEGG功能富集分析就讲完了。我啰哩啰嗦地分了三篇文章来给大家讲解,主要目的是为了让大家彻底搞懂功能富集分析的含义,并掌握具体的操作步骤。当大家真正熟悉了以后,实际操作大概在几分钟时间就可以完成。为了让大家把前面的操作都串联起来,方便学习记忆,在这里我把功能富集分析的一整套操作录制成视频,希望大家能够真正掌握这一实用分析。

DAVID功能富集作图教程5/5。公众号:科研猫_腾讯视频

版面有限,后续教程,且听小猎豹下期娓娓道来吧~

关注“科研猫”公众号,获取更多科研资讯。

想要领取GO/KEGG功能富集分析

全套资料的喵咪们

赶紧联系客服折耳猫小姐姐哟~

《3分钟了解GO/KEGG功能富集分析(三)》
《3分钟了解GO/KEGG功能富集分析(三)》

更多科研新鲜资讯、文献精度和生物信息技能,请关注科研猫公众号

下方点好看,师兄给你更多好看。

《3分钟了解GO/KEGG功能富集分析(三)》

    原文作者:科研猫
    原文地址: https://www.jianshu.com/p/7346006ac9fb
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞