之前分享了如何用ggplot2可視化GO分析的結果。既然做了GO,當然少不了KEGG了。
創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務,包含不限于成都做網(wǎng)站、成都網(wǎng)站設計、景泰網(wǎng)絡推廣、重慶小程序開發(fā)公司、景泰網(wǎng)絡營銷、景泰企業(yè)策劃、景泰品牌公關、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等,從售前售中售后,我們都將竭誠為您服務,您的肯定,是我們最大的嘉獎;創(chuàng)新互聯(lián)為所有大學生創(chuàng)業(yè)者提供景泰建站搭建服務,24小時服務熱線:028-86922220,官方網(wǎng)址:jinyejixie.com
同樣的,我們從 DAVID 獲取KEGG pathway的結果。
對于KEGG,我比較喜歡做氣泡圖,這樣用兩種形式的圖結合在一起,效果更豐富更好看一點。
之前的步驟參考:
用David得到了數(shù)據(jù),接下來畫幾張美麗的圖。GO有三個部分,BP,CC, MF。一般我們使用BP。但是這里我們想把三個部分都展示在圖片當中。
單細胞富集分析系列:
單細胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復習一下GO和KEGG富集分析及繪圖。
載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準備見 monocle )
pbmc3k數(shù)據(jù)集只有1個樣本,沒辦法區(qū)分HC和病例組。
若有分組,可以使用subset函數(shù)將某種細胞取出,來做這種細胞病例組和對照組相比的差異基因和富集分析
之所以長短不齊不按順序是因為沒有排序
排完續(xù)之后再畫p值就是按順序的了
附: 單細胞測序數(shù)據(jù)的差異表達分析方法總結
當富集分析完成,拿到如下的分析結果后,就可以進行作圖了。
富集分析結果的可視化無非就是柱狀圖和氣泡圖,但是公司默認出圖實在是太丑,所以還是自己動手修改修改。
一、常規(guī)柱狀圖(ggplot2)
橫軸為gene counts,或者用-logP也行,填充相應的用P值或者gene counts。ggplot畫圖的好處就是可以進行很多調(diào)整。
二、常規(guī)氣泡圖(ggplot2)
氣泡圖與柱狀圖如出一轍,只是在展示方式上出現(xiàn)了差別。一個用geom_bar()函數(shù),氣泡圖類似于散點圖用geom_point()函數(shù)。
三、上下調(diào)同時展示(ggplot2)
很多時候研究者拿到差異基因后,上下調(diào)基因是分別富集的,在展示上需要同時體現(xiàn)二者,我們之前提到metascape可以做到: 轉錄組不求人系列(十二): Cell文章最喜歡用的差異基因GO、KEGG富集分析工具 ,除此之外,之前講過的氣泡圖也可以展現(xiàn)多組的結果: 復現(xiàn)《nature communications》圖表(四):ggplot畫多組富集氣泡圖 。這里我們繼續(xù)提供一種bar圖的展示方式。將down的數(shù)值調(diào)整為負,做一列分組,就可以展示了。
當然了,以上所說的可視化還是比較常規(guī),在基礎上可以自己做調(diào)整。也有一些文章總是標新立意,有很多奇特的展現(xiàn)方式,我們會在之后的系列中講解。
前面我給大家詳細介紹過
?GO簡介及GO富集結果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風格展示結果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認真研究,發(fā)現(xiàn)跟R版本有關。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數(shù)拿出來認真的研究了一下,終于發(fā)現(xiàn)的癥結所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認值是30,當標簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個參數(shù),把他設置成100,讓我們的標簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復原來的容貌。
關于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
注:1)MF和CC方法同BP,將BP改為MF,CC即可。
2)可視化中,showCategory為顯示的item數(shù),scale_y_discrete則調(diào)節(jié)label過長的情況,讓圖片看起來
更美觀。
3)檢查結果,可見geneID展示為gene symbol。
(1)在enrichGO函數(shù)中,設置readable = TRUE;
(2)用setReadable函數(shù),對GO或者KEGG結果進行轉化即可。
標題名稱:gokegg作圖r語言 gokegg作圖david
分享URL:http://jinyejixie.com/article46/dodpjeg.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供云服務器、軟件開發(fā)、企業(yè)建站、標簽優(yōu)化、網(wǎng)站排名、品牌網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)