之前分享了如何用ggplot2可視化GO分析的結果。既然做了GO,當然少不了KEGG了。
我們提供的服務有:成都網站設計、成都網站制作、微信公眾號開發(fā)、網站優(yōu)化、網站認證、阜康ssl等。為上千余家企事業(yè)單位解決了網站和推廣的問題。提供周到的售前咨詢和貼心的售后服務,是有科學管理、有技術的阜康網站制作公司
同樣的,我們從 DAVID 獲取KEGG pathway的結果。
對于KEGG,我比較喜歡做氣泡圖,這樣用兩種形式的圖結合在一起,效果更豐富更好看一點。
利用R語言堆疊圖,我們可以將一個項目中所有樣品的物種組成展示出來。
下面介紹如何利用R語言進行物種組成分析和可視化。過程分為以下幾步:
1)模擬豐度矩陣;
2)模擬分組;
3)標準化豐度;
4)調整格式;
5)ggplot2繪制堆疊圖、沖積圖、分面、分組、堆疊面積圖。
坐標為x,y的點圖 點的size 用另一變量Z控制。
ggplot(data=,aes(x= ,y= ))+geom_point(size= )
數(shù)據準備
氣泡圖(bubble plot):在二維散點圖的基礎上,用點的大小來代表第三個變量的值。
symbols()函數(shù)來創(chuàng)建氣泡圖。該函數(shù)可以在指定的(x, y)坐標上繪制圓圈圖、方形圖、星形圖、溫度計圖和箱線圖。
symbols(x, y, circle=radius)
其中x、y和radius是需要設定的向量,分別表示x、y坐標和圓圈半徑。
你可能想用面積而不是半徑來表示第三個變量,那么按照圓圈半徑的公式(r = /πA )變換即可:
symbols(x, y, circle=sqrt(z/pi))
一般來說,統(tǒng)計人員使用R時都傾向于避免用氣泡圖,原因和避免使用餅圖一樣:相比對長度的判斷,人們對體積/面積的判斷通常更困難。
參考資料:
前面我給大家詳細介紹過
?GO簡介及GO富集結果解讀
?四種GO富集柱形圖、氣泡圖解讀
?GO富集分析四種風格展示結果—柱形圖,氣泡圖
?KEGG富集分析—柱形圖,氣泡圖,通路圖
? DAVID GO和KEGG富集分析及結果可視化
也用視頻給大家介紹過
? GO和KEGG富集分析視頻講解
最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。
氣泡圖
柱形圖
這個圖別說美觀了,簡直不忍直視。經過我的認真研究,發(fā)現(xiàn)跟R版本有關。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數(shù)拿出來認真的研究了一下,終于發(fā)現(xiàn)的癥結所在。
dotplot這個函數(shù),多了個 label_format 參數(shù)
我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原來這個參數(shù)默認值是30,當標簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調節(jié)一下這個參數(shù),把他設置成100,讓我們的標簽可以一行展示。
是不是還是原來的配方,還是熟悉的味道
同樣的柱形圖,我們也能讓他恢復原來的容貌。
關于如何使用R做GO和KEGG富集分析,可參考下文
GO和KEGG富集分析視頻講解
氣泡圖(Bubble Plot)就是由一個個像氣泡元素組成的圖,和普通的散點圖不同,該圖可以展示三維甚至四維信息,如下圖: 點的位置即其橫縱坐標分別代表了Weight和Height,氣泡的大小代表了Age,顏色代表了不同個體。
再舉幾個例子:
上面用了不同形式展示了GO或其他富集的結果。上圖和右下圖中,我們用顏色代表GO的類別,用橫縱坐標代表p-value和z-score,用大小代表富集的基因Count。左下圖我們用顏色代表p-value,用大小代表GeneCount,橫坐標代表GeneRatio,縱坐標代表具體的類別。
從上述例子中可以發(fā)現(xiàn)用氣泡圖我們能展示更多的數(shù)據信息。 隨著多組學研究的涌現(xiàn),我們急需在同一張圖表理展現(xiàn)多維的數(shù)據,氣泡圖就是一個不錯的選擇。
1)需要什么格式的數(shù)據
根據最終想要在氣泡圖上展示數(shù)據的維度以確定數(shù)據的格式。
本次用一個來自于GOplo包的數(shù)據EC,該數(shù)據為RNA-seq的下游分析數(shù)據。
該數(shù)據標準化處理后進行統(tǒng)計分析以確定了差異表達基因。 使用DAVID功能注釋工具對差異表達基因(調整后的p值0.05)進行基因注釋富集分析。
由于本次將使用兩個包一個是GOplot專門用于轉錄組數(shù)據的下游展示,還有一個是我們常用的畫圖包ggplot2, 需要注意的是用于ggplot2的作圖數(shù)據還要基于circ略作修改,具體見下文。
2)如何作圖
GOplot 包提供了直接做氣泡圖的方法:
略調整參數(shù)之后可以對圖的布局、顏色等進行調整:
然后,我們來看一看用常見的包ggplot2應該如何做該圖。
首先我們要對數(shù)據處理一下,剔除一些不必要的信息:
稍作改變,去除圖例添加facet。
往期 R數(shù)據可視化 分享
R數(shù)據可視化6: 面積圖 Area Chart
R數(shù)據可視化5: 熱圖 Heatmap
R數(shù)據可視化4: PCA和PCoA圖
R數(shù)據可視化3: 直方/條形圖
R數(shù)據可視化2: 箱形圖 Boxplot
R數(shù)據可視化1: 火山圖
名稱欄目:r語言go氣泡圖 r語言 氣泡圖
文章路徑:http://jinyejixie.com/article42/hpcgec.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供用戶體驗、營銷型網站建設、網站設計、動態(tài)網站、網站策劃、App設計
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)