GO分析有三個過程,GO_CC細(xì)胞組分,GO_BP生物過程, GO_MP分析功能,首先轉(zhuǎn)換成 ENTREZID ,然后利用 clusterProfiler 函數(shù)。
成都創(chuàng)新互聯(lián)公司是一家專注于成都網(wǎng)站制作、成都做網(wǎng)站與策劃設(shè)計,句容網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十年,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:句容等地區(qū)。句容做網(wǎng)站價格咨詢:18982081108
很明顯,這些差異的基因必然與功能改變密切相關(guān),例如,比較患病個體與正常個體的組織表達(dá)譜,不難想到這些表達(dá)顯著改變的基因參與了疾病或免疫相關(guān)的生物學(xué)過程、信號通路等,基因表達(dá)水平的失調(diào)與疾病肯定密不可分。
進(jìn)行GO分析時,需要考慮的一個基礎(chǔ)因素就是基因的GO注釋信息從何處獲取。
GO分析 根據(jù)挑選出的差異基因,計算這些差異基因同GO 分類中某(幾)個特定的分支的超幾何分布關(guān)系,GO 分析會對每個有差異基因存在的GO 返回一個p-value,小的p 值表示差異基因在該GO 中出現(xiàn)了富集。
GO富集分析原理: 有一個term注釋了100個差異表達(dá)基因參與了哪個過程,注釋完之后(模式生物都有現(xiàn)成的注釋包,不用我們自己注釋),計算相對于背景它是否顯著集中在某條通路、某一個細(xì)胞學(xué)定位、某一種生物學(xué)功能。
例如,討論這些差異基因主要映射到哪些GO或KEGG分類條目中,以說明基因表達(dá)的改變會導(dǎo)致哪些調(diào)控途徑原有功能失調(diào),進(jìn)而與表型聯(lián)系起來。通常稱這種分析為GO、KEGG富集分析。
KEGG指的是京都基因與基因組百科全書,通常我們使用KEGG中的pathway模塊,將基因映射到某些通路上,了解基因參與生物體中的代謝過程等。
盡管多重檢驗的校正可以減少假陽性,但并不能從根本上解決GO(或KEGG)富集的問題。GO富集的根本問題在于一個基因?qū)?yīng)的GO term有多個,一個term對應(yīng)多個gene,同時還有層級關(guān)系。
1、蛋白質(zhì)或者基因可以通過ID對應(yīng)或者序列注釋的方法找到與之對應(yīng)的GO號,而GO號可對于到Term,即功能類別或者細(xì)胞定位。 功能富集分析: 功能富集需要有一個參考數(shù)據(jù)集,通過該項分析可以找出在統(tǒng)計上顯著富集的GO Term。
2、1 準(zhǔn)備輸入數(shù)據(jù) 待分析的數(shù)據(jù)就是一串基因名稱了,可以是ensembl id、entrze id或者symbol id等類型都可以。把基因名稱以一列的形式排開,放在一個文本文件中(例如命名“gene.txt”)。
3、最廣為人知的富集分析做法是把上調(diào)、下調(diào)基因分別或者合并,拿來做GO和KEGG富集分析。經(jīng)常有一些數(shù)據(jù)集,拿差異基因做得不到結(jié)果,那是因為確實富集不到任何通路,是正常的。
當(dāng)前題目:r語言做go分析 r語言進(jìn)行g(shù)o分析
本文URL:http://jinyejixie.com/article22/dcdjccc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、做網(wǎng)站、搜索引擎優(yōu)化、用戶體驗、靜態(tài)網(wǎng)站、網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)