English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > 單細胞高級分析百篇文獻結果展示匯總(六)

單細胞高級分析百篇文獻結果展示匯總(六)

瀏覽次數(shù):2024 發(fā)布日期:2024-4-22  來源:本站 僅供參考,謝絕轉載,否則責任自負

單細胞數(shù)據(jù)結果提供了不同細胞類型之間的差異表達基因,這些基因參與的生物學通路決定了不同細胞類型的生物功能。因此,針對不同細胞類型的特有基因進行富集分析,可以更好的了解每種細胞類型參與的獨特生物學功能,揭示和理解生物學過程中的關鍵分子機制。富集分析工具有GO、KEGG、GSEA和GSVA等,其中GSEA和GSVA是單細胞文章中常見的富集分析工具。

GSEA富集分析需要預先進行樣本之間的組間對比分析,通常用于Case/Control的實驗設計,可以獲取某個通路的基因集在實驗組和對照組中的上調或下調趨勢。單細胞GSEA富集分析可以對不同比較組之間相同的細胞類型進行分析,也可以對不同的細胞類型進行分析。百篇文獻中出現(xiàn)了15次結果,結果圖如下。

這是GSEA分析中經典結果圖的變形,X軸是實驗中的所有基因,每個黑條是該基因集中的基因,我們可以知道基因在排序列表中的位置。如果基因集位于預先排列的基因列表的頂部,則通過某種度量計算出富集分數(shù)(Enrichment Score,ES),ES為正。如果基因集位于預先排列的基因列表的底部,則ES為負。

img1

復現(xiàn)結果如下:

img2

第一部分:最頂部的折線為某條通路的基因Enrichment Score的折線圖。縱軸為對應的Running ES, 在折線圖中有個峰值,該峰值就是這個基因集的Enrichemnt Score,峰值之前的基因就是該基因集下的核心基因。橫軸代表此基因集下的每個基因,對應第二部分類似條形碼的豎線。

第二部分:類似條形碼的部分,為Hits,每條豎線對應該基因集下的一個基因。

第三部分:為所有基因的rank值分布圖,縱坐標為ranked list metric,即該基因排序量的值,可理解為“公式化處理后的foldchange值”。

我們可以根據(jù)項目需要選擇展示這三個部分結果,或者我們分別展示單個樣本富集結果,示例結果如下:

img3

在GSEA分析后除了經典結果圖的展示,我們還可以用氣泡圖的方法展示geneset被激活還是抑制。上、下調的 GO term /pathway分開展示:

img4

除此之外,我們還可以繪制山巒圖,展示每個geneset的基因logFC分布。

img5

基因集變異分析(Gene Set Variation Analysis, GSVA),是一種非參數(shù)并且無監(jiān)督的分析方法。對每個樣本或單個細胞按基因的表達量進行單獨排序,然后將富集分數(shù)的值做標準化。通過將基因表達矩陣數(shù)據(jù)轉換為基因集表達矩陣數(shù)據(jù),從而對每個樣本/細胞群的通路富集進行分析。分析流程如下,左側輸入基因表達矩陣和基因集數(shù)據(jù)庫,中間是GSVA算法原理,右側是輸出的基因集變異分數(shù)矩陣�;蚣儺惙謹�(shù)可以理解為基因集內所有基因的綜合表達值。

img6

文獻中經常出現(xiàn)的展示結果如下:

img7

復現(xiàn)結果如下:

img8

縱坐標為cluster,橫坐標為通路名稱。紅色代表著這個通路在該細胞類型中激活,藍色代表著這個通路在該細胞類型中是抑制的。

我們還可以在GSVA分析的結果上,進行差異比較分析,展示形式是差異基因集柱狀圖。兩個cluster/cell type/group中具有顯著差異通路的富集程度;矩形越長代表富集程度越大;GSVA score值大于0代表上調的通路,小于0代表下調的通路。

img9

GSEA和GSVA都是基于對基因的某一個值的排序來進行富集分析。而GSEA主要是用case和control之間的差異倍數(shù)或信噪比來進行排序,GSVA則不需要做對比,而是對每個樣本或單個細胞按基因的表達量進行單獨排序,然后將富集分數(shù)的值做個標準化。

以上是我這次關于單細胞轉錄組中富集分析方法的分享。

來源:上海生物芯片有限公司
聯(lián)系電話:400-100-2131
E-mail:marketing@shbiochip.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com