NimbleGen疊式探針設(shè)計(jì)芯片用于RNA CaptureSeq技術(shù)進(jìn)行轉(zhuǎn)錄子信息深度挖掘
最近《Nature》雜志上發(fā)布了一個(gè)稱為RNA CaptureSeq的技術(shù)1, 它結(jié)合了RNA序列捕獲以及飽和測(cè)序方法(sequencing-to-saturation),用于深度挖掘轉(zhuǎn)錄組信息。該技術(shù)的最大特點(diǎn)是深度的提高。
實(shí)驗(yàn)中使用了NimbleGen定制型的基因芯片,疊式覆蓋的探針針對(duì)目標(biāo)區(qū)域的轉(zhuǎn)錄子序列設(shè)計(jì),同時(shí)包括基因組中可能出現(xiàn)的未知可變剪切的位點(diǎn)。實(shí)驗(yàn)中,RNA反轉(zhuǎn)錄后,與NimbleGen DNA芯片雜交,然后通過測(cè)序盡可能多地獲得目標(biāo)區(qū)域的轉(zhuǎn)錄子序列,高深度的測(cè)序結(jié)果能夠發(fā)現(xiàn)普通RNA測(cè)序無法發(fā)現(xiàn)的蛋白質(zhì)編碼序列的異構(gòu)體及長非編碼RNA(lncRNAs)。
此次實(shí)驗(yàn)富集前胎足成纖維細(xì)胞轉(zhuǎn)錄組中的近2300個(gè)區(qū)域,最終的測(cè)序結(jié)果相比普通的RNA測(cè)序,得到在目標(biāo)區(qū)域內(nèi)近400倍的測(cè)序數(shù)據(jù)。實(shí)驗(yàn)發(fā)現(xiàn)的新的轉(zhuǎn)錄子,包括一些已經(jīng)被廣泛研究的基因如P53和HOX基因。此外,還確定了一系列長非編碼RNA和數(shù)百個(gè)罕見的對(duì)應(yīng)基因間序列的轉(zhuǎn)錄子。
雖然RNA CaptureSeq方法不能提供轉(zhuǎn)錄組的全貌,但提供了特定區(qū)域詳細(xì)的編碼和非編碼轉(zhuǎn)錄子信息。通過深度測(cè)序結(jié)果,即使轉(zhuǎn)錄水平很低或者只是在細(xì)胞亞群中出現(xiàn)的轉(zhuǎn)錄子也能鑒定。這種定向的方法,可以得到普通轉(zhuǎn)錄組測(cè)序不能得到的覆蓋深度。對(duì)于只對(duì)特定區(qū)域的序列感興趣的研究人員就可以通過這個(gè)方法,低成本高效益的獲取相關(guān)信息。
在此次研究中,研究人員使用定制的是NimbleGen Titanium Optimized Sequence Capture序列捕獲385K芯片,捕獲2265個(gè)基因區(qū)域的77萬RNA堿基序列,這些區(qū)域包含大約50個(gè)已知的蛋白編碼基因和lncRNAs。此外還包括了知之甚少的基因間區(qū)段,這些區(qū)段與核小體修飾有關(guān),影響到基因的轉(zhuǎn)錄。只有利用NimbleGen Sequence Capture芯片的疊式覆蓋探針設(shè)計(jì),才能在相同區(qū)段覆蓋多條探針,從而確定核小體包裝的特征,而核小體的不同包裝會(huì)影響表達(dá)水平。
在進(jìn)行序列捕獲之后,研究人員使用了一短讀長測(cè)序平臺(tái)和羅氏454長讀長測(cè)序兩種二代測(cè)序平臺(tái)進(jìn)行測(cè)序。短讀長測(cè)序平臺(tái)的數(shù)據(jù)提供了轉(zhuǎn)錄子的各種亞型,長度長的羅氏454平臺(tái)提供了詳細(xì)的剪接位點(diǎn)、遺傳變異及基因編輯(gene editing)信息。研究人員首先將兩個(gè)平臺(tái)獨(dú)立數(shù)據(jù)分別于進(jìn)行序列比對(duì),再組合兩者的信息進(jìn)行對(duì)比,獲得了人類胎兒腳成纖維細(xì)胞(human fetal foot fibroblasts)目標(biāo)區(qū)域的轉(zhuǎn)錄子多樣性以及剪接模式。
RNA捕獲富集前的樣本中有48091多個(gè)轉(zhuǎn)錄子序列,其中落在目標(biāo)區(qū)域內(nèi)的序列比例非常低。普通的RNA測(cè)序結(jié)果中, 2040萬個(gè)測(cè)序序列中只有0.21%的序列對(duì)準(zhǔn)目標(biāo)區(qū)域,而進(jìn)行的捕獲富集后測(cè)序?qū)嶒?yàn)產(chǎn)生的2580萬pair-end序列中超過80%落在目標(biāo)區(qū)域內(nèi),相當(dāng)于平均測(cè)序深度提高了4607倍。有近四分之一的轉(zhuǎn)錄子未曾通過普通RNA測(cè)序技術(shù)發(fā)現(xiàn),而另外10%的轉(zhuǎn)錄子在普通RNA測(cè)序中最多只獲得過一個(gè)序列讀數(shù)。
使用羅氏454的GS FLX Titanium平臺(tái),大約獲得31萬條序列。長讀長數(shù)據(jù)幫助驗(yàn)證了近65%的短讀長平臺(tái)測(cè)序獲得的轉(zhuǎn)錄子序列,并且確認(rèn)了新的、罕見的轉(zhuǎn)錄子剪切位點(diǎn),其中一些位于實(shí)驗(yàn)設(shè)計(jì)中覆蓋的基因間隙序列。
數(shù)百個(gè)新發(fā)現(xiàn)的在基因間隙剪切或連接的轉(zhuǎn)錄子,大多未曾在普通的RNA測(cè)序?qū)嶒?yàn)數(shù)據(jù)中獲得,可能因?yàn)樗麄儽磉_(dá)水平很低或者只是存在于一部分細(xì)胞亞群中。這些結(jié)果表明各發(fā)育階段的細(xì)胞和不同組織的細(xì)胞,轉(zhuǎn)錄差異之大可能超過從前的估計(jì)。
通過定制不同的NimbleGen芯片,RNA CaptureSeq的實(shí)驗(yàn)技術(shù)還可以應(yīng)用到其他領(lǐng)域他,如括宿主 - 病原體相互作用,不同物種鑒別,GWAS研究后定向區(qū)段的研究,癌癥相關(guān)區(qū)域轉(zhuǎn)錄子深度測(cè)序等。RNA CaptureSeq方法將幫助研究人員聚焦轉(zhuǎn)錄組中的目標(biāo)區(qū)域,通過在較低成本下提高測(cè)序深度,更全面了解特定區(qū)域轉(zhuǎn)錄子的全面信息。
1. Mercer, T. R., Gerhardt, D. J., Dinger, M. E., Crawford, J., Trapnell, C., Jeddeloh, J. A., Mattick, J. S., & Rinn, J. (2011). Targeted RNA sequencing reveals the deep complexity of the human transcriptome. Nat Biotech, 1546-1696. doi:10.1038/nbt.2024