"De novo" 測序技術(shù)是生物信息學中的一種技術(shù),主要用于確定新的或未知的蛋白質(zhì)或肽段的氨基酸序列。與重復測序相比,這項技術(shù)特別關(guān)注那些尚未被鑒定或者在已有數(shù)據(jù)庫中沒有的蛋白質(zhì)或肽段。
一、 為什么需要De novo測序?
盡管存在大量的已知蛋白質(zhì)序列數(shù)據(jù),但仍然有大量的蛋白質(zhì)和肽段的序列和功能尚未被發(fā)現(xiàn)。De novo測序可以幫助研究人員揭示這些尚未鑒定的蛋白質(zhì)或肽段的氨基酸序列。
二、如何進行De novo測序?
De novo測序主要依賴質(zhì)譜技術(shù),特別是串聯(lián)質(zhì)譜 (Tandem Mass Spectrometry, MS/MS)。在該技術(shù)中,肽段被電離并進入質(zhì)譜儀,在那里它們被進一步分裂成較小的碎片。這些碎片的質(zhì)量被測量并用于推斷原始肽段的氨基酸序列。
三、解析未知肽段的結(jié)構(gòu)與功能:
1、結(jié)構(gòu)解析:
通過De novo測序得到的氨基酸序列可以被用于預測蛋白質(zhì)的三維結(jié)構(gòu)。現(xiàn)代的蛋白質(zhì)結(jié)構(gòu)預測算法,如AlphaFold,已經(jīng)可以基于氨基酸序列準確地預測蛋白質(zhì)的三維結(jié)構(gòu)。
2、功能解析:
一旦得到了肽段或蛋白質(zhì)的結(jié)構(gòu)信息,研究人員可以進一步進行功能實驗,如結(jié)合實驗、酶活性測定等,來確定其生物學功能。此外,通過與已知蛋白質(zhì)或功能域的比較,也可以推測其功能。
圖1
四、De novo測序的挑戰(zhàn):
1、碎片解析的復雜性:
根據(jù)碎片的質(zhì)量推斷原始肽段的序列是復雜的,并且可能會有多種可能的序列。
2、長肽段的測序難度:
長肽段可能會產(chǎn)生大量的碎片,這使得序列推斷更加困難。
3、數(shù)據(jù)量大:
De novo測序產(chǎn)生的數(shù)據(jù)量通常很大,需要強大的計算能力和專業(yè)的軟件來分析。