CRISPR-Cas9是一項(xiàng)可對(duì)基因組特定靶基因進(jìn)行編輯的DNA操控技術(shù),該系統(tǒng)由sgRNA和Cas9蛋白組成,Cas9蛋白在sgRNA的引導(dǎo)下對(duì)靶位點(diǎn)處的DNA雙鏈進(jìn)行剪切,并產(chǎn)生一個(gè)平末端的雙鏈DNA缺口,進(jìn)而啟動(dòng)DNA損傷修復(fù)機(jī)制,通過(guò)非同源末端鏈接(Non-homologous end joining,NHEJ)或同源重組(Homologous recombination,HR)的方式將斷裂上下游兩端的序列連接起來(lái)。
目前,CRISPR-Cas9基因編輯技術(shù)在疾病基礎(chǔ)研究、靶點(diǎn)驗(yàn)證、藥物分子的高通量篩選、以及遺傳性疾病的治療等領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用。sgRNA在CRISPR-Cas9基因編輯系統(tǒng)中具有準(zhǔn)確識(shí)別靶基因序列的作用,其效果可影響編輯的效率、是否發(fā)生脫靶等,甚至對(duì)最終基因編輯的效果產(chǎn)生決定性作用。因此,設(shè)計(jì)合理有效的sgRNA是我們實(shí)現(xiàn)基因編輯的重要基礎(chǔ)。
sgRNA設(shè)計(jì)的一般流程如下:
圖1. sgRNA的設(shè)計(jì)流程
靶基因信息的分析
查詢靶基因信息常用的數(shù)據(jù)庫(kù)有NCBI、Ensembl等,在查詢過(guò)程中要注意物種的選擇和確定靶基因在數(shù)據(jù)庫(kù)中的登錄號(hào),避免查找錯(cuò)誤。查詢到目的基因信息后,需進(jìn)一步關(guān)注其所在基因座上下游基因情況、轉(zhuǎn)錄本數(shù)量、外顯子數(shù)量及長(zhǎng)度、翻譯起始位點(diǎn)與終止位點(diǎn)等信息。然后再綜合考量上述信息進(jìn)行下一步的sgRNA設(shè)計(jì)。
此處以查詢?nèi)祟?lèi)Rag1基因?yàn)槔。在NCBI Gene數(shù)據(jù)庫(kù)中輸入需要查找的人類(lèi)Rag1基因,查找的結(jié)果顯示多個(gè)與Rag1相關(guān)的基因,這些基因包括了不同物種的Rag1同源基因。因而查找時(shí)需要注意該基因在NCBI的登錄號(hào)與種屬描述等(圖2a)。點(diǎn)擊查詢目的基因人類(lèi)Rag1基因,顯示出該基因的基本信息。
可在“Download Datasets”下載該基因的相關(guān)序列。在“See related”可查看該基因在Ensembl數(shù)據(jù)庫(kù)中的相關(guān)信息,主要是為了查看該基因的轉(zhuǎn)錄本相關(guān)信息(圖2b)。鏈接到Ensembl數(shù)據(jù)庫(kù)后能查找到該基因的轉(zhuǎn)錄本數(shù)量等相關(guān)信息,此處顯示人類(lèi)Rag1基因有三個(gè)轉(zhuǎn)錄本,并且可以打開(kāi)任意一個(gè)轉(zhuǎn)錄本查看相關(guān)信息(圖2c)。查詢RAG1-201轉(zhuǎn)錄本信息,可打開(kāi)左側(cè)“Exons”查看該轉(zhuǎn)錄本的外顯子等相關(guān)信息(圖2d),即可顯示該轉(zhuǎn)錄本的基本結(jié)構(gòu)(圖2e)。
圖2. 靶基因信息的分析
靶區(qū)域的選擇原則
以基因敲除(KO)為例,基因敲除可采用2種不同策略——移碼突變和片段敲除,雖然不同的策略對(duì)于靶區(qū)域選擇的參考標(biāo)準(zhǔn)有差異,但也需遵循以下原則:
1. 不影響其他基因,尤其是編碼蛋白的基因。挑選靶區(qū)域時(shí)避免選擇與其他基因重疊的區(qū)域(圖3a)。
2. 盡可能影響所有的轉(zhuǎn)錄本,敲除位點(diǎn)最好在編碼區(qū)的前50%,但避免敲除ATG所在的位置(圖3b)
3. 能影響蛋白的功能結(jié)構(gòu)域。
對(duì)于片段敲除,需考慮更多因素:如片段敲除所敲除的外顯子編碼序列之和為非3的倍數(shù)(圖3c),這樣可使靶區(qū)域后面的序列發(fā)生移碼,無(wú)法翻譯出功能蛋白,從而使敲除更徹底。片段敲除所選定的敲除區(qū)域不超過(guò)10Kb,超過(guò)10Kb后編輯效率會(huì)降低。片段敲除的gRNA設(shè)計(jì)在內(nèi)含子上,這樣能敲除整個(gè)外顯子區(qū),避免翻譯出殘留蛋白。并且gRNA的設(shè)計(jì)位點(diǎn)需靠近所敲除的外顯子,這樣可避免產(chǎn)生不可控的剪切信號(hào)而導(dǎo)致形成新的轉(zhuǎn)錄本。敲除區(qū)域前后序列盡量簡(jiǎn)單,方便后續(xù)的PCR鑒定。
圖3. 靶區(qū)域選擇示意圖
(a)基因A與基因B共有一個(gè)外顯子(標(biāo)藍(lán)的外顯子),因此選擇靶區(qū)域時(shí)應(yīng)遵循不影響其他基因的原則,不以共有的外顯子作為靶區(qū)域。(b)存在多個(gè)轉(zhuǎn)錄本時(shí),為了能敲除所有的轉(zhuǎn)錄本,應(yīng)選擇在多個(gè)轉(zhuǎn)錄本均存在,且在編碼區(qū)的前50%的外顯子(此處選擇標(biāo)紅的外顯子)作為靶區(qū)域。(c)片段敲除時(shí),因基因片段過(guò)大不能全部敲除而選擇敲除部分外顯子,敲除片段的編碼序列之和應(yīng)為非3的倍數(shù),使后面的蛋白發(fā)生移碼突變。
gRNA的設(shè)計(jì)
目前有較多提供gRNA設(shè)計(jì)的在線工具,常用的如張鋒實(shí)驗(yàn)的CRISPOR(http://crispor.tefor.net/),只需輸入目標(biāo)序列,選定好種屬基因組與相應(yīng)的PAM,則可以得出多個(gè)gRNA,以及每個(gè)gRNA對(duì)應(yīng)的特異性、切割效率和潛在脫靶位點(diǎn),一般選擇特異性、切割效率得分高的gRNA作后續(xù)實(shí)驗(yàn)(圖4)。
如果需要手動(dòng)設(shè)計(jì)gRNA,則需要考慮其特異性與切割效率。在靶點(diǎn)設(shè)計(jì)時(shí)要綜合考慮所有候選靶點(diǎn)的序列、位置、正負(fù)鏈、GC含量、潛在的脫靶位點(diǎn)等信息。
圖4. CRISPOR在線網(wǎng)頁(yè)設(shè)計(jì)sgRNA流程
脫靶分析
根據(jù)選擇的sgRNA,通過(guò)生物信息學(xué)方法,對(duì)sgRNA進(jìn)行脫靶分析。推薦使用CCTop(https://cctop.cos.uni-heidelberg.de:8043/)在線網(wǎng)頁(yè)進(jìn)行預(yù)測(cè)。將sgRNA序列輸入,選定相應(yīng)種屬基因組進(jìn)行分析(圖5)。并且對(duì)獲得的遺傳材料進(jìn)行檢測(cè)。挑選前10個(gè)潛在脫靶位點(diǎn),通過(guò)PCR測(cè)序驗(yàn)證是否脫靶。如果實(shí)驗(yàn)要求較為嚴(yán)格的,則需要通過(guò)全基因組測(cè)序鑒定脫靶情況。
圖5. sgRNA在CCTop在線網(wǎng)頁(yè)的脫靶分析
sgRNA的設(shè)計(jì),你學(xué)廢了嗎?不過(guò)這僅僅是基因編輯方案設(shè)計(jì)中的一環(huán),基因編輯方案還需要考慮目的基因轉(zhuǎn)錄本分析、轉(zhuǎn)染方法、細(xì)胞克隆形成能力等多種因素,即使一位非常熟練的方案設(shè)計(jì)專(zhuān)家出一份方案都需要幾個(gè)小時(shí)或更長(zhǎng),且疏漏也在所難免。