在過(guò)去的幾十年里,基因治療在罕見(jiàn)病方面取得了重大進(jìn)展。隨著社會(huì)各界對(duì)罕見(jiàn)病的重視,各國(guó)開(kāi)始推出多種政策支持罕見(jiàn)病藥物研發(fā),從臨床前藥物發(fā)現(xiàn)到藥品上市后均有政策驅(qū)動(dòng),罕見(jiàn)病藥物研發(fā)逐漸成為企業(yè)逐鹿的領(lǐng)域。動(dòng)脈網(wǎng)特邀賽業(yè)生物董事長(zhǎng)、清華珠三角研究院AI中心主任韓藍(lán)青,對(duì)罕見(jiàn)病基因治療進(jìn)行深入探討。
我們注意到賽業(yè)生物在罕見(jiàn)病及基因治療領(lǐng)域正在積極布局,賽業(yè)生物是做大小鼠基因編輯的公司,為什么會(huì)進(jìn)入這個(gè)領(lǐng)域呢?
通過(guò)制作體內(nèi)和體外的基因編輯及基因人源化鼠模型,可以幫助基礎(chǔ)研究者進(jìn)行基因功能研究,也可以幫助藥物開(kāi)發(fā)者進(jìn)行藥效學(xué)研究。過(guò)去十幾年我們主要做這類(lèi)大小鼠基因編輯模型和細(xì)胞基因編輯模型,當(dāng)然我們的工作還遠(yuǎn)不局限于此。
罕見(jiàn)病多由單基因突變引起,大多數(shù)病人都無(wú)藥可醫(yī),他們只能默默承受甚至早早夭折。近年來(lái)隨著我國(guó)國(guó)力增強(qiáng),罕見(jiàn)病這個(gè)不被制藥業(yè)看重的領(lǐng)域開(kāi)始受到更多關(guān)注,我國(guó)也開(kāi)始制定罕見(jiàn)病的種類(lèi)名錄。近幾年西方國(guó)家在基因治療上的突破也使領(lǐng)域迅速升溫。這個(gè)領(lǐng)域,在小鼠模型上開(kāi)展研究幾乎是不可逾越的第一步,這正好是我們賽業(yè)生物的專(zhuān)長(zhǎng)。
罕見(jiàn)病的發(fā)病機(jī)理都清楚了嗎?罕見(jiàn)病為什么要用基因治療呢?
本世紀(jì)初科學(xué)家剛剛拿到人類(lèi)基因組計(jì)劃的第一個(gè)草本的時(shí)候異常激動(dòng),認(rèn)為我們很快可以通過(guò)解讀基因組來(lái)攻克人類(lèi)疾病,隨后,一大批基于基因組學(xué)的生物制藥公司也應(yīng)運(yùn)而生。但很快大家發(fā)現(xiàn)事情沒(méi)有這么簡(jiǎn)單。人類(lèi)基因組是一本沒(méi)有太多注釋的天書(shū),要解讀它還要拿出比完成人類(lèi)基因組計(jì)劃大百倍千倍的努力。20年過(guò)去了,雖然問(wèn)題仍然是遠(yuǎn)遠(yuǎn)多于答案,但卻已經(jīng)發(fā)生了翻天覆地的變化。在全球數(shù)以萬(wàn)計(jì)的科學(xué)家的共同努力下,數(shù)以千計(jì)的基因病與數(shù)以千計(jì)的基因之間已經(jīng)建立起關(guān)聯(lián),我們對(duì)罕見(jiàn)病的發(fā)病機(jī)理也越來(lái)越清楚了,這就給我們下一步對(duì)癥下藥創(chuàng)造了條件。
事實(shí)上,我們每個(gè)人身上都攜一些隱性致病突變,沒(méi)有一個(gè)人的基因是完美的。人群中單個(gè)基因上的致病突變大都是小概率事件,因此這些單基因突變導(dǎo)致的疾病往往也是罕見(jiàn)病,但由于罕見(jiàn)病種類(lèi)繁多,已知的就不下七千種,所以涉及全球的病人總數(shù)也達(dá)到了3.5億。這些疾病幾乎都是由于基因缺陷所致,現(xiàn)有的治療手段效果甚微,而在基因?qū)用嫔先ジ深A(yù)有可能在根本上解決問(wèn)題。
那罕見(jiàn)病基因治療為什么現(xiàn)在會(huì)熱起來(lái)呢?
基于二代測(cè)序的基因組學(xué)和數(shù)據(jù)共享加速了新的致病基因的發(fā)現(xiàn),基因治療領(lǐng)域的技術(shù)進(jìn)步和成功案例讓我們對(duì)罕見(jiàn)病治療燃起了希望。在這個(gè)近些年熱起來(lái)的新領(lǐng)域,我們賽業(yè)有天然優(yōu)勢(shì)來(lái)伴跑領(lǐng)域的研究者。過(guò)去十多年,賽業(yè)生物的工作主要是用基因編輯鼠模型和基因編輯細(xì)胞模型幫助科學(xué)家解讀人類(lèi)基因組這本天書(shū),在這個(gè)過(guò)程中,我們積累了大量的生物信息及基因編輯方面的數(shù)據(jù),在本領(lǐng)域持續(xù)的深耕也讓我們?cè)诨蚓庉嫾夹g(shù)方面一直走在行業(yè)前沿,結(jié)合賽業(yè)生物在人工智能領(lǐng)域的深度探索,相信我們可以給科學(xué)家們提供更高效的基因功能解析與基因治療解決方案。
您提到了人工智能,人工智能在這里面能起到什么作用?
首先沒(méi)有大數(shù)據(jù),AI就很難有用武之地。隨著二代測(cè)序技術(shù)的普及和數(shù)據(jù)的全球共享,生物醫(yī)學(xué)研究早已進(jìn)入大數(shù)據(jù)時(shí)代,但生信分析的手段還相對(duì)滯后,比如傳統(tǒng)的GWAS在過(guò)去20年中雖然中規(guī)中舉,但并沒(méi)有給我們帶來(lái)什么驚喜。相比之下,去年Alphafold2預(yù)測(cè)蛋白結(jié)構(gòu)給生物界帶來(lái)了巨大震動(dòng),我們已經(jīng)看到AI全面進(jìn)軍生物界的前兆。
自然界很多東西的特征的所有可能性排列組合可以理解為一個(gè)超高維空間的集合,在這個(gè)幾乎有無(wú)限可能性的混沌的超高維空間里,存在著極少數(shù)有邏輯的特征,比如在所有氨基酸序列排列組合的可能性中存在著可以折疊成蛋白質(zhì)的序列,這些序列只有全部序列的10的20次方分之一,而生命需要的蛋白質(zhì)又是這些可折疊的蛋白質(zhì)中的極少數(shù),要找到它們?nèi)缤蠛漆。AI可以對(duì)海量但有限的數(shù)據(jù)進(jìn)行學(xué)習(xí),從而對(duì)這個(gè)超高維空間的特征形成一種理解,之后AI可以在這個(gè)理解的基礎(chǔ)上做出預(yù)測(cè),指導(dǎo)我們迅速找到我們想要的邏輯。
生命的一個(gè)重要特性是突變引入多樣性并通過(guò)迭代不斷適應(yīng)新環(huán)境;蚝偷鞍椎亩鄻有钥梢泽w現(xiàn)在它們?cè)诟髯缘某呔S可能性空間中的大量可存活形式,Alphafold2就是在過(guò)去50年積累的海量蛋白結(jié)構(gòu)的數(shù)據(jù)基礎(chǔ)上用電腦神經(jīng)網(wǎng)絡(luò)建立了基因序列和蛋白結(jié)構(gòu)在兩個(gè)超高維空間的映射關(guān)系,它的應(yīng)用將是顛覆性的。同樣,我們也可以建立基因突變與疾病、蛋白結(jié)構(gòu)與功能、人的基因與小鼠的基因等等之間的映射關(guān)系,讓AI指導(dǎo)我們?nèi)プ鰧?shí)驗(yàn),這樣不但可以大大提高效率,節(jié)省成本,甚至可以把我們帶到以前去不到的遠(yuǎn)方,比如AI+合成生物學(xué)可能找到生物體中不存在但又對(duì)我們有用的抗體。
賽業(yè)也在做AI方面的工作嗎?
去年我們便組建了生物大數(shù)據(jù)AI加生信的復(fù)合背景團(tuán)隊(duì),團(tuán)隊(duì)成員包括生物學(xué)家、AI算法工程師、生信工程師和IT人員,我們正在罕見(jiàn)病基因治療領(lǐng)域建立數(shù)據(jù)集和算法模型,其中兩個(gè)方面是我們關(guān)注的重點(diǎn):一個(gè)是人類(lèi)基因突變的致病風(fēng)險(xiǎn)預(yù)測(cè)以及相應(yīng)的小鼠疾病模型的設(shè)計(jì);另一個(gè)是目前作為基因治療最好載體的AAV病毒衣殼蛋白的設(shè)計(jì)優(yōu)化。這個(gè)團(tuán)隊(duì)將和我們現(xiàn)有的業(yè)務(wù)團(tuán)隊(duì)緊密配合為研究罕見(jiàn)病及開(kāi)發(fā)下游基因治療的客戶(hù)提供從突變基因的致病風(fēng)險(xiǎn)評(píng)估到小鼠模型制作,到表型分析,到基因治療方案,到AAV載體設(shè)計(jì)直至小鼠模型藥效驗(yàn)證的全套服務(wù),而AI的引入會(huì)大大提高這一進(jìn)程的準(zhǔn)確性和效率,這將是我們的核心競(jìng)爭(zhēng)力。
您提到了人類(lèi)基因突變的致病風(fēng)險(xiǎn)預(yù)測(cè),能具體介紹一下嗎?客戶(hù)為什么會(huì)找你們?cè)u(píng)估?
我們的客戶(hù)群中很大一部分是臨床研究者,他們經(jīng)常會(huì)接觸到各種特殊的臨床案例,尤其是家族基因病的案例,在采集病人樣本做二代測(cè)序和生信分析后數(shù)據(jù)會(huì)給研究人員提示一系列有可能致病的突變,這些研究人員往往找我們做點(diǎn)突變小鼠模型,希望通過(guò)在小鼠上做相應(yīng)的基因突變來(lái)模擬人的疾病表型。
由于難以在數(shù)百甚至上千個(gè)突變中確定哪些突變位點(diǎn)最終導(dǎo)致疾病的發(fā)生,在經(jīng)過(guò)繁瑣費(fèi)時(shí)的生信分析以及濕實(shí)驗(yàn)驗(yàn)證后,研究人員仍需要做多個(gè)甚至幾十個(gè)基因突變小鼠模型對(duì)前期預(yù)測(cè)的致病突變做驗(yàn)證,然后對(duì)這些小鼠進(jìn)行表型分析,進(jìn)一步確定哪些突變會(huì)導(dǎo)致小鼠出現(xiàn)人類(lèi)基因突變后的癥狀。
由于現(xiàn)有的研究手段難以對(duì)大量突變位點(diǎn)做精準(zhǔn)的分析,研究人員做的大量的點(diǎn)突變小鼠往往看不到表型,這造成了極大的資源浪費(fèi)和時(shí)間浪費(fèi)。所以對(duì)于這樣的客戶(hù),我們都建議由我們來(lái)為他們做一個(gè)數(shù)據(jù)分析,對(duì)他們手里的一系列基因突變位點(diǎn)進(jìn)行風(fēng)險(xiǎn)評(píng)估并根據(jù)風(fēng)險(xiǎn)程度高低排序,這樣可以大幅度節(jié)省科研經(jīng)費(fèi),縮短研究時(shí)長(zhǎng)。
目前我們的方法主要是在現(xiàn)有數(shù)據(jù)基礎(chǔ)上結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)訓(xùn)練各種模型,對(duì)基因突變做各個(gè)層面的分析。我們對(duì)疾病類(lèi)型、受影響的蛋白結(jié)構(gòu)、組織類(lèi)型、突變位置等進(jìn)行分類(lèi)評(píng)估,充分考慮各種因素,并考慮之前可能被忽略的因素,這樣可以大大提高命中率。要考慮突變影響的是結(jié)構(gòu)性蛋白還是功能性蛋白,突變對(duì)蛋白質(zhì)折疊的影響,對(duì)RNA剪接的影響等等。我們用先驗(yàn)性的知識(shí)對(duì)模型進(jìn)行訓(xùn)練,并且不斷改進(jìn)和豐富模型,以達(dá)到業(yè)內(nèi)最高水平。我們計(jì)劃于今年年底以數(shù)據(jù)庫(kù)形式開(kāi)放給全球研究人員使用。
您提到基因治療的第一步是拿到合適的小鼠模型,每種罕見(jiàn)病都對(duì)應(yīng)一種小鼠模型嗎?
我們盤(pán)點(diǎn)了過(guò)往這些年做過(guò)的小鼠模型,其中數(shù)以百計(jì)的模型是和罕見(jiàn)病相關(guān)的。但現(xiàn)在我們會(huì)把工作做得更細(xì)致。我們調(diào)查了很多國(guó)內(nèi)外的基因治療研究,第一步無(wú)一例外的是獲得合適的小鼠模型。首先我們要了解客戶(hù)需求,客戶(hù)要解決什么問(wèn)題,有多少成分是做科研,有多少成分是做轉(zhuǎn)化,我們會(huì)對(duì)癥下藥建議一個(gè)最佳的研究路徑。比如dystrophin的突變會(huì)引起DMD或BMD,但已知的致病突變就有三千多個(gè)了,未知的可能更多?梢宰鲆粋(gè)簡(jiǎn)單的dystrophin敲除小鼠,也可以做模仿發(fā)病突變的點(diǎn)突變小鼠,模型的制作方法也可以多種多樣,這些都可以根據(jù)治療方案來(lái)確定。dystrophin這條基因太大了,但我們可以把一個(gè)小型化的micro-dystrophin用AAV帶進(jìn)體內(nèi),也可以用CRISPR或者單堿基編輯器去修正致病突變,或者用反義寡核苷酸來(lái)造成致病外顯子的跳躍,不同的方案需要不同的模型。
你提到了目前熱門(mén)的基因治療載體AAV,這個(gè)你們也做嗎?你們的優(yōu)勢(shì)是什么?
設(shè)計(jì)包裝AAV并在小鼠上做實(shí)驗(yàn)是我們一直在做的事情。最近我們開(kāi)始做AAV的AI輔助定向進(jìn)化。AAV的不同血清型及突變有不同特性,比如包裝效率、組織特異性、免疫逃逸等等。我們通過(guò)合成突變庫(kù)的方法去獲得多樣性的AAV,并進(jìn)行體內(nèi)和體外的實(shí)驗(yàn)以獲得大量數(shù)據(jù),再用這些數(shù)據(jù)去訓(xùn)練我們的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,并用這些模型去做我們需要的AAV衣殼蛋白的序列預(yù)測(cè)。這樣的平臺(tái)非常強(qiáng)大,能夠使AAV優(yōu)化的效率有數(shù)量級(jí)的提高,并找到傳統(tǒng)理性設(shè)計(jì)和定向進(jìn)化找不到的更優(yōu)序列。我們認(rèn)為制藥業(yè)的一個(gè)大趨勢(shì)就是AI+合成生物學(xué),一場(chǎng)革命已經(jīng)悄悄興起了。
AAV是基因治療的一個(gè)非常好的載體,具體的基因治療可以有哪些方案呢?
目前基因治療體外主要用的是慢病毒,體內(nèi)主要用的是AAV,做到臨床階段最多的還是用AAV把表達(dá)缺失或缺陷蛋白的基因帶到體內(nèi)。AAV+CRISPR或者單堿基編輯器還大多停留在動(dòng)物實(shí)驗(yàn)階段。我們還通過(guò)跟業(yè)內(nèi)優(yōu)秀的合作單位建立戰(zhàn)略伙伴關(guān)系來(lái)利用最有效的基因編輯器來(lái)達(dá)到修復(fù)基因的目的,這項(xiàng)工作目前正在進(jìn)行。
您也提到你們的客戶(hù)可能會(huì)做轉(zhuǎn)化,就是上臨床對(duì)吧?
是的,我們的一些客戶(hù)是希望能上臨床的。如果在小鼠上的實(shí)驗(yàn)結(jié)果滿(mǎn)意,下一步可以在大動(dòng)物上做藥效和安全性評(píng)價(jià),這也是我們希望看到的。因?yàn)橹尾【热耸俏覀兒涂蛻?hù)的最終目的。我們的合作伙伴中也有可以生產(chǎn)GMP級(jí)別AAV的公司,我們也歡迎我們的臨床客戶(hù)開(kāi)展研究者發(fā)起的臨床研究。
您是怎么看待基因治療這種新興治療方式的?有倫理問(wèn)題嗎?
有人說(shuō)人類(lèi)改變自身的基因是動(dòng)了上帝的奶酪。確實(shí)如此,人類(lèi)已從改造自然發(fā)展到改造自我,我認(rèn)為基因治療只要不涉及生殖遺傳,就沒(méi)有什么可擔(dān)憂(yōu)的。目前的科學(xué)發(fā)展已經(jīng)具備了基因治療的各種要素。時(shí)不我待,對(duì)于罕見(jiàn)病患者、面對(duì)罕見(jiàn)病患者而束手無(wú)策的臨床醫(yī)生和從事罕見(jiàn)病研究的科學(xué)家來(lái)說(shuō),這扇大門(mén)打開(kāi)得已經(jīng)太遲了,但一旦打開(kāi),后面會(huì)一片光明。
韓藍(lán)青簡(jiǎn)介
賽業(yè)生物科技董事長(zhǎng)
清華珠三角研究院人工智能創(chuàng)新中心主任
國(guó)家重大人才工程入選者
韓藍(lán)青先生本科畢業(yè)于清華大學(xué),后獲得加拿大麥吉爾大學(xué)工程碩士和加拿大女王大學(xué)工商管理碩士,并于麻省理工學(xué)院研修,曾任職三洋電器和阿爾卡特等公司。2006年韓藍(lán)青回國(guó)創(chuàng)立了賽業(yè)生物科技并任董事長(zhǎng)至今。公司專(zhuān)業(yè)從事基因工程模式動(dòng)物、細(xì)胞生物學(xué)產(chǎn)品及服務(wù)等前沿技術(shù)的研究開(kāi)發(fā)。在韓藍(lán)青先生的帶領(lǐng)下,賽業(yè)生物已成為知名的基于模式動(dòng)物的國(guó)際化創(chuàng)新性CRO公司。
2017年韓藍(lán)青先生受聘于清華珠三角研究院任人工智能創(chuàng)新中心主任,承擔(dān)過(guò)多個(gè)國(guó)家和省市級(jí)科研項(xiàng)目,深入探究AI在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用。韓藍(lán)青帶領(lǐng)的團(tuán)隊(duì)已經(jīng)在專(zhuān)業(yè)頂級(jí)學(xué)術(shù)刊物發(fā)表數(shù)篇重要文獻(xiàn),獲得大量發(fā)明專(zhuān)利。