新智元報(bào)道
來(lái)源:外媒
編輯:LQ
【新智元導(dǎo)讀】近日,麻省理工學(xué)院的研究員在《科學(xué)》雜志發(fā)表了一篇論文《學(xué)習(xí)病毒演變和逃逸的語(yǔ)言》,論文描述了研究人員正在利用一種機(jī)器學(xué)習(xí)算法預(yù)測(cè)哪些變異毒株會(huì)對(duì)人類羽翼未豐的免疫系統(tǒng)構(gòu)成最大威脅。
最近幾周,來(lái)自英國(guó)、南非、美國(guó)加州的新冠病毒變異毒株已經(jīng)開(kāi)始在全球范圍內(nèi)傳播。
變異毒株雖然比其祖先致命性低,但似乎傳播性更強(qiáng)。對(duì)于變異毒株,多名專家公開(kāi)表示,目前的疫苗對(duì)其仍然有效。
但是變異毒株會(huì)越來(lái)越多,將來(lái)會(huì)不會(huì)出現(xiàn)一種毒株導(dǎo)致疫苗無(wú)效?研究人員一直在做相關(guān)研究。
1月15日,《科學(xué)》雜志發(fā)布的一篇論文《學(xué)習(xí)病毒演變和逃逸的語(yǔ)言》(Learning the language of viral evolution and escape)(論文鏈接附后),論文描述了麻省理工學(xué)院的研究人員正在利用一種機(jī)器學(xué)習(xí)算法預(yù)測(cè)哪些變異毒株會(huì)對(duì)人類羽翼未豐的免疫系統(tǒng)構(gòu)成最大威脅。
該算法可以用來(lái)快速縮小范圍查找哪些突變最有可能「逃避」接種過(guò)疫苗或以前感染過(guò)的人的免疫系統(tǒng)。然后,研究人員可以在實(shí)驗(yàn)室中測(cè)試可疑毒株,并相應(yīng)地更新疫苗。
「這是疫苗開(kāi)發(fā)的實(shí)時(shí)伴侶,現(xiàn)在用我們的模型做研究的速度會(huì)比實(shí)驗(yàn)室里的研究工作快得多”」,本文作者之一、同時(shí)也是MIT生物工程師的Bryan Bryson說(shuō)。
這個(gè)工具出現(xiàn)在新冠肺炎傳播的關(guān)鍵時(shí)刻,F(xiàn)在,各國(guó)正在逐步開(kāi)始接種疫苗,但接種人數(shù)還很少,比如美國(guó),只有超過(guò)百分之三的美國(guó)人接種過(guò)疫苗。
病毒逃逸
疫苗用來(lái)訓(xùn)練我們的免疫系統(tǒng),使它能夠識(shí)別一種特殊的冠狀病毒毒株。但是,病毒變異越多,那些已經(jīng)接種疫苗的人和以前感染過(guò)的人對(duì)新毒株的免疫力就越差。
這種過(guò)程被稱為「病毒逃逸」。冠狀病毒發(fā)生突變而逃逸,將使疫苗制造商在一場(chǎng)高風(fēng)險(xiǎn)的追趕游戲中爭(zhēng)先恐后地更新他們的疫苗。
據(jù)Bryan Bryson和其同事介紹,該算法可以幫助疫苗生產(chǎn)商追趕病毒的演變,減少目前用于監(jiān)測(cè)這種突變所耗費(fèi)的人力物力。
論文的另一作者、麻省理工學(xué)院的計(jì)算機(jī)科學(xué)家Bonnie Berger 說(shuō): 「這個(gè)工具可以告訴你何時(shí)進(jìn)行調(diào)查。隨著新毒株的出現(xiàn),我們可以標(biāo)記出哪些毒株有可能會(huì)逃逸已確定接下來(lái)研究的對(duì)象!
一些AI研究工具在新冠疫苗研發(fā)初期幫助很大。例如,AI幫助研究人員識(shí)別病毒遺傳密碼的哪些片段最有可能發(fā)生變化,以及某些突變?nèi)绾斡绊懫湮锢斫Y(jié)構(gòu)。
麻省理工學(xué)院的新機(jī)器學(xué)習(xí)算法通過(guò)將人工智能應(yīng)用于病毒逃逸擴(kuò)展了人工智能的技能。
模型最初為機(jī)器語(yǔ)言理解而開(kāi)發(fā)
該小組的模型最初是為機(jī)器語(yǔ)言理解而開(kāi)發(fā)的。該算法用于查找語(yǔ)法(句法)和意義(語(yǔ)義)。利用同樣的兩個(gè)原則,研究人員創(chuàng)造性地調(diào)整了它,用來(lái)監(jiān)測(cè)病毒遺傳密碼的變化。
研究人員將這一過(guò)程稱為「約束語(yǔ)義變化搜索」(constrained semantic change search,CSCS)。隨著該模型對(duì)冠狀病毒基因組的了解,它開(kāi)始了解冠狀病毒基因組的重大變化表現(xiàn)為何。
由此,它產(chǎn)生了一個(gè)可疑毒株的名單,用來(lái)在實(shí)驗(yàn)室中進(jìn)行測(cè)試。
為了測(cè)試這些毒株,研究人員將首先產(chǎn)生一種帶有可疑突變的假病毒,并經(jīng)過(guò)了計(jì)算模型的鑒定。然后,他們將這種假病毒接受從接種過(guò)疫苗或感染過(guò)新冠的人身上收集的抗體。
如果這些抗體不能中和這種病毒,這表明這種新毒株能夠逃避免疫系統(tǒng)的攻擊,因此需要更新疫苗。
然后再回到算法上,尋找更多可疑的變異毒株。Bryson說(shuō),「這就像是計(jì)算機(jī)和實(shí)驗(yàn)室之間的一個(gè)循環(huán),你要做的就是來(lái)回走動(dòng),試圖實(shí)時(shí)了解這場(chǎng)流行!
新冠研究領(lǐng)域的「登月計(jì)劃」
研究人員訓(xùn)練模型只用了將近1000個(gè) SARS-CoV-2刺突蛋白的基因序列,加上3000個(gè)其他(比如導(dǎo)致普通感冒的)冠狀病毒的刺突蛋白的基因序列。
刺突蛋白是新冠病毒用來(lái)與受體結(jié)合的主要表面蛋白,當(dāng)刺突蛋白與人類細(xì)胞受體結(jié)合后,病毒膜與人類細(xì)胞膜融合,使得病毒基因組得以進(jìn)入人類細(xì)胞并開(kāi)始感染。
這些例子教模型冠狀病毒中氨基酸測(cè)序的規(guī)則。
「關(guān)于語(yǔ)言模型的好處是,它們可以直接從一個(gè)大型訓(xùn)練集中學(xué)習(xí)規(guī)則, 這就是為什么我們想在生物學(xué)環(huán)境中使用這個(gè)模型,因?yàn)槲覀儾恢滥男┌被峥梢越M合在一起!乖搱F(tuán)隊(duì)的博士生、論文的合著者 Brian Hie說(shuō)。
作為一項(xiàng)實(shí)驗(yàn),麻省理工學(xué)院的研究人員將一些新的變種植入他們的算法中,發(fā)現(xiàn)英國(guó)和南非的菌株在逃逸概率方面都得了「相當(dāng)高」的分?jǐn)?shù)。
然而,它們的分?jǐn)?shù)并沒(méi)有在實(shí)驗(yàn)室實(shí)驗(yàn)中產(chǎn)生的逃逸突變體那么高,Berger說(shuō)。
預(yù)測(cè)什么時(shí)候一個(gè)高分會(huì)轉(zhuǎn)化成真正的逃離人類免疫系統(tǒng)的能力超出了該模型的能力,Hie說(shuō)。
Hie表示,從長(zhǎng)遠(yuǎn)來(lái)看,他希望繼續(xù)使用這個(gè)模型來(lái)預(yù)測(cè)尚未出現(xiàn)的病毒變異。
他說(shuō): 「這是該研究領(lǐng)域的「登月計(jì)劃」: 接種疫苗預(yù)防未來(lái)的病毒變體!
參考鏈接: