近日,國(guó)內(nèi)AI場(chǎng)景應(yīng)用再次取得重要成果。來自同濟(jì)大學(xué)生物信息系的劉琦教授課題組與微眾銀行楊強(qiáng)教授AI團(tuán)隊(duì)合作,首次通過聯(lián)邦學(xué)習(xí)來進(jìn)行本地藥物隱私數(shù)據(jù)的保障以及模擬多個(gè)制藥機(jī)構(gòu)(用戶)之間的藥物協(xié)同開發(fā),助力制藥機(jī)構(gòu)在保障自身藥物數(shù)據(jù)隱私安全的前提下進(jìn)行協(xié)同藥物發(fā)現(xiàn)。
該成果已發(fā)表在生物信息學(xué)領(lǐng)域著名期刊《Bioinformatics》上,題為《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》。該項(xiàng)目首次探索了應(yīng)用聯(lián)邦學(xué)習(xí)進(jìn)行協(xié)同藥物開發(fā)的可行性,并提出了一種基于聯(lián)邦學(xué)習(xí)的協(xié)同藥物定量構(gòu)效原型系統(tǒng)FL-QSAR。
聯(lián)邦學(xué)習(xí)是近年提出的一種新的合法連接數(shù)據(jù)孤島進(jìn)行數(shù)據(jù)共享計(jì)算的協(xié)作范式。全球范圍內(nèi),由谷歌和楊強(qiáng)教授團(tuán)隊(duì)分別在to C和to B場(chǎng)景率先提出。相比于傳統(tǒng)數(shù)據(jù)加密共享方法,聯(lián)邦學(xué)習(xí)基于數(shù)據(jù)“可用不可見”的理念,通過聚合所有用戶的加密模型參數(shù),在數(shù)據(jù)不出本地的情況下進(jìn)行模型協(xié)同訓(xùn)練,能夠更好地面對(duì)數(shù)據(jù)共享領(lǐng)域出現(xiàn)的新的問題和法律法規(guī)約束。
聯(lián)邦學(xué)習(xí)在金融等領(lǐng)域已獲得廣泛關(guān)注,但是在藥物研發(fā)及生物計(jì)算領(lǐng)域尚未有所應(yīng)用,制藥領(lǐng)域?qū)τ跀?shù)據(jù)不出本地進(jìn)行共享普遍有著強(qiáng)烈需求,迫切需要探索聯(lián)邦學(xué)習(xí)在該領(lǐng)域的應(yīng)用。本次微眾銀行AI團(tuán)隊(duì)和同濟(jì)大學(xué)的合作項(xiàng)目,是聯(lián)邦學(xué)習(xí)在藥物研發(fā)領(lǐng)域首次應(yīng)用探索。
同濟(jì)大學(xué)與微眾銀行AI團(tuán)隊(duì)在這項(xiàng)產(chǎn)學(xué)研協(xié)同中,嘗試解決傳統(tǒng)藥物領(lǐng)域的 “頑疾”即不同的制藥機(jī)構(gòu)之間可以通過數(shù)據(jù)共享來提高QSAR建模預(yù)測(cè)的準(zhǔn)確率,然而該領(lǐng)域的知識(shí)產(chǎn)權(quán)和相關(guān)的經(jīng)濟(jì)利益不利于制藥機(jī)構(gòu)之間進(jìn)行數(shù)據(jù)的直接共享和合作。通過在藥物小分子領(lǐng)域探索使用聯(lián)邦學(xué)習(xí)范式進(jìn)行藥物協(xié)同開發(fā)的可行性,結(jié)合微眾銀行的聯(lián)邦學(xué)習(xí)開源平臺(tái)FATE, FL-QSAR可以在保護(hù)藥物小分子結(jié)構(gòu)隱私的前提條件下,獲得與直接整合多用戶小分子數(shù)據(jù)進(jìn)行QSAR建模相同或者類似的模型預(yù)測(cè)效果。
這是一種有效的藥物協(xié)同發(fā)現(xiàn)的解決方案,打破了傳統(tǒng)QSAR建模時(shí)不同制藥機(jī)構(gòu)之間的數(shù)據(jù)無法直接共享的壁壘,有助于在隱私保護(hù)的前提條件下進(jìn)行協(xié)同藥物發(fā)現(xiàn),并適合于推廣和應(yīng)用到生物醫(yī)學(xué)隱私計(jì)算的其他相關(guān)領(lǐng)域。
聯(lián)邦學(xué)習(xí)技術(shù)目前正逐步成為解決數(shù)據(jù)孤島和數(shù)據(jù)隱私保護(hù)問題的有效方案,在生物健康及藥物研發(fā)領(lǐng)域也將具備廣泛的應(yīng)用場(chǎng)景。該研究成果同時(shí)也得到國(guó)家重大研究與發(fā)展計(jì)劃、國(guó)家自然科學(xué)基金項(xiàng)目、上海市自然科學(xué)基金項(xiàng)目、上海市人工智能標(biāo)準(zhǔn)專項(xiàng)項(xiàng)目等基金的資助。
從全球來看,AI產(chǎn)業(yè)化進(jìn)入深水區(qū),近日谷歌AI團(tuán)隊(duì)DeepMind所研究的AlphaFold 算法在生物學(xué)領(lǐng)域也取得了重要突破,在此算法下,可通過蛋白質(zhì)的氨基酸序列高精度地確定其3D結(jié)構(gòu)。AI與生物醫(yī)學(xué)的密切結(jié)合將推進(jìn)人類健康事業(yè)的發(fā)展與探索進(jìn)入新的階段,多位業(yè)界專家紛紛表態(tài),稱“AI將改變生物學(xué)”,而聯(lián)邦學(xué)習(xí)等新技術(shù)的加入將從隱私保護(hù)等倫理道德層面為探索之路保駕護(hù)航。