展會信息港展會大全

人工智能醫(yī)療臨床試驗(yàn),從循證醫(yī)學(xué)角度切入
來源:互聯(lián)網(wǎng)   發(fā)布日期:2022-05-21 09:22:44   瀏覽:16765次  

導(dǎo)讀:本文作者梅婧,楊曉棟,李少春,來自IBM中國研究院。 摘 要 /Abstract/ 人工智能(artificial intelligence,AI)給醫(yī)療行業(yè)帶來了新的科研技術(shù)和新的應(yīng)用場景,加速了醫(yī)學(xué)證據(jù)的挖掘,如利用人工智能技術(shù)加速醫(yī)學(xué)影像識別、疾病風(fēng)險預(yù)測、藥物發(fā)現(xiàn)、基因測...

本文作者梅婧,楊曉棟,李少春,來自IBM中國研究院。

摘 要/Abstract/

人工智能(artificial intelligence,AI)給醫(yī)療行業(yè)帶來了新的科研技術(shù)和新的應(yīng)用場景,加速了醫(yī)學(xué)證據(jù)的挖掘,如利用人工智能技術(shù)加速醫(yī)學(xué)影像識別、疾病風(fēng)險預(yù)測、藥物發(fā)現(xiàn)、基因測序分析等。與此同時,基于人工智能技術(shù)的應(yīng)用(如軟件、系統(tǒng)、平臺等),也迫切需要有證可循、有據(jù)可依,逐步開展定量和定性評估,以實(shí)現(xiàn)合規(guī)監(jiān)管。

本文概述了人工智能在醫(yī)療行業(yè)的最新技術(shù)和熱門應(yīng)用,著重對人工智能技術(shù)的應(yīng)用評估和監(jiān)管進(jìn)行了探討,并對人工智能醫(yī)療健康產(chǎn)業(yè)的未來發(fā)展前景進(jìn)行了展望。

1

人工智能與醫(yī)療行業(yè)的結(jié)合

人工智能(artificial intelligence,AI)一詞源于1956 年的達(dá)特茅斯會議[1]。隨后很快便與醫(yī)療行業(yè)結(jié)緣。1966 年,美國麻省理工學(xué)院(MIT)推出了最早的自然語言聊天機(jī)器人ELIZA,能夠模仿臨床治療中的心理醫(yī)生,與患者進(jìn)行人機(jī)對話;1972 年,英國利茲大學(xué)研發(fā)的AAPHelp系統(tǒng),能根據(jù)癥狀推斷可能產(chǎn)生患者腹部劇痛的原因;1974 年,美國匹茲堡大學(xué)研發(fā)的INTERNIST-I 系統(tǒng),主要用于輔助診斷內(nèi)科復(fù)雜疾;1976 年,美國斯坦福大學(xué)研發(fā)的MYCIN 系統(tǒng),用于自動判斷患者所感染的細(xì)菌類別并提供相應(yīng)的抗生素處方建議。

盡管20 世紀(jì)80 年代,AI 遭遇寒冬;但在進(jìn)入21 世紀(jì)以后,隨著算法、算力和大數(shù)據(jù)三要素齊聚,再次引爆AI 熱潮[2]。醫(yī)療作為最具挑戰(zhàn)的行業(yè)之一,正是AI技術(shù)和應(yīng)用的制高點(diǎn)。從近幾年的文獻(xiàn)可以看出[3-5],幾乎每種疾病都有其結(jié)合AI技術(shù)和應(yīng)用的文章發(fā)表,如常見的腫瘤、眼部疾并皮膚疾并糖尿并腎并心腦血管疾并神經(jīng)/ 精神相關(guān)疾病等。借助AI 加速挖掘這些醫(yī)學(xué)證據(jù),主要來源于5 大類技術(shù)。

(1)計(jì)算機(jī)視覺(computer vision,CV)。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN) 在AI 醫(yī)學(xué)影像方面有出色表現(xiàn),如在糖尿病性視網(wǎng)膜病變的AI 篩查[6]、皮膚癌/ 黑素瘤的AI診斷[7]、肺部電子計(jì)算機(jī)斷層掃描(CT)圖像的AI 識別[8]、基于腦部磁共振成像(MRI)的阿爾茨海默病AI 分類[9]等方面應(yīng)用。值得一提的是,CV 是此次AI 熱潮中的“弄潮兒”,AI 醫(yī)學(xué)影像也被行業(yè)內(nèi)人士認(rèn)為是最有可能率先實(shí)現(xiàn)商業(yè)化的AI 醫(yī)療領(lǐng)域[2]。

(2)自然語言處理(natural language processing,NLP)。如果說CV 是在近10年里縱向發(fā)展了各種不同的CNN 架構(gòu)(從2012 年新鮮出爐不到10 層的AlexNet[10]到2015 年高達(dá)152 層的ResNet[11]),那么NLP 領(lǐng)域里最大的創(chuàng)新在于橫向提出了一套完整的方案去解決各種各樣的NLP任務(wù),特別是2018 年提出的BERT[12]模型在11 個NLP 任務(wù)上刷新了紀(jì)錄,可以做出問答、情感分析、命名實(shí)體識別、文檔聚類等任務(wù)。這些NLP 技術(shù)的發(fā)展無疑對富含文本數(shù)據(jù)的電子病歷(如病歷主訴、出院小結(jié))帶來了新的價值,通過對醫(yī)療文本的分析和理解,可以構(gòu)建疾病模型,以及提供AI 診療建議。

(3)序列數(shù)據(jù)分析(sequential data analysis)。以患者為中心的醫(yī)療數(shù)據(jù)是對患者全生命周期的記錄,因此從時間維度建模患者數(shù)據(jù),無論是長達(dá)多年的電子病歷或醫(yī)保記錄,還是數(shù)天內(nèi)在重癥監(jiān)護(hù)室(ICU)里的多維指標(biāo)采集,都可以借助序列數(shù)據(jù)分析來構(gòu)建復(fù)雜模型。特別是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),通過學(xué)習(xí)前面時間步而預(yù)測下一步事件的概率,因此常被用于AI 風(fēng)險預(yù)測,如對糖尿病患者的慢性腎病預(yù)測[13]、對再入院的預(yù)測[14]等。此外,信號相關(guān)的流數(shù)據(jù)也是序列數(shù)據(jù)分析的對象,如分析心電圖(ECG)檢測心律失常及其分類[15],又如分析腦電圖(EEG)預(yù)測癲癇[16],以及通過可穿戴式設(shè)備獲取姿態(tài)、步態(tài)數(shù)據(jù)流來預(yù)測帕金森病嚴(yán)重程度[17]等。

(4)圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)。2019 年GNN 在各種AI 大會上刷榜,由此可見GNN 技術(shù)在近2 年的熱度非常高。GNN 里的“圖”,即為計(jì)算機(jī)科學(xué)“圖論”中稱為“圖”的數(shù)據(jù)結(jié)構(gòu),最簡單的形式化表示就是其由結(jié)點(diǎn)(node)和邊(edge)組成。在很多應(yīng)用場景中,我們常常見到這樣的“圖”結(jié)構(gòu),如社交網(wǎng)絡(luò)(人是結(jié)點(diǎn)而社交關(guān)系是邊)、電子購物(用戶和商品是結(jié)點(diǎn)而購買關(guān)系是邊)。聚焦醫(yī)療行業(yè)里,AI 藥物研發(fā)正在擁抱GNN 新技術(shù)[18],如借助GNN 預(yù)測蛋白質(zhì)- 蛋白質(zhì)的相互作用、藥物- 藥物的相互作用,以及藥物- 靶標(biāo)、藥物- 疾并疾病- 蛋白質(zhì)的相互作用,其中靶標(biāo)是與某種疾病的發(fā)生和發(fā)展密切相關(guān)的生物分子(如蛋白質(zhì)和核酸),對這種生物分子進(jìn)行干預(yù),能夠治愈或緩解與其相關(guān)的疾玻

(5)強(qiáng)化學(xué)習(xí)(reinforcement learning)。從2016 年阿爾法圍棋(AlphaGo)[19]以4 ∶ 1 的比分戰(zhàn)勝人類職業(yè)棋手,到2017 年AlphaGo Zero[20]不再需要學(xué)習(xí)人類的棋譜,而是通過自我對弈提高棋力,其背后的深度強(qiáng)化學(xué)習(xí)算法備受業(yè)界關(guān)注。在醫(yī)療行業(yè)里,強(qiáng)化學(xué)習(xí)常被用于求解治療方案的最佳策略[21],其中目標(biāo)函數(shù)是最大化預(yù)后的短期或長期效果。此外,考慮到這類技術(shù)在棋類和游戲類中應(yīng)用效果明顯,而在醫(yī)療領(lǐng)域,更為接近的醫(yī)療場景當(dāng)屬AI 醫(yī)護(hù)機(jī)器人。如機(jī)器人輔助手術(shù)[22](robotic-assisted surgery,RAS),通過感知環(huán)境狀態(tài),學(xué)習(xí)外科醫(yī)生的動作和相應(yīng)的獎賞函數(shù),從而提供最優(yōu)的策略,增強(qiáng)RAS 的魯棒性和適應(yīng)性。

綜合上述AI 技術(shù),在不同的落地場景中分別賦能AI 醫(yī)療重要的2P 角色(圖1):AI 醫(yī)學(xué)影像助力醫(yī)生、AI 診療賦能患者。同時,圍繞這2 個角色,深度挖掘2D 概念:AI 風(fēng)險預(yù)測理解疾并AI 藥物研發(fā)挖掘藥物。不難看出,現(xiàn)行相對成熟的AI 技術(shù)(如CV 和NLP)已經(jīng)在不少應(yīng)用場景中賦能予醫(yī)生和患者角色。而對于疾病和藥物,這些概念的研究本身就是亟待解決的科學(xué)論題,與之對應(yīng)的AI 技術(shù)(序列數(shù)據(jù)分析和GNN)正分別在時間和空間上推出新算法。

2

AI 醫(yī)療的監(jiān)管問題

AI 無疑給醫(yī)療行業(yè)帶來了新技術(shù)、新應(yīng)用,同時我們也逐漸意識到,AI 為醫(yī)療行業(yè)帶來了新問題、新挑戰(zhàn)。尤其是當(dāng)我們把AI 在醫(yī)療行業(yè)的應(yīng)用視為一種特殊的干預(yù)手段時,我們是否應(yīng)該建立系統(tǒng)的方法來評價和監(jiān)管這些干預(yù)手段呢?這些AI 醫(yī)療技術(shù)和應(yīng)用是否安全(safe)、有效(efficacy & effectiveness) 并值得信任(trustful)呢?類比于藥物,AI 醫(yī)療自身需要連續(xù)、長期且嚴(yán)格的研究,以產(chǎn)生科學(xué)有效的證據(jù),這些證據(jù)可隨時間推移在不同人群中被驗(yàn)證。不同于藥物,AI 醫(yī)療更需要與用戶(包括但不限于醫(yī)生和患者)互動,成為用戶可理解、可信任的干預(yù)手段,通過將AI 醫(yī)療集成到現(xiàn)有的臨床環(huán)境里,來收集和分析這些新證據(jù)。

本文首先通過循證醫(yī)學(xué)的證據(jù)金字塔來看現(xiàn)有AI 醫(yī)療技術(shù)和應(yīng)用的循證等級;然后從臨床試驗(yàn)質(zhì)量管理規(guī)范角度,討論AI 醫(yī)療的臨床試驗(yàn)在不同階段該如何設(shè)計(jì)和評估;最后解讀最新的用于規(guī)范AI 臨床試驗(yàn)報(bào)告的兩大指南[《人工智能干預(yù)試驗(yàn)標(biāo)準(zhǔn)方案的推薦條目》(Standard Protocol Items:Recommendations for Interventional Trials-Artificial Intelligence,SPIRIT-AI)[23]和《人工智能試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)》(Consolidated Standards of Reporting Trials-Artificial Intelligence,CONSORT-AI)[24]],也是首個AI 臨床試驗(yàn)國際標(biāo)準(zhǔn)。

(一) 循證醫(yī)學(xué)證據(jù)等級

循證醫(yī)學(xué)(evidence-based medicine)的證據(jù)金字塔的證據(jù)等級是自下向上逐漸升高(圖2)。其基本思想是從最基礎(chǔ)的證據(jù)出發(fā),不斷地驗(yàn)證、推論、強(qiáng)化,最終積累出可以定性的證據(jù)為臨床所依循。從這個角度來審視AI 醫(yī)療技術(shù)和應(yīng)用,我們不難發(fā)現(xiàn)很多機(jī)構(gòu)推出的AI 與醫(yī)生同臺PK[25],其證據(jù)等級僅等同于專家經(jīng)驗(yàn)。這往往是以新聞發(fā)表方式公布于世,但是這些并不是嚴(yán)謹(jǐn)?shù)呐R床研究結(jié)果。

通過對醫(yī)學(xué)期刊的搜索發(fā)現(xiàn),有數(shù)百篇病例報(bào)告均對AI 醫(yī)療技術(shù)和應(yīng)用進(jìn)行過專業(yè)的描述和分析,包括在多例病例中使用[26]。同時,這些病例報(bào)告也指出了AI 醫(yī)療技術(shù)和應(yīng)用的缺點(diǎn),如AI 模型在實(shí)際應(yīng)用中往往達(dá)不到純實(shí)驗(yàn)環(huán)境里的高性能?紤]到AI 醫(yī)療技術(shù)和應(yīng)用目前尚未大范圍使用,且鮮有回顧性病例對照研究結(jié)果?梢灶A(yù)見的是,我們將對某些特定疾病結(jié)局的改善,由果尋因來觀察并檢驗(yàn)AI 的使用是否與之存在著統(tǒng)計(jì)學(xué)上的關(guān)聯(lián)。我們通過檢索和分析,驚喜地發(fā)現(xiàn)數(shù)十項(xiàng)前瞻性隊(duì)列研究[27],對于使用AI 的干預(yù)組和不使用AI 的對照組由因?qū)す,觀察驗(yàn)證其是否在臨床結(jié)局上有差異。此外,有7 項(xiàng)隨機(jī)對照試驗(yàn)[27]正在開展,其中6 項(xiàng)來自中國。這些醫(yī)學(xué)證據(jù)逐步開始被系統(tǒng)評價[28],并進(jìn)行薈萃分析[29]。

當(dāng)然,我們也意識到現(xiàn)在絕大部分證據(jù)聚焦在AI 醫(yī)學(xué)影像的技術(shù)和應(yīng)用。但是,我們相信并期待著基于循證醫(yī)學(xué)的方法論AI 和醫(yī)療的結(jié)合,以及各種技術(shù)和應(yīng)用均將得到定性與定量的證據(jù),最終被納入臨床實(shí)踐指南。

(二) 臨床試驗(yàn)各個階段

《藥物臨床試驗(yàn)質(zhì)量管理規(guī)范》(Good Clinical Practice, GCP)[30]指出:“臨床試驗(yàn),指以人體(患者或健康受試者)為對象的試驗(yàn),意在發(fā)現(xiàn)或驗(yàn)證某種試驗(yàn)藥物的臨床醫(yī)學(xué)、藥理學(xué)以及其他藥效學(xué)作用、不良反應(yīng),或者試驗(yàn)藥物的吸收、分布、代謝和排泄,以確定藥物的療效與安全性的系統(tǒng)性試驗(yàn)”。藥物臨床試驗(yàn)分為Ⅰ ~ Ⅳ期,其中Ⅰ ~ Ⅲ期是上市前的臨床研究,而Ⅳ期是上市后的臨床研究。此外,還有臨床前研究和早期發(fā)現(xiàn)、發(fā)明階段研究(表1)。相比藥物研發(fā)的各個階段,AI 醫(yī)療的研發(fā)大多還停留在算法發(fā)現(xiàn)、發(fā)明和臨床前研究階段[31]。值得一提的是,AI 醫(yī)療大部分是數(shù)據(jù)驅(qū)動的學(xué)習(xí)算法,所以需要重點(diǎn)關(guān)注數(shù)據(jù)的因素,不能只停留在機(jī)器深度學(xué)習(xí)的算法層面指標(biāo)(如AUC),需要更多地關(guān)注如實(shí)說明訓(xùn)練時的數(shù)據(jù)質(zhì)量問題(如數(shù)據(jù)缺失情況和數(shù)據(jù)異常情況等),以及訓(xùn)練后的模型性能問題(如模型的可解釋性、偏差和漂移)。類比藥物說明書,一般包括以下內(nèi)容:藥品名稱、成份、性狀、適應(yīng)證或者功能主治、用法用量、不良反應(yīng)、禁忌、注意事項(xiàng)、規(guī)格、有效期、批準(zhǔn)文號和生產(chǎn)企業(yè)等。在可預(yù)見的未來,將有AI 醫(yī)療說明書,包含AI 技術(shù)應(yīng)用的數(shù)據(jù)適用性、安全性、有效性這些重要科學(xué)評價和結(jié)論,用以指導(dǎo)臨床的正確使用。

此外,AI 醫(yī)療的目標(biāo)是賦能用戶(其中用戶可以是醫(yī)生、患者、臨床研究者等),所以在復(fù)雜度高且響應(yīng)度強(qiáng)的醫(yī)療行業(yè),AI 醫(yī)療的技術(shù)和應(yīng)用需要有專業(yè)的系統(tǒng)設(shè)計(jì)和量化評估。如互聯(lián)網(wǎng)公司常用A/B 測試對產(chǎn)品功能及內(nèi)容的優(yōu)化迭代,AI 醫(yī)療在評估用戶體驗(yàn)和系統(tǒng)帶來的價值時,也可以借助這樣的方法,提高用戶滿意度。

(三) 臨床試驗(yàn)指南規(guī)范

2020 年9 月《自然醫(yī)學(xué)》雜志推出了一系列文章,包括1 篇社論(editorial)呼吁對于AI 的使用制訂臨床試驗(yàn)指南[32],1 篇專家評論(comment)建議規(guī)范基于AI 的臨床試驗(yàn)[27],以及2 篇共識聲明(consensus statement)介紹了兩大指南SPIRIT-AI[23]和CONSORT-AI[24], 用以規(guī)范AI 醫(yī)療的臨床試驗(yàn)設(shè)計(jì)和匯報(bào)。其中,SPIRIT-AI 是《干預(yù)試驗(yàn)標(biāo)準(zhǔn)方案的推薦條目》(Standard Protocol Items:Recommendations for Interventional Trials,SPIRIT)對于AI 模塊的擴(kuò)展;CONSORTAI是《試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)》(Consolidated Standards of Reporting Trials, CONSORT)對于AI 模塊的擴(kuò)展。簡而言之,如果臨床干預(yù)涉及AI 技術(shù)和應(yīng)用,那么建議參考SPIRIT-AI,而相應(yīng)的涉及統(tǒng)一標(biāo)準(zhǔn)建議參考CONSORT-AI。

具體而言,SPIRIT-AI 在現(xiàn)有的2013年版基礎(chǔ)上新增15 項(xiàng),其中3 項(xiàng)是在原有清單上進(jìn)行細(xì)化,另外12 項(xiàng)是在原有清單上進(jìn)行擴(kuò)展;CONSORT-AI 則在現(xiàn)有的2010 年版上新增14 項(xiàng),這些新增項(xiàng)對于AI 干預(yù)的報(bào)告尤為重要。經(jīng)比較后不難發(fā)現(xiàn),CONSORT-AI 的14 項(xiàng)幾乎全在SPIRIT-AI 中,而SPIRIT-AI 僅多了1項(xiàng)對于AI 干預(yù)已有相關(guān)的臨床證據(jù),需要在背景和原理章節(jié)中進(jìn)行介紹和描述。本文對AI 新增項(xiàng)進(jìn)行了解讀[23-24](表2)。

AI 醫(yī)療的臨床試驗(yàn)才剛剛起步,國內(nèi)外產(chǎn)學(xué)研多方也在共同努力推進(jìn)。除了科研機(jī)構(gòu)引領(lǐng)并監(jiān)管AI 醫(yī)療的臨床試驗(yàn),產(chǎn)品部門也需盡快落實(shí)這些指南新增項(xiàng),以便在AI 醫(yī)療的臨床試驗(yàn)過程中能更有效地進(jìn)行數(shù)據(jù)收集、管理和分析。如IBMClinical Development[33]提供的臨床試驗(yàn)解決方案,正在探索及支持AI 醫(yī)療的臨床試驗(yàn)。

3

展 望

2017 年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,該規(guī)劃提出了2020 年、2025 年、2030 年的戰(zhàn)略目標(biāo),醫(yī)療作為其中一個重要的應(yīng)用領(lǐng)域受到了極高的重視。在這短短3 年里,人們已經(jīng)驚喜地看到了很多AI 與醫(yī)療結(jié)合的試用和試點(diǎn)。2020 年,我們展望未來,產(chǎn)學(xué)研相結(jié)合,能夠更健康、更長遠(yuǎn)地發(fā)展。讓AI 醫(yī)療在前進(jìn)的道路上有望有證可循、有據(jù)可依。

第一作者簡介

梅婧,博士,IBM 中國研究院,高級研究員。專業(yè)方向:人工智能醫(yī)療

楊曉棟,碩士,IBM Watson Health,業(yè)務(wù)拓展總監(jiān)。專業(yè)方向:數(shù)字化時代的智慧醫(yī)療

通訊作者簡介

李少春,碩士,IBM Watson Health,大中華區(qū)總經(jīng)理。專業(yè)方向:數(shù)字化時代的智慧醫(yī)療


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港