當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > 人工智能醫(yī)療臨床試驗(yàn)，從循證醫(yī)學(xué)角度切入

人工智能醫(yī)療臨床試驗(yàn)，從循證醫(yī)學(xué)角度切入
來源：互聯(lián)網(wǎng) 發(fā)布日期：2022-05-21 09:22:44 瀏覽：16765次

導(dǎo)讀：本文作者梅婧，楊曉棟，李少春，來自IBM中國研究院。摘要 /Abstract/ 人工智能（artificial intelligence，AI）給醫(yī)療行業(yè)帶來了新的科研技術(shù)和新的應(yīng)用場景，加速了醫(yī)學(xué)證據(jù)的挖掘，如利用人工智能技術(shù)加速醫(yī)學(xué)影像識別、疾病風(fēng)險預(yù)測、藥物發(fā)現(xiàn)、基因測...

本文作者梅婧，楊曉棟，李少春，來自IBM中國研究院。

摘要/Abstract/

人工智能（artificial intelligence，AI）給醫(yī)療行業(yè)帶來了新的科研技術(shù)和新的應(yīng)用場景，加速了醫(yī)學(xué)證據(jù)的挖掘，如利用人工智能技術(shù)加速醫(yī)學(xué)影像識別、疾病風(fēng)險預(yù)測、藥物發(fā)現(xiàn)、基因測序分析等。與此同時，基于人工智能技術(shù)的應(yīng)用（如軟件、系統(tǒng)、平臺等），也迫切需要有證可循、有據(jù)可依，逐步開展定量和定性評估，以實(shí)現(xiàn)合規(guī)監(jiān)管。

本文概述了人工智能在醫(yī)療行業(yè)的最新技術(shù)和熱門應(yīng)用，著重對人工智能技術(shù)的應(yīng)用評估和監(jiān)管進(jìn)行了探討，并對人工智能醫(yī)療健康產(chǎn)業(yè)的未來發(fā)展前景進(jìn)行了展望。

人工智能與醫(yī)療行業(yè)的結(jié)合

人工智能（artificial intelligence，AI）一詞源于1956 年的達(dá)特茅斯會議[1]。隨后很快便與醫(yī)療行業(yè)結(jié)緣。1966 年，美國麻省理工學(xué)院（MIT）推出了最早的自然語言聊天機(jī)器人ELIZA，能夠模仿臨床治療中的心理醫(yī)生，與患者進(jìn)行人機(jī)對話；1972 年，英國利茲大學(xué)研發(fā)的AAPHelp系統(tǒng)，能根據(jù)癥狀推斷可能產(chǎn)生患者腹部劇痛的原因；1974 年，美國匹茲堡大學(xué)研發(fā)的INTERNIST-I 系統(tǒng)，主要用于輔助診斷內(nèi)科復(fù)雜疾��；1976 年，美國斯坦福大學(xué)研發(fā)的MYCIN 系統(tǒng)，用于自動判斷患者所感染的細(xì)菌類別并提供相應(yīng)的抗生素處方建議。

盡管20 世紀(jì)80 年代，AI 遭遇寒冬；但在進(jìn)入21 世紀(jì)以后，隨著算法、算力和大數(shù)據(jù)三要素齊聚，再次引爆AI 熱潮[2]。醫(yī)療作為最具挑戰(zhàn)的行業(yè)之一，正是AI技術(shù)和應(yīng)用的制高點(diǎn)。從近幾年的文獻(xiàn)可以看出[3-5]，幾乎每種疾病都有其結(jié)合AI技術(shù)和應(yīng)用的文章發(fā)表，如常見的腫瘤、眼部疾并皮膚疾并糖尿并腎并心腦血管疾并神經(jīng)/ 精神相關(guān)疾病等。借助AI 加速挖掘這些醫(yī)學(xué)證據(jù)，主要來源于5 大類技術(shù)。

（1）計(jì)算機(jī)視覺（computer vision，CV）。卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network，CNN）在AI 醫(yī)學(xué)影像方面有出色表現(xiàn)，如在糖尿病性視網(wǎng)膜病變的AI 篩查[6]、皮膚癌/ 黑素瘤的AI診斷[7]、肺部電子計(jì)算機(jī)斷層掃描（CT）圖像的AI 識別[8]、基于腦部磁共振成像（MRI）的阿爾茨海默病AI 分類[9]等方面應(yīng)用。值得一提的是，CV 是此次AI 熱潮中的“弄潮兒”，AI 醫(yī)學(xué)影像也被行業(yè)內(nèi)人士認(rèn)為是最有可能率先實(shí)現(xiàn)商業(yè)化的AI 醫(yī)療領(lǐng)域[2]。

（2）自然語言處理（natural language processing，NLP）。如果說CV 是在近10年里縱向發(fā)展了各種不同的CNN 架構(gòu)（從2012 年新鮮出爐不到10 層的AlexNet[10]到2015 年高達(dá)152 層的ResNet[11]），那么NLP 領(lǐng)域里最大的創(chuàng)新在于橫向提出了一套完整的方案去解決各種各樣的NLP任務(wù)，特別是2018 年提出的BERT[12]模型在11 個NLP 任務(wù)上刷新了紀(jì)錄，可以做出問答、情感分析、命名實(shí)體識別、文檔聚類等任務(wù)。這些NLP 技術(shù)的發(fā)展無疑對富含文本數(shù)據(jù)的電子病歷（如病歷主訴、出院小結(jié)）帶來了新的價值，通過對醫(yī)療文本的分析和理解，可以構(gòu)建疾病模型，以及提供AI 診療建議。

（3）序列數(shù)據(jù)分析（sequential data analysis）。以患者為中心的醫(yī)療數(shù)據(jù)是對患者全生命周期的記錄，因此從時間維度建模患者數(shù)據(jù)，無論是長達(dá)多年的電子病歷或醫(yī)保記錄，還是數(shù)天內(nèi)在重癥監(jiān)護(hù)室（ICU）里的多維指標(biāo)采集，都可以借助序列數(shù)據(jù)分析來構(gòu)建復(fù)雜模型。特別是循環(huán)神經(jīng)網(wǎng)絡(luò)（recurrent neural network，RNN），通過學(xué)習(xí)前面時間步而預(yù)測下一步事件的概率，因此常被用于AI 風(fēng)險預(yù)測，如對糖尿病患者的慢性腎病預(yù)測[13]、對再入院的預(yù)測[14]等。此外，信號相關(guān)的流數(shù)據(jù)也是序列數(shù)據(jù)分析的對象，如分析心電圖（ECG）檢測心律失常及其分類[15]，又如分析腦電圖（EEG）預(yù)測癲癇[16]，以及通過可穿戴式設(shè)備獲取姿態(tài)、步態(tài)數(shù)據(jù)流來預(yù)測帕金森病嚴(yán)重程度[17]等。

（4）圖神經(jīng)網(wǎng)絡(luò)（graph neural network,GNN）。2019 年GNN 在各種AI 大會上刷榜，由此可見GNN 技術(shù)在近2 年的熱度非常高。GNN 里的“圖”，即為計(jì)算機(jī)科學(xué)“圖論”中稱為“圖”的數(shù)據(jù)結(jié)構(gòu)，最簡單的形式化表示就是其由結(jié)點(diǎn)（node）和邊（edge）組成。在很多應(yīng)用場景中，我們常常見到這樣的“圖”結(jié)構(gòu)，如社交網(wǎng)絡(luò)（人是結(jié)點(diǎn)而社交關(guān)系是邊）、電子購物（用戶和商品是結(jié)點(diǎn)而購買關(guān)系是邊）。聚焦醫(yī)療行業(yè)里，AI 藥物研發(fā)正在擁抱GNN 新技術(shù)[18]，如借助GNN 預(yù)測蛋白質(zhì)- 蛋白質(zhì)的相互作用、藥物- 藥物的相互作用，以及藥物- 靶標(biāo)、藥物- 疾并疾病- 蛋白質(zhì)的相互作用，其中靶標(biāo)是與某種疾病的發(fā)生和發(fā)展密切相關(guān)的生物分子（如蛋白質(zhì)和核酸），對這種生物分子進(jìn)行干預(yù)，能夠治愈或緩解與其相關(guān)的疾玻

（5）強(qiáng)化學(xué)習(xí)（reinforcement learning）。從2016 年阿爾法圍棋（AlphaGo）[19]以4 ∶ 1 的比分戰(zhàn)勝人類職業(yè)棋手，到2017 年AlphaGo Zero[20]不再需要學(xué)習(xí)人類的棋譜，而是通過自我對弈提高棋力，其背后的深度強(qiáng)化學(xué)習(xí)算法備受業(yè)界關(guān)注。在醫(yī)療行業(yè)里，強(qiáng)化學(xué)習(xí)常被用于求解治療方案的最佳策略[21]，其中目標(biāo)函數(shù)是最大化預(yù)后的短期或長期效果。此外，考慮到這類技術(shù)在棋類和游戲類中應(yīng)用效果明顯，而在醫(yī)療領(lǐng)域，更為接近的醫(yī)療場景當(dāng)屬AI 醫(yī)護(hù)機(jī)器人。如機(jī)器人輔助手術(shù)[22]（robotic-assisted surgery，RAS），通過感知環(huán)境狀態(tài)，學(xué)習(xí)外科醫(yī)生的動作和相應(yīng)的獎賞函數(shù)，從而提供最優(yōu)的策略，增強(qiáng)RAS 的魯棒性和適應(yīng)性。

綜合上述AI 技術(shù)，在不同的落地場景中分別賦能AI 醫(yī)療重要的2P 角色（圖1）：AI 醫(yī)學(xué)影像助力醫(yī)生、AI 診療賦能患者。同時，圍繞這2 個角色，深度挖掘2D 概念：AI 風(fēng)險預(yù)測理解疾并AI 藥物研發(fā)挖掘藥物。不難看出，現(xiàn)行相對成熟的AI 技術(shù)（如CV 和NLP）已經(jīng)在不少應(yīng)用場景中賦能予醫(yī)生和患者角色。而對于疾病和藥物，這些概念的研究本身就是亟待解決的科學(xué)論題，與之對應(yīng)的AI 技術(shù)（序列數(shù)據(jù)分析和GNN）正分別在時間和空間上推出新算法。

AI 醫(yī)療的監(jiān)管問題

AI 無疑給醫(yī)療行業(yè)帶來了新技術(shù)、新應(yīng)用，同時我們也逐漸意識到，AI 為醫(yī)療行業(yè)帶來了新問題、新挑戰(zhàn)。尤其是當(dāng)我們把AI 在醫(yī)療行業(yè)的應(yīng)用視為一種特殊的干預(yù)手段時，我們是否應(yīng)該建立系統(tǒng)的方法來評價和監(jiān)管這些干預(yù)手段呢？這些AI 醫(yī)療技術(shù)和應(yīng)用是否安全（safe）、有效（efficacy & effectiveness）并值得信任（trustful）呢？類比于藥物，AI 醫(yī)療自身需要連續(xù)、長期且嚴(yán)格的研究，以產(chǎn)生科學(xué)有效的證據(jù)，這些證據(jù)可隨時間推移在不同人群中被驗(yàn)證。不同于藥物，AI 醫(yī)療更需要與用戶（包括但不限于醫(yī)生和患者）互動，成為用戶可理解、可信任的干預(yù)手段，通過將AI 醫(yī)療集成到現(xiàn)有的臨床環(huán)境里，來收集和分析這些新證據(jù)。

本文首先通過循證醫(yī)學(xué)的證據(jù)金字塔來看現(xiàn)有AI 醫(yī)療技術(shù)和應(yīng)用的循證等級；然后從臨床試驗(yàn)質(zhì)量管理規(guī)范角度，討論AI 醫(yī)療的臨床試驗(yàn)在不同階段該如何設(shè)計(jì)和評估；最后解讀最新的用于規(guī)范AI 臨床試驗(yàn)報(bào)告的兩大指南[《人工智能干預(yù)試驗(yàn)標(biāo)準(zhǔn)方案的推薦條目》（Standard Protocol Items:Recommendations for Interventional Trials-Artificial Intelligence,SPIRIT-AI）[23]和《人工智能試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)》（Consolidated Standards of Reporting Trials-Artificial Intelligence,CONSORT-AI）[24]]，也是首個AI 臨床試驗(yàn)國際標(biāo)準(zhǔn)。

（一）循證醫(yī)學(xué)證據(jù)等級

循證醫(yī)學(xué)（evidence-based medicine）的證據(jù)金字塔的證據(jù)等級是自下向上逐漸升高（圖2）。其基本思想是從最基礎(chǔ)的證據(jù)出發(fā)，不斷地驗(yàn)證、推論、強(qiáng)化，最終積累出可以定性的證據(jù)為臨床所依循。從這個角度來審視AI 醫(yī)療技術(shù)和應(yīng)用，我們不難發(fā)現(xiàn)很多機(jī)構(gòu)推出的AI 與醫(yī)生同臺PK[25]，其證據(jù)等級僅等同于專家經(jīng)驗(yàn)。這往往是以新聞發(fā)表方式公布于世，但是這些并不是嚴(yán)謹(jǐn)?shù)呐R床研究結(jié)果。

通過對醫(yī)學(xué)期刊的搜索發(fā)現(xiàn)，有數(shù)百篇病例報(bào)告均對AI 醫(yī)療技術(shù)和應(yīng)用進(jìn)行過專業(yè)的描述和分析，包括在多例病例中使用[26]。同時，這些病例報(bào)告也指出了AI 醫(yī)療技術(shù)和應(yīng)用的缺點(diǎn)，如AI 模型在實(shí)際應(yīng)用中往往達(dá)不到純實(shí)驗(yàn)環(huán)境里的高性能�？紤]到AI 醫(yī)療技術(shù)和應(yīng)用目前尚未大范圍使用，且鮮有回顧性病例對照研究結(jié)果�？梢灶A(yù)見的是，我們將對某些特定疾病結(jié)局的改善，由果尋因來觀察并檢驗(yàn)AI 的使用是否與之存在著統(tǒng)計(jì)學(xué)上的關(guān)聯(lián)。我們通過檢索和分析，驚喜地發(fā)現(xiàn)數(shù)十項(xiàng)前瞻性隊(duì)列研究[27]，對于使用AI 的干預(yù)組和不使用AI 的對照組由因?qū)す�，觀察驗(yàn)證其是否在臨床結(jié)局上有差異。此外，有7 項(xiàng)隨機(jī)對照試驗(yàn)[27]正在開展，其中6 項(xiàng)來自中國。這些醫(yī)學(xué)證據(jù)逐步開始被系統(tǒng)評價[28]，并進(jìn)行薈萃分析[29]。

當(dāng)然，我們也意識到現(xiàn)在絕大部分證據(jù)聚焦在AI 醫(yī)學(xué)影像的技術(shù)和應(yīng)用。但是，我們相信并期待著基于循證醫(yī)學(xué)的方法論AI 和醫(yī)療的結(jié)合，以及各種技術(shù)和應(yīng)用均將得到定性與定量的證據(jù)，最終被納入臨床實(shí)踐指南。

（二）臨床試驗(yàn)各個階段

《藥物臨床試驗(yàn)質(zhì)量管理規(guī)范》（Good Clinical Practice, GCP）[30]指出：“臨床試驗(yàn)，指以人體（患者或健康受試者）為對象的試驗(yàn)，意在發(fā)現(xiàn)或驗(yàn)證某種試驗(yàn)藥物的臨床醫(yī)學(xué)、藥理學(xué)以及其他藥效學(xué)作用、不良反應(yīng)，或者試驗(yàn)藥物的吸收、分布、代謝和排泄，以確定藥物的療效與安全性的系統(tǒng)性試驗(yàn)”。藥物臨床試驗(yàn)分為Ⅰ ~ Ⅳ期，其中Ⅰ ~ Ⅲ期是上市前的臨床研究，而Ⅳ期是上市后的臨床研究。此外，還有臨床前研究和早期發(fā)現(xiàn)、發(fā)明階段研究（表1）。相比藥物研發(fā)的各個階段，AI 醫(yī)療的研發(fā)大多還停留在算法發(fā)現(xiàn)、發(fā)明和臨床前研究階段[31]。值得一提的是，AI 醫(yī)療大部分是數(shù)據(jù)驅(qū)動的學(xué)習(xí)算法，所以需要重點(diǎn)關(guān)注數(shù)據(jù)的因素，不能只停留在機(jī)器深度學(xué)習(xí)的算法層面指標(biāo)（如AUC），需要更多地關(guān)注如實(shí)說明訓(xùn)練時的數(shù)據(jù)質(zhì)量問題（如數(shù)據(jù)缺失情況和數(shù)據(jù)異常情況等），以及訓(xùn)練后的模型性能問題（如模型的可解釋性、偏差和漂移）。類比藥物說明書，一般包括以下內(nèi)容：藥品名稱、成份、性狀、適應(yīng)證或者功能主治、用法用量、不良反應(yīng)、禁忌、注意事項(xiàng)、規(guī)格、有效期、批準(zhǔn)文號和生產(chǎn)企業(yè)等。在可預(yù)見的未來，將有AI 醫(yī)療說明書，包含AI 技術(shù)應(yīng)用的數(shù)據(jù)適用性、安全性、有效性這些重要科學(xué)評價和結(jié)論，用以指導(dǎo)臨床的正確使用。

此外，AI 醫(yī)療的目標(biāo)是賦能用戶（其中用戶可以是醫(yī)生、患者、臨床研究者等），所以在復(fù)雜度高且響應(yīng)度強(qiáng)的醫(yī)療行業(yè)，AI 醫(yī)療的技術(shù)和應(yīng)用需要有專業(yè)的系統(tǒng)設(shè)計(jì)和量化評估。如互聯(lián)網(wǎng)公司常用A/B 測試對產(chǎn)品功能及內(nèi)容的優(yōu)化迭代，AI 醫(yī)療在評估用戶體驗(yàn)和系統(tǒng)帶來的價值時，也可以借助這樣的方法，提高用戶滿意度。

（三）臨床試驗(yàn)指南規(guī)范

2020 年9 月《自然醫(yī)學(xué)》雜志推出了一系列文章，包括1 篇社論（editorial）呼吁對于AI 的使用制訂臨床試驗(yàn)指南[32]，1 篇專家評論（comment）建議規(guī)范基于AI 的臨床試驗(yàn)[27]，以及2 篇共識聲明（consensus statement）介紹了兩大指南SPIRIT-AI[23]和CONSORT-AI[24]，用以規(guī)范AI 醫(yī)療的臨床試驗(yàn)設(shè)計(jì)和匯報(bào)。其中，SPIRIT-AI 是《干預(yù)試驗(yàn)標(biāo)準(zhǔn)方案的推薦條目》（Standard Protocol Items:Recommendations for Interventional Trials,SPIRIT）對于AI 模塊的擴(kuò)展；CONSORTAI是《試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)》（Consolidated Standards of Reporting Trials, CONSORT）對于AI 模塊的擴(kuò)展。簡而言之，如果臨床干預(yù)涉及AI 技術(shù)和應(yīng)用，那么建議參考SPIRIT-AI，而相應(yīng)的涉及統(tǒng)一標(biāo)準(zhǔn)建議參考CONSORT-AI。

具體而言，SPIRIT-AI 在現(xiàn)有的2013年版基礎(chǔ)上新增15 項(xiàng)，其中3 項(xiàng)是在原有清單上進(jìn)行細(xì)化，另外12 項(xiàng)是在原有清單上進(jìn)行擴(kuò)展；CONSORT-AI 則在現(xiàn)有的2010 年版上新增14 項(xiàng)，這些新增項(xiàng)對于AI 干預(yù)的報(bào)告尤為重要。經(jīng)比較后不難發(fā)現(xiàn)，CONSORT-AI 的14 項(xiàng)幾乎全在SPIRIT-AI 中，而SPIRIT-AI 僅多了1項(xiàng)對于AI 干預(yù)已有相關(guān)的臨床證據(jù)，需要在背景和原理章節(jié)中進(jìn)行介紹和描述。本文對AI 新增項(xiàng)進(jìn)行了解讀[23-24]（表2）。

AI 醫(yī)療的臨床試驗(yàn)才剛剛起步，國內(nèi)外產(chǎn)學(xué)研多方也在共同努力推進(jìn)。除了科研機(jī)構(gòu)引領(lǐng)并監(jiān)管AI 醫(yī)療的臨床試驗(yàn)，產(chǎn)品部門也需盡快落實(shí)這些指南新增項(xiàng)，以便在AI 醫(yī)療的臨床試驗(yàn)過程中能更有效地進(jìn)行數(shù)據(jù)收集、管理和分析。如IBMClinical Development[33]提供的臨床試驗(yàn)解決方案，正在探索及支持AI 醫(yī)療的臨床試驗(yàn)。

展望

2017 年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》，該規(guī)劃提出了2020 年、2025 年、2030 年的戰(zhàn)略目標(biāo)，醫(yī)療作為其中一個重要的應(yīng)用領(lǐng)域受到了極高的重視。在這短短3 年里，人們已經(jīng)驚喜地看到了很多AI 與醫(yī)療結(jié)合的試用和試點(diǎn)。2020 年，我們展望未來，產(chǎn)學(xué)研相結(jié)合，能夠更健康、更長遠(yuǎn)地發(fā)展。讓AI 醫(yī)療在前進(jìn)的道路上有望有證可循、有據(jù)可依。

第一作者簡介

梅婧，博士，IBM 中國研究院，高級研究員。專業(yè)方向：人工智能醫(yī)療

楊曉棟，碩士，IBM Watson Health，業(yè)務(wù)拓展總監(jiān)。專業(yè)方向：數(shù)字化時代的智慧醫(yī)療

通訊作者簡介

李少春，碩士，IBM Watson Health，大中華區(qū)總經(jīng)理。專業(yè)方向：數(shù)字化時代的智慧醫(yī)療

上一篇：加速構(gòu)建人工智能生態(tài)圈，武漢人工智能計(jì)算中心輸出典型解決方案超50項(xiàng)

下一篇：杭州人工智能計(jì)算中心上線

AiLab云推薦

人工智能醫(yī)療臨床試驗(yàn)，從循證醫(yī)學(xué)角度切入
來源：互聯(lián)網(wǎng) 發(fā)布日期：2022-05-21 09:22:44 瀏覽：16765次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

人工智能醫(yī)療臨床試驗(yàn)，從循證醫(yī)學(xué)角度切入 來源：互聯(lián)網(wǎng) 發(fā)布日期：2022-05-21 09:22:44 瀏覽：16765次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

人工智能醫(yī)療臨床試驗(yàn)，從循證醫(yī)學(xué)角度切入
來源：互聯(lián)網(wǎng) 發(fā)布日期：2022-05-21 09:22:44 瀏覽：16765次