作者 | 徐奕
責(zé)編 | 老姜
自20世紀(jì)邁入信息大爆炸時(shí)代以來, 各行各業(yè)都在主動(dòng)或被動(dòng)地改變其產(chǎn)業(yè)模式, 伴隨而來的問題也越來越多,我們需要這么多信息嗎? 準(zhǔn)確性如何? 我們不再擔(dān)心信息匱乏, 卻需要更多地培養(yǎng)自身理解信息和分析問題的能力。
一、醫(yī)學(xué)信息學(xué)概要
醫(yī)學(xué)信息學(xué)包括醫(yī)學(xué)與計(jì)算機(jī)科學(xué)、臨床信息學(xué), 圖形信息學(xué)和生物藥物信息學(xué)等學(xué)科,是通過研究醫(yī)療資源、實(shí)驗(yàn)設(shè)計(jì)和方法, 高效獲取醫(yī)學(xué)信息, 并進(jìn)行管理和合理利用信息的。
1965年由美國(guó)國(guó)家醫(yī)學(xué)圖書館開發(fā)使用的Medline是世界上第一個(gè)面向公眾,信息全面的線上醫(yī)學(xué)數(shù)據(jù)檢索平臺(tái),且被一直沿用至今。90年代國(guó)際上大量先進(jìn)地區(qū)醫(yī)療機(jī)構(gòu)都已經(jīng)開始應(yīng)用電子病歷系統(tǒng)(ePR), 包括北美、香港等。 21世紀(jì)以來, 隨著電子信息技術(shù)的高速發(fā)展, 醫(yī)學(xué)信息學(xué)已不再僅僅用于信息管理層面, 更多的是輔助醫(yī)生進(jìn)行日常診療工作, 比如遠(yuǎn)程醫(yī)療技術(shù), 手術(shù)機(jī)器人等。
二、循證醫(yī)學(xué)研究方法
循證醫(yī)學(xué)理論 (Evidence-Based Medicine,EBM)是以現(xiàn)實(shí)醫(yī)學(xué)證據(jù)為基礎(chǔ)的, 促進(jìn)推動(dòng)醫(yī)療行為決策的研究理論。在該理論模型下, 傳統(tǒng)醫(yī)學(xué)知識(shí)的循規(guī)蹈矩已不如真實(shí)醫(yī)學(xué)證據(jù)所提供的價(jià)值高。該理論對(duì)各種真實(shí)醫(yī)學(xué)證據(jù)做出了證據(jù)質(zhì)量分級(jí),其中Meta 分析、系統(tǒng)綜述和隨機(jī)臨床研究(RCT)屬于較高質(zhì)量類型。
圖1 證據(jù)等級(jí)金字塔
EBM研究共包括5個(gè)步驟:(1)將不確定性轉(zhuǎn)化為可以回答的問題,其中要包含批判性,實(shí)驗(yàn)設(shè)計(jì)和證據(jù)等級(jí);(2)系統(tǒng)化地檢索可找到的最好證據(jù);(3)批判性地評(píng)估證據(jù)的有效性和正確性;(4)將發(fā)現(xiàn)的結(jié)果應(yīng)用到實(shí)踐中;(5)應(yīng)用中效果的分析評(píng)價(jià)。
簡(jiǎn)言之,EBM 研究是 “定義問題—搜尋證據(jù)—價(jià)值評(píng)估—實(shí)踐應(yīng)用—效果分析”的流程閉環(huán),其中最主要的環(huán)節(jié)是定義問題和搜尋證據(jù)。在準(zhǔn)備階段,研究者必須對(duì)問題的理解和思路保證絕對(duì)的清晰,才可以正確且高效地完成后續(xù)步驟。在素材搜集階段,只有保證了高質(zhì)量的證據(jù),才可能獲得有價(jià)值的結(jié)論,否再如何優(yōu)化實(shí)驗(yàn)過程和結(jié)果分析,也是徒勞。
三、PICOS是什么?
為了將問題分解得更加清晰明確, 也為了更精準(zhǔn)地找到合適可用的證據(jù),研究者們總結(jié)出了很多種的思維模型, 而其中最具代表性和實(shí)用性的就是 PICO(s),其中 P指Participants (研究對(duì)象),I 指 Intervention (干預(yù)手段),C 指 Comparator/Control (對(duì)比對(duì)照), O 指 Outcome (研究結(jié)果,終點(diǎn)),S 指 Study design (研究設(shè)計(jì))。通過 PICO(s)的問題刻畫和要素分解, 往往復(fù)雜且晦澀的臨床研究問題都可以迎刃而解。
例如, 作為腫瘤二線療法的單抗類藥物是比較熱門的研究領(lǐng)域, 如果我們想知道德瓦魯單抗(Durvalumab, 阿斯利康)在接受過放化療的非小細(xì)胞肺癌患者(NSCLC)中的療效, 如何分解問題呢?
首先對(duì)于研究對(duì)象(P) 需要梳理出兩個(gè)特征, 其一是NSCLC, 其二是已經(jīng)接收過放化療且需要后續(xù)治療的患者;對(duì)于干預(yù)手段(I)I, 我們可以明確這個(gè)問題中的主要研究藥物為Durvalumab; 對(duì)于 對(duì)照對(duì)比(C), 我們可以定義其為其他二線治療手段, 或沒有接受二線治療的患者; 對(duì)于研究終點(diǎn)(O), 一般會(huì)用生存率指標(biāo)和疾病緩解指標(biāo)來定義腫瘤領(lǐng)域的藥物療效。
通過問題的結(jié)構(gòu)化梳理后, 我們提煉出了精準(zhǔn)的問題框架, 后面的文獻(xiàn)檢索過程就會(huì)變得清晰簡(jiǎn)單。在操作層面, 我們需要做的就是結(jié)合特定文獻(xiàn)檢索工具的邏輯連接詞(例如MeSH), 將 PICO(s) 轉(zhuǎn)化成檢索策略, 完成證據(jù)收集。
四、大數(shù)據(jù)和人工智能技術(shù)助力創(chuàng)新科研
對(duì)于現(xiàn)今的醫(yī)療從業(yè)者來說,除了臨床實(shí)踐以外,不斷學(xué)習(xí)和創(chuàng)新科研也是必需的工作內(nèi)容,否則很容易被新知識(shí)新技術(shù)所淘汰,而且這方面能力也是醫(yī)生職稱評(píng)級(jí)的重要標(biāo)準(zhǔn)。
據(jù)Medscape公布,2015年美國(guó)??漆t(yī)生平均收入為 28.4 萬美元,據(jù)統(tǒng)計(jì),中國(guó)醫(yī)生2015年均收入為 7.7 萬元。中國(guó)醫(yī)生工資待遇比較低,但工作壓力較大,在美國(guó)醫(yī)生眼里,中國(guó)醫(yī)生一天看100多個(gè)病人的方式是不可思議的,2 min內(nèi)看一個(gè)人是非常不負(fù)責(zé)任的,不過這種情況是由國(guó)情所決定,且壓縮了中國(guó)醫(yī)生可用于學(xué)習(xí)與科研的時(shí)間精力。在這樣的背景下,如何幫助醫(yī)生更快地、有效地去學(xué)習(xí)和科研也是人工智能技術(shù)在醫(yī)學(xué)領(lǐng)域的一個(gè)探索方向。
1.科學(xué)文獻(xiàn)存在多語言性、內(nèi)容專業(yè)、有效閱讀存在難度等技術(shù)壁壘。
先不論文獻(xiàn)的多語言性對(duì)知識(shí)獲取的難度提升,即使是母語系的臨床文獻(xiàn),也比其他種類的文字產(chǎn)物更加晦澀難懂,而且信息量更大。但科學(xué)文獻(xiàn)的優(yōu)勢(shì)也很明顯,主要有結(jié)構(gòu)相對(duì)固定、基本要素全面完整。利用文獻(xiàn)特性,如果讀者可以快速定位并且直接提取自己所感興趣的信息,那么這樣讀取信息的效率是很高的,所以我們需要PICO(s)來成為讀者獲取信息的指南針。
2.應(yīng)用人工智能技術(shù)可加快選題、檢索、數(shù)據(jù)獲取與整合的速度。
一般讀懂 1 篇 3000 字文章至少需要20~30 min,而有目的性的數(shù)據(jù)讀取只需要3~5 min就可以完成。如果我們將規(guī)則轉(zhuǎn)化成計(jì)算機(jī)語言,那么這部分工作完全可以由機(jī)器代工,整體速度將近一步提升,3~5 min足夠人工智能去篩選并提取上百篇上述類型文獻(xiàn)的信息和數(shù)據(jù)。
相對(duì)的,在做科研和寫文獻(xiàn)的過程中,PICO(s)可以作為大綱來指導(dǎo)作者的構(gòu)思和選題,幫助其高效獲取并有效整理素材。例如,通過傳統(tǒng)的人工方式,好的回歸性數(shù)據(jù)分析需要4~6個(gè)月的時(shí)間周期去完成,其中選題需要約1個(gè)月,數(shù)據(jù)獲取需要約2個(gè)月,數(shù)據(jù)分析和論文撰寫還需要約2個(gè)月。利用PICO(s)的思維去優(yōu)化這個(gè)過程可以提高效率,減少因選題不準(zhǔn)和數(shù)據(jù)不足引發(fā)的返工率,在此基礎(chǔ)上,結(jié)合人工智能的PICO(s)體系將可以進(jìn)一步加快選題,檢索,數(shù)據(jù)獲取與整合的速度。
3.醫(yī)學(xué)信息領(lǐng)域中應(yīng)用人工智能技術(shù)的手段仍然不夠完善,實(shí)際應(yīng)用中存在一定的限制。
即便是被譽(yù)為業(yè)界老大哥的IBM Watson也在今年早期傳出與安德森癌癥研究中心停止合作的消息,并且其營(yíng)收也停止了增長(zhǎng)。IBM Watson曾取得過很多的成功:
2011年,Watson(沃森)就在智力競(jìng)賽節(jié)目Jeopardy 中獲勝,此后IBM 就在一直積極宣傳沃森。在與巴羅神經(jīng)學(xué)研究所合作的過程中,Watson通過閱讀2500萬篇文獻(xiàn)摘要,100萬篇完整論文和400萬專利文獻(xiàn),建立了模型去預(yù)測(cè)RBPs與ALS的相關(guān)性。
有研究者為了測(cè)試其模型的預(yù)測(cè)能力,首先將IBM Watson的知識(shí)庫(kù)限制在2013年之前的學(xué)術(shù)出版物上,并要求Watson使用這些可用的信息來預(yù)測(cè)與ALS相關(guān)的其他RBPs。
在2013—2017年期間,Watson在對(duì)4個(gè)導(dǎo)致突變的RBPs給出了高度評(píng)價(jià),證明了模型的有效性。而后,Watson對(duì)基因組中所有的RBPs進(jìn)行篩選,并成功鑒定在ALS中改變的5種新型RBPs。而這僅僅是Watson在藥物發(fā)現(xiàn)方面的嘗試之一,除此之外還有與多家研究/政府機(jī)構(gòu)在衛(wèi)生保健方面的業(yè)務(wù)合作和拓展。
IBM Watson之后出現(xiàn)低谷的原因,主要是應(yīng)用人工智能學(xué)習(xí)人類經(jīng)驗(yàn),分析問題、預(yù)測(cè)過程中是有諸多限制因素:
(1)AI的能力高低取決于數(shù)據(jù)量級(jí)大小:數(shù)據(jù)越多,模型越準(zhǔn)確。(2)AI的分析能力基于過往數(shù)據(jù)——人類無法理解或者未出現(xiàn)過的事件,AI也無從知曉。(3)AI學(xué)習(xí)的內(nèi)容是由人來灌輸?shù)?mdash;—AI可以成為“最聰明的人”,卻無法超越“人”的范疇。
因此,我們應(yīng)該將AI看作人類的工具,使用它去提升工作效率,而不是成為獨(dú)立個(gè)體去自由工作。IBM Watson恰恰是因?yàn)閷⒆约憾ㄎ怀?ldquo;醫(yī)生”,而非“醫(yī)生助手”,卻始終無法達(dá)到這樣的高度,從而跌入低谷。
4. 人工智能與循證醫(yī)學(xué)的結(jié)合更加自然與合理
循證醫(yī)學(xué)本身就是溯源回歸性的總結(jié)分析,歷史上沉淀的大量數(shù)據(jù)沒有被整合或挖掘過,利用機(jī)器的運(yùn)作方式高效地處理這些信息或可得到新的智慧,摸索出一定的規(guī)律,進(jìn)而更好的幫助醫(yī)生去攻克醫(yī)學(xué)難題。
基于 PICO(s) 的框架模式,通過建設(shè)智能化醫(yī)學(xué)信息服務(wù)平臺(tái),整合數(shù)據(jù)源,將研究問題具體化,提供智能文獻(xiàn)檢索和管理,輸出圖表和分析報(bào)告。見圖2~4。
圖2 發(fā)文趨勢(shì)的可視化圖表樣例
圖3 熱點(diǎn)變化的可視化圖表樣例
圖4 廠商分布可視化圖表樣例
五、小結(jié)
綜上所述,普通純?nèi)斯ICO(s)模式下的EBM研究周期耗時(shí)較長(zhǎng),工作效率很低。談到智能化醫(yī)學(xué), 很多人想到的都是輔助診療,其實(shí)若能將AI技術(shù)應(yīng)用到PICO(s) 領(lǐng)域,醫(yī)學(xué)信息研究者可以大大提高工作質(zhì)量和效率。
另外,完整的PICO(s)是由多個(gè)標(biāo)簽組成的, 這些標(biāo)簽可以被 AI 利用形成學(xué)習(xí)邏輯,并通過大量文獻(xiàn)的灌輸, AI可以高速精確地提取我們需要的信息,將人工繁瑣的檢索和閱讀時(shí)間大大降低。
目前智能化醫(yī)學(xué)信息服務(wù)平臺(tái)是基于 PICO(s) 的框架模式,整合多數(shù)據(jù)源,將研究問題具體化,提供智能的文獻(xiàn)檢索和管理,最終可輸出可視化圖表和分析報(bào)告。
Copyright ? 2004-2025 健康一線-健康視頻網(wǎng)(vodjk.com)All rights reserved.