
2024(18th) 中國衛(wèi)生信息技術(shù)/健康醫(yī)療大數(shù)據(jù)應(yīng)用交流大會(2024 CHITEC)將于2024年7月5-7日在重慶舉辦。大會組織平行專題交流及成果與應(yīng)用技術(shù)主題展,全面展示我國衛(wèi)生健康信息領(lǐng)域卓越實(shí)力和水平。
本屆大會上將發(fā)布第三屆CHITEC數(shù)字醫(yī)療健康創(chuàng)新服務(wù)典型案例征集結(jié)果。自案例征集活動啟動以來,得到全國各醫(yī)療衛(wèi)生機(jī)構(gòu)、高等院校、科研院所的積極響應(yīng)。
由煙臺毓璜頂醫(yī)院申報,醫(yī)渡科技旗下醫(yī)渡云聯(lián)合申報的“醫(yī)療大數(shù)據(jù)驅(qū)動的科研平臺建設(shè)及應(yīng)用”案例入選數(shù)字醫(yī)療健康創(chuàng)新服務(wù)典型案例,F(xiàn)與大家進(jìn)行分享,促進(jìn)交流合作。
案例名稱:醫(yī)療大數(shù)據(jù)驅(qū)動的科研平臺建設(shè)及應(yīng)用
主體申報單位:煙臺毓璜頂醫(yī)院
聯(lián)合申報單位:醫(yī)渡云(北京)技術(shù)有限公司
本文內(nèi)容主要分成以下7個部分:
1、單位簡介
2、針對問題/應(yīng)用場景
3、創(chuàng)新點(diǎn)
4、關(guān)鍵技術(shù)及其先進(jìn)性
5、應(yīng)用效果
6、社會效益(推廣性)
7、問題與展望
單位簡介
煙臺毓璜頂醫(yī)院始建于1890年,其前身是美國長老會創(chuàng)辦的教會醫(yī)院。經(jīng)過130多年的發(fā)展,現(xiàn)已發(fā)展成為煙臺市最大的綜合性醫(yī)療保健中心、三級甲等綜合醫(yī)院、山東省區(qū)域醫(yī)療中心。
醫(yī)院設(shè)有50個臨床科室、18個醫(yī)技科室,其中有國家級重點(diǎn)學(xué)科1個,國家臨床重點(diǎn)?3個,山東省臨床醫(yī)學(xué)研究中心1個,山東省臨床精品特色?3個,山東省醫(yī)藥衛(wèi)生重點(diǎn)學(xué)科5個,省重點(diǎn)實(shí)驗(yàn)室5個,山東省臨床重點(diǎn)?30個,山東省中醫(yī)藥重點(diǎn)?3個。
2018年以來,獲國家自然科學(xué)基金38項(xiàng),省級課題96項(xiàng),發(fā)表SCI收錄論文1710篇,最高影響因子168.9分,醫(yī)院的整體科研實(shí)力和學(xué)術(shù)水平居國內(nèi)地市級醫(yī)院前列。
醫(yī)院網(wǎng)絡(luò)信息管理處共33人,其中,博士生1人、研究生13人,本科生19人。分設(shè)系統(tǒng)運(yùn)維組、網(wǎng)絡(luò)運(yùn)維組、安全運(yùn)維組、維修組。網(wǎng)絡(luò)信息管理處全面負(fù)責(zé)醫(yī)院信息化規(guī)劃、建設(shè)、管理維護(hù)工作,全面負(fù)責(zé)網(wǎng)絡(luò)安全建設(shè)及管理維護(hù)工作。
針對問題/應(yīng)用場景
醫(yī)院經(jīng)過長期的信息化建設(shè),構(gòu)建了相對完備的信息化系統(tǒng)。在各平臺的使用過程中,產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)分散在幾十個甚至上百個臨床系統(tǒng)中。這些來自不同系統(tǒng)的數(shù)據(jù)之間是完全割裂的,或者只達(dá)到了部分聯(lián)通。
這些數(shù)據(jù)除了一些簡單的已經(jīng)被結(jié)構(gòu)化錄入的數(shù)據(jù)(如患者性別、檢查種類)外,還有大量數(shù)據(jù)在錄入系統(tǒng)時,采用的是非結(jié)構(gòu)化方式輸入,如一訴五史、病程記錄、影像檢查報告等。這些非結(jié)構(gòu)化信息往往是更具有臨床價值的信息。
如何能夠充分挖掘利用醫(yī)院積累的千百萬份病歷數(shù)據(jù)?
如何讓數(shù)據(jù)提供科研靈感?
如何把數(shù)據(jù)轉(zhuǎn)化為有價值、促學(xué)科發(fā)展的資產(chǎn)?
如何快速利用這些數(shù)據(jù),進(jìn)行成果轉(zhuǎn)化,支持未來實(shí)現(xiàn)精準(zhǔn)醫(yī)療?
“科研構(gòu)思難、數(shù)據(jù)獲取難、想法驗(yàn)證難、數(shù)據(jù)處理難”的傳統(tǒng)科研模式已無法實(shí)現(xiàn)以上問題,為推進(jìn)信息標(biāo)準(zhǔn)化工作,促進(jìn)標(biāo)準(zhǔn)的規(guī)范和實(shí)用,實(shí)現(xiàn)分散數(shù)據(jù)資源的集成和利用,實(shí)現(xiàn)醫(yī)院的大數(shù)據(jù)挖掘和利用,以及真正的知識庫和高級決策支持,基于大數(shù)據(jù)及人工智能技術(shù)進(jìn)行臨床研究的新模式應(yīng)運(yùn)而生。
創(chuàng)新點(diǎn)
1. 層次醫(yī)療術(shù)語抽取技術(shù)
基于對病歷數(shù)據(jù)的理解,特別設(shè)計(jì)了一種基于多層次醫(yī)療術(shù)語抽取技術(shù)的醫(yī)學(xué)自然語言處理方法,以實(shí)現(xiàn)對病歷自由文本的語義分詞。通過機(jī)器學(xué)習(xí)技術(shù)與語義分詞的結(jié)合,可以持續(xù)完善分詞的準(zhǔn)確度和精細(xì)度。這種模式可以替代傳統(tǒng)的數(shù)據(jù)摘抄模式,在提高數(shù)據(jù)獲取效率的同時,為科研提供了更廣泛的數(shù)據(jù)資源。
2. 在線統(tǒng)計(jì)建模
實(shí)現(xiàn)醫(yī)學(xué)統(tǒng)計(jì)算法的集成與嵌入,數(shù)據(jù)無需導(dǎo)出即可進(jìn)行線上實(shí)時統(tǒng)計(jì)分析,結(jié)果快速可靠。除覆蓋比較均值分析、回歸分析、相關(guān)分析等基本統(tǒng)計(jì)分析算法外,還引入了高級挖掘算法,如:決策樹和主成分分析等。降低了科研統(tǒng)計(jì)專業(yè)的門檻,方便醫(yī)生隨時驗(yàn)證研究想法,快速生成統(tǒng)計(jì)結(jié)果。
關(guān)鍵技術(shù)及其先進(jìn)性
基于云計(jì)算及大數(shù)據(jù)技術(shù),整體采用Hadoop 2.0技術(shù)框架及Spark并行計(jì)算框架,采用了應(yīng)用與計(jì)算能力的架構(gòu)設(shè)計(jì),并采用了Docker封裝技術(shù)。 完成整個大數(shù)據(jù)平臺的數(shù)據(jù)處理工作,其具備的基礎(chǔ)功能有:OGG / CDC / ETL等技術(shù)、結(jié)構(gòu)化、清洗歸一、數(shù)據(jù)挖掘、索引構(gòu)建、機(jī)器學(xué)習(xí)等。
大數(shù)據(jù)平臺需要解決數(shù)據(jù)獲取、數(shù)據(jù)清洗等方面的工作,將醫(yī)院的醫(yī)療信息子系統(tǒng)的數(shù)據(jù)進(jìn)行抽取、同步、匯集、結(jié)構(gòu)化、映射到兼容國際國內(nèi)醫(yī)療數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)的全局標(biāo)準(zhǔn)、統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)平臺中,對字段信息清洗和語義歸一,為上層應(yīng)用服務(wù)提供準(zhǔn)確的基礎(chǔ)數(shù)據(jù)支撐和業(yè)務(wù)模型訓(xùn)練。
將醫(yī)院各相關(guān)應(yīng)用系統(tǒng)的數(shù)據(jù)庫作為數(shù)據(jù)源,通過ETL等工具進(jìn)行數(shù)據(jù)的抽取同步清洗轉(zhuǎn)化,在此過程中,著重對患者的敏感信息進(jìn)行處理,然后加載到醫(yī)院標(biāo)準(zhǔn)數(shù)據(jù)的Schema數(shù)據(jù)倉庫中,先做數(shù)據(jù)集中,然后進(jìn)行清洗和關(guān)聯(lián)操作,這個過程參考HL7相關(guān)標(biāo)準(zhǔn),建立臨床數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集,數(shù)據(jù)加工的過程做“數(shù)據(jù)歸一處理”,形成面向應(yīng)用的標(biāo)準(zhǔn)數(shù)據(jù)集。
另外,醫(yī)生在臨床工作中會記錄大量自然語言信息,非結(jié)構(gòu)化數(shù)據(jù),這部分?jǐn)?shù)據(jù)在既往是無法挖掘的。通過自然語義處理技術(shù),結(jié)合醫(yī)療專業(yè)術(shù)語的語義結(jié)構(gòu),按照臨床專家的醫(yī)學(xué)邏輯,進(jìn)行數(shù)據(jù)處理,將原始的自然語言表達(dá)分析處理為結(jié)構(gòu)化的可用數(shù)據(jù),為后續(xù)的應(yīng)用、挖掘、機(jī)器學(xué)習(xí)提供基礎(chǔ)數(shù)據(jù)支持。通過醫(yī)用術(shù)語的歸一和結(jié)構(gòu)化處理后,再進(jìn)行檢索時,一并獲取檢索結(jié)果。
應(yīng)用效果
截至2024年03月,已入庫治理6大廠商,12個信息系統(tǒng)的臨床數(shù)據(jù)8000余萬條,包括800多萬份病人和超過600萬份病歷數(shù)據(jù)。形成數(shù)據(jù)治理規(guī)則3000余條,結(jié)構(gòu)化數(shù)據(jù)指標(biāo)2857個,數(shù)據(jù)質(zhì)量核查規(guī)則1240個,基于此建立多病種疾病數(shù)據(jù)模型。
已支撐面向冠心病、耳鼻喉疾病、甲狀腺腫瘤、生殖遺傳病、乳腺疾病、泌尿系腫瘤、哮喘7個科研科室建立了專病數(shù)據(jù)庫庫,已有20余個研究模型成果轉(zhuǎn)化反哺臨床。
1. 建立醫(yī)院高質(zhì)量數(shù)據(jù)資產(chǎn)
以疾病為單元,構(gòu)建覆蓋患者全病程數(shù)據(jù)的科研數(shù)據(jù)庫,通過自然語言處理、機(jī)器學(xué)習(xí)等技術(shù)使多源異構(gòu)的臨床數(shù)據(jù)變成滿足臨床研究細(xì)粒度要求、可直接用于臨床研究統(tǒng)計(jì)分析使用的結(jié)構(gòu)化、標(biāo)準(zhǔn)化的高質(zhì)量數(shù)據(jù),為醫(yī)院實(shí)現(xiàn)數(shù)據(jù)應(yīng)用奠定堅(jiān)實(shí)的研究級數(shù)據(jù)基礎(chǔ)。
2. 構(gòu)建智能化臨床研究分析平臺
臨床研究平臺融合人工智能技術(shù),實(shí)現(xiàn)復(fù)雜的患者檢索、靈活的項(xiàng)目管理、全面的數(shù)據(jù)質(zhì)量管控、自動化數(shù)據(jù)清洗、高效的數(shù)據(jù)分析挖掘等功能,輔助醫(yī)生提高科研效率,降低臨床研究門檻,提升科研積極性。
3. 助力醫(yī)院成為數(shù)據(jù)驅(qū)動型醫(yī)院
通過歷史電子醫(yī)療數(shù)據(jù)和實(shí)時醫(yī)療數(shù)據(jù)的集成與治理,建設(shè)醫(yī)院特色的高質(zhì)量專病數(shù)據(jù)資產(chǎn)庫,依托大數(shù)據(jù)平臺,充分挖掘醫(yī)院醫(yī)療大數(shù)據(jù),構(gòu)建“臨床行為產(chǎn)生數(shù)據(jù),洞察數(shù)據(jù)輔助決策,反饋臨床行為”的數(shù)據(jù)驅(qū)動閉環(huán)流程,從而以數(shù)據(jù)的角度提高醫(yī)院臨床治療效果與臨床質(zhì)量。
社會效益(推廣性)
通過建立科研專病數(shù)據(jù)庫,整合、加工院內(nèi)符合標(biāo)準(zhǔn)的患者診療信息,實(shí)現(xiàn)臨床醫(yī)生對精準(zhǔn)患者臨床全量數(shù)據(jù)的結(jié)構(gòu)化存儲和管理,實(shí)現(xiàn)數(shù)據(jù)快速更新,高效復(fù)雜檢索,多項(xiàng)目管理等需求,確保數(shù)據(jù)質(zhì)量,提高科研效率。
科研專病數(shù)據(jù)庫的建立對相關(guān)病種數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化描述、深度分析應(yīng)用,為實(shí)現(xiàn)醫(yī)學(xué)大數(shù)據(jù)精準(zhǔn)科研工作應(yīng)用提供重要工具。
科研信息平臺應(yīng)用的意義在于,科研課題與成果由以數(shù)量取勝逐漸轉(zhuǎn)變?yōu)閿?shù)量穩(wěn)定, 層次不斷攀升,高水平成果、論文、學(xué)術(shù)研究等大幅度提升, 體現(xiàn)出科技是第一生產(chǎn)力和“科技興醫(yī)、質(zhì)量興院”的強(qiáng)大世態(tài), “數(shù)字化醫(yī)院管理、人性化醫(yī)療流程、高水平科技創(chuàng)新、低成本高效經(jīng)營”的戰(zhàn)略目標(biāo)逐步實(shí)現(xiàn)。
問題與展望
基于人工智能技術(shù)的科研專病數(shù)據(jù)庫建設(shè),實(shí)現(xiàn)了數(shù)據(jù)的重復(fù)利用和價值提升,?萍膊£(duì)列建設(shè)的意義在于為疾病的早期預(yù)防和干預(yù)提供數(shù)據(jù)依據(jù),優(yōu)化個體化醫(yī)療決策和治療策略,推動臨床轉(zhuǎn)化和新療法研發(fā)。
因此,建立和維護(hù)一個全面、準(zhǔn)確、實(shí)時更新的專病數(shù)據(jù)庫對于科研和臨床實(shí)踐非常重要。
通過整合和共享專病相關(guān)數(shù)據(jù),促進(jìn)專病研究的進(jìn)展,并為臨床醫(yī)生提供更好的決策支持。在技術(shù)的推動下,我們期待科研專病數(shù)據(jù)庫能夠更加全面、準(zhǔn)確和智能,對我國疾病的預(yù)防、治療和管理產(chǎn)生深遠(yuǎn)影響,為人類健康做出更大的貢獻(xiàn)。
(責(zé)任編輯:華康)