AI大模型走進醫(yī)療，如何破解落地難題？

小大

時間：2023-12-28 15:20:39 來源：中國電子報

　　引領科技潮流的大模型，正在發(fā)力醫(yī)療與健康市場。發(fā)布在《急診醫(yī)學年鑒》、BMJ等期刊的研究顯示，醫(yī)療大模型在部分測試中比肩甚至超越了醫(yī)生，在保證醫(yī)療服務準確率與公平性、提升醫(yī)療系統(tǒng)工作效率等方面展現出應用優(yōu)勢與價值。頭部科技公司正在持續(xù)推出、調優(yōu)醫(yī)療大模型，并向醫(yī)療機構開放體驗。然而，醫(yī)療大模型要真正在醫(yī)療機構落地乃至普及，需要一套具有性價比的私有化部署方案，以應對數據安全和算力芯片價格昂貴、供貨周期長的挑戰(zhàn)。比如醫(yī)療人工智能解決方案提供商北京惠每云科技有限公司 (以下簡稱“惠每科技”)攜手英特爾，基于第四代英特爾至強可擴展處理器，打造了量化和非量化兩種醫(yī)療大模型加速方案，助力實現大模型在醫(yī)療系統(tǒng)的簡捷部署，讓AI在更多醫(yī)療流程發(fā)揮更大作用。

　　部分指標超越人類醫(yī)生?大模型在醫(yī)療領域潛力可觀

　　大模型與醫(yī)療行業(yè)，有著天然的契合性。醫(yī)療領域存在大量模態(tài)種類豐富的數據，且呈現出多學科、跨領域的特點。而大模型的長項就是對多類數據進行整合總結、分析判斷和自動摘要。在前沿研究和企業(yè)布局的共同推動下，大模型扎根醫(yī)療，已經有了明朗的趨勢。

　　在保證醫(yī)療準確率和提升醫(yī)療系統(tǒng)工作效率方面，大模型有著可觀的應用潛力。一項發(fā)表在《急診醫(yī)學年鑒》雜志上的研究發(fā)現，人工智能聊天機器人對病人的診斷效果不亞于訓練有素的醫(yī)生。在荷蘭 Jeroen Bosch 醫(yī)院的試點研究中，研究人員將醫(yī)生的筆記和 30 名病人的匿名信息輸入兩個版本的ChatGPT。結果顯示，在醫(yī)生的診斷中(每位醫(yī)生在病例上列出了他們認為最有可能的5個診斷)，有87%的病例包含正確的診斷。而ChatGPT 3.5在97%的病例中做出了正確的診斷，ChatGPT 4.0在87%的病例中做出了正確的診斷。

　　對于判斷標準較為多元的病癥——比如癥狀繁多且個體差異較為多樣的“心靈感冒”抑郁癥，大模型也有望在保證醫(yī)療服務質量和公正性方面發(fā)揮作用。近期發(fā)布在醫(yī)學期刊BMJ的研究顯示，ChatGPT在識別抑郁癥程度和確定治療方法上展現出更高的公正性和精準性。具體來看，ChatGPT能夠更精準地根據臨床指南調整治療方法，且對治療方案有著更高的遵循度，不會因為患者的性別、年齡與社會經濟地位而出現明顯偏差。

　　圍繞醫(yī)療大模型，科技企業(yè)已經著手布局。

　　在模型開發(fā)方面，谷歌的醫(yī)療大模型Med-PaLM2在美國醫(yī)療執(zhí)照考試(USMLE)的MedQA數據集實現了86.5%的準確率。微軟推出了用于生物醫(yī)學領域的大型語言和視覺模型LLaVA-Med, 能根據開放性指令輔助回答關于生物醫(yī)學圖像的問題。百度的“產業(yè)級”醫(yī)療大模型“靈醫(yī)”，已定向向公立醫(yī)院、藥械企業(yè)、互聯網醫(yī)院平臺、連鎖藥房等200多家醫(yī)療機構開放體驗。

　　在行業(yè)發(fā)展方面，大模型正在被引入臨床診斷決策、病例數據管理等領域，衍生出一系列AI應用。

　　比如惠每科技以其CDSS(臨床決策支持系統(tǒng))產品和海量醫(yī)療數據為基礎，積極引入大模型技術來為醫(yī)療機構打造更高品質的醫(yī)療 AI 應用。其面向醫(yī)院的核心應用Dr.Mayson，融入了PDCA(計劃-執(zhí)行-檢查-處理)過程管理和CDSS。具體來看，Dr.Mayson利用機器學習、深度學習、大數據挖掘等技術，一方面能夠智能識別并分析病歷文書、LIS(實驗室信息管理系統(tǒng))/RIS(放射信息管理系統(tǒng))報告等患者完整病歷數據，另一方面能夠為醫(yī)院構建專門的醫(yī)學知識庫，為醫(yī)生、醫(yī)技、護士、管理方提供實時智能參考與建議。

　　在惠每科技最新發(fā)布的CDSS 3.0架構中，新一代 AI 大數據處理平臺已集成了醫(yī)療大模型，并已經在某合作醫(yī)院的病歷生成等場景中獲得了醫(yī)生的認可。

　　如何實現部署和普及?性價比是關鍵

　　數據安全和算力成本，是醫(yī)療大模型部署落地的兩大難題。由于行業(yè)特殊性，醫(yī)療機構對于數據和隱私安全極其重視，任何醫(yī)療數據都要在安全可控的內網環(huán)境存儲和傳輸，因此醫(yī)療大模型更適合私有化的部署環(huán)境。而大模型的訓練和推理，要堆疊大量的專用加速芯片，其高額成本和較長的供貨周期，往往令醫(yī)療機構望而卻步。

　　因此，醫(yī)療大模型要實現在醫(yī)療機構的落地和擴展，需要一套具有性價比且安全穩(wěn)定的部署方案。

　　惠每科技便攜手英特爾，基于第四代英特爾至強可擴展處理器，打造了量化和非量化兩種醫(yī)療大模型優(yōu)化方案。

　　量化能夠為大模型“瘦身”。理論上，模型的參數精度越高，占用的存儲資源越多。因此，量化可以從降低參數精度著手，將訓練好的模型的權值、激活值等從高精度數據格式 (如 FP32 等) 轉化為低精度數據格式 (如 INT4 /INT8 等)，從而降低推理過程中對內存等資源的需求，讓平臺可以容納更大參數規(guī)模的大模型，并大幅提升推理速度。

　　在惠每科技與英特爾的合作中，雙方基于第四代英特爾至強可擴展處理器內置的指令集，通過英特爾開發(fā)和開源的BigDL-LLM 大模型庫來實現推理加速量化方案。BigDL-LLM提供了面向不同低精度數據格式的支持和優(yōu)化，還可以給予不同處理器內置指令集(如英特爾 AVX-512_VNNI、英特爾AMX等)及配套的軟件實施推理加速，使大模型在英特爾架構平臺上實現更高的推理效率。

　　在實際使用中，BigDL-LLM 為醫(yī)療大模型提供了便捷命令和編程接口兩種使用方式，通過便捷命令方法，惠每科技可以方便地完成模型量化并評估量化后的推理效果，判斷該量化方案是否適用于當前模型。基于BigDL-LLM 提供的HuggingFace 和 LangChain編程接口，用戶能夠將量化方案快捷地整合到HuggingFace 或 LangChain 的項目代碼，高效完成模型部署。

　　在非量化優(yōu)化方案中，英特爾提供了鍵值(KV)緩存、算子融合的OpenVINO 加速方案。

　　KV緩存用于通過鍵值對的方式存儲數據，能加速和優(yōu)化數據訪問。在惠每科技主要使用的開源基座大模型ChatGLM上，英特爾OpenVINO非量化方案利用零拷貝(Zero-Copy)視圖來傳遞預分配KV 所需的內存副本空間，避免數據的多次拷貝，有效實現 KV 緩存加速。

　　還可以引入第四代至強可擴展處理器內置的英特爾AMX指令集，助力ChatGLM 等醫(yī)療大模型加速BF16/INT8 精度數據格式的模型推理，實現算子融合，在保證精度的同時提高醫(yī)療大模型的運算效率，加速推理過程。

　　OpenVINO工具套件還提供了在 HuggingFace 上的 Optimum 接口，讓優(yōu)化效果更便捷地擴展到更多醫(yī)療大模型的推理應用中。

　　通過惠每科技與英特爾的協(xié)同優(yōu)化，基于惠每科技醫(yī)療大模型構建的醫(yī)療AI應用能在保證精度的前提下有效提升醫(yī)療大模型的推理速度，幫助醫(yī)療機構有效地節(jié)約成本。接下來，雙方將對大模型技術在醫(yī)療領域中更廣泛和深入的應用開展更多探索，進而推動醫(yī)療全流程的 AI 技術加持或智能化，讓智慧醫(yī)療惠及更多醫(yī)與患，從而普惠大眾。

（責任編輯：華康）

關閉此頁

AI大模型走進醫(yī)療，如何破解落地難題？

相關文章:

熱點聚焦

最新閱讀

熱門排行

AI大模型走進醫(yī)療，如何破解落地難題？

相關文章:

熱點聚焦

最新閱讀

熱門排行

AI大模型走進醫(yī)療，如何破解落地難題？