引領科技潮流的大模型,正在發(fā)力醫(yī)療與健康市場。發(fā)布在《急診醫(yī)學年鑒》、BMJ等期刊的研究顯示,醫(yī)療大模型在部分測試中比肩甚至超越了醫(yī)生,在保證醫(yī)療服務準確率與公平性、提升醫(yī)療系統(tǒng)工作效率等方面展現出應用優(yōu)勢與價值。頭部科技公司正在持續(xù)推出、調優(yōu)醫(yī)療大模型,并向醫(yī)療機構開放體驗。然而,醫(yī)療大模型要真正在醫(yī)療機構落地乃至普及,需要一套具有性價比的私有化部署方案,以應對數據安全和算力芯片價格昂貴、供貨周期長的挑戰(zhàn)。比如醫(yī)療人工智能解決方案提供商北京惠每云科技有限公司 (以下簡稱“惠每科技”)攜手英特爾,基于第四代英特爾至強可擴展處理器,打造了量化和非量化兩種醫(yī)療大模型加速方案,助力實現大模型在醫(yī)療系統(tǒng)的簡捷部署,讓AI在更多醫(yī)療流程發(fā)揮更大作用。
部分指標超越人類醫(yī)生?大模型在醫(yī)療領域潛力可觀
大模型與醫(yī)療行業(yè),有著天然的契合性。醫(yī)療領域存在大量模態(tài)種類豐富的數據,且呈現出多學科、跨領域的特點。而大模型的長項就是對多類數據進行整合總結、分析判斷和自動摘要。在前沿研究和企業(yè)布局的共同推動下,大模型扎根醫(yī)療,已經有了明朗的趨勢。
在保證醫(yī)療準確率和提升醫(yī)療系統(tǒng)工作效率方面,大模型有著可觀的應用潛力。一項發(fā)表在《急診醫(yī)學年鑒》雜志上的研究發(fā)現,人工智能聊天機器人對病人的診斷效果不亞于訓練有素的醫(yī)生。在荷蘭 Jeroen Bosch 醫(yī)院的試點研究中,研究人員將醫(yī)生的筆記和 30 名病人的匿名信息輸入兩個版本的ChatGPT。結果顯示,在醫(yī)生的診斷中(每位醫(yī)生在病例上列出了他們認為最有可能的5個診斷),有87%的病例包含正確的診斷。而ChatGPT 3.5在97%的病例中做出了正確的診斷,ChatGPT 4.0在87%的病例中做出了正確的診斷。
對于判斷標準較為多元的病癥——比如癥狀繁多且個體差異較為多樣的“心靈感冒”抑郁癥,大模型也有望在保證醫(yī)療服務質量和公正性方面發(fā)揮作用。近期發(fā)布在醫(yī)學期刊BMJ的研究顯示,ChatGPT在識別抑郁癥程度和確定治療方法上展現出更高的公正性和精準性。具體來看,ChatGPT能夠更精準地根據臨床指南調整治療方法,且對治療方案有著更高的遵循度,不會因為患者的性別、年齡與社會經濟地位而出現明顯偏差。
圍繞醫(yī)療大模型,科技企業(yè)已經著手布局。
在模型開發(fā)方面,谷歌的醫(yī)療大模型Med-PaLM2在美國醫(yī)療執(zhí)照考試(USMLE)的MedQA數據集實現了86.5%的準確率。微軟推出了用于生物醫(yī)學領域的大型語言和視覺模型LLaVA-Med, 能根據開放性指令輔助回答關于生物醫(yī)學圖像的問題。百度的“產業(yè)級”醫(yī)療大模型“靈醫(yī)”,已定向向公立醫(yī)院、藥械企業(yè)、互聯網醫(yī)院平臺、連鎖藥房等200多家醫(yī)療機構開放體驗。
在行業(yè)發(fā)展方面,大模型正在被引入臨床診斷決策、病例數據管理等領域,衍生出一系列AI應用。
比如惠每科技以其CDSS(臨床決策支持系統(tǒng))產品和海量醫(yī)療數據為基礎,積極引入大模型技術來為醫(yī)療機構打造更高品質的醫(yī)療 AI 應用。其面向醫(yī)院的核心應用Dr.Mayson,融入了PDCA(計劃-執(zhí)行-檢查-處理)過程管理和CDSS。具體來看,Dr.Mayson利用機器學習、深度學習、大數據挖掘等技術,一方面能夠智能識別并分析病歷文書、LIS(實驗室信息管理系統(tǒng))/RIS(放射信息管理系統(tǒng))報告等患者完整病歷數據,另一方面能夠為醫(yī)院構建專門的醫(yī)學知識庫,為醫(yī)生、醫(yī)技、護士、管理方提供實時智能參考與建議。
在惠每科技最新發(fā)布的CDSS 3.0架構中,新一代 AI 大數據處理平臺已集成了醫(yī)療大模型,并已經在某合作醫(yī)院的病歷生成等場景中獲得了醫(yī)生的認可。
如何實現部署和普及?性價比是關鍵
數據安全和算力成本,是醫(yī)療大模型部署落地的兩大難題。由于行業(yè)特殊性,醫(yī)療機構對于數據和隱私安全極其重視,任何醫(yī)療數據都要在安全可控的內網環(huán)境存儲和傳輸,因此醫(yī)療大模型更適合私有化的部署環(huán)境。而大模型的訓練和推理,要堆疊大量的專用加速芯片,其高額成本和較長的供貨周期,往往令醫(yī)療機構望而卻步。
因此,醫(yī)療大模型要實現在醫(yī)療機構的落地和擴展,需要一套具有性價比且安全穩(wěn)定的部署方案。
惠每科技便攜手英特爾,基于第四代英特爾至強可擴展處理器,打造了量化和非量化兩種醫(yī)療大模型優(yōu)化方案。
量化能夠為大模型“瘦身”。理論上,模型的參數精度越高,占用的存儲資源越多。因此,量化可以從降低參數精度著手,將訓練好的模型的權值、激活值等從高精度數據格式 (如 FP32 等) 轉化為低精度數據格式 (如 INT4 /INT8 等),從而降低推理過程中對內存等資源的需求,讓平臺可以容納更大參數規(guī)模的大模型,并大幅提升推理速度。
在惠每科技與英特爾的合作中,雙方基于第四代英特爾至強可擴展處理器內置的指令集,通過英特爾開發(fā)和開源的BigDL-LLM 大模型庫來實現推理加速量化方案。BigDL-LLM提供了面向不同低精度數據格式的支持和優(yōu)化,還可以給予不同處理器內置指令集(如英特爾 AVX-512_VNNI、英特爾AMX等)及配套的軟件實施推理加速,使大模型在英特爾架構平臺上實現更高的推理效率。
在實際使用中,BigDL-LLM 為醫(yī)療大模型提供了便捷命令和編程接口兩種使用方式,通過便捷命令方法,惠每科技可以方便地完成模型量化并評估量化后的推理效果,判斷該量化方案是否適用于當前模型。基于BigDL-LLM 提供的HuggingFace 和 LangChain編程接口,用戶能夠將量化方案快捷地整合到HuggingFace 或 LangChain 的項目代碼,高效完成模型部署。
在非量化優(yōu)化方案中,英特爾提供了鍵值(KV)緩存、算子融合的OpenVINO 加速方案。
KV緩存用于通過鍵值對的方式存儲數據,能加速和優(yōu)化數據訪問。在惠每科技主要使用的開源基座大模型ChatGLM上,英特爾OpenVINO非量化方案利用零拷貝(Zero-Copy)視圖來傳遞預分配KV 所需的內存副本空間,避免數據的多次拷貝,有效實現 KV 緩存加速。
還可以引入第四代至強可擴展處理器內置的英特爾AMX指令集,助力ChatGLM 等醫(yī)療大模型加速BF16/INT8 精度數據格式的模型推理,實現算子融合,在保證精度的同時提高醫(yī)療大模型的運算效率,加速推理過程。
OpenVINO工具套件還提供了在 HuggingFace 上的 Optimum 接口,讓優(yōu)化效果更便捷地擴展到更多醫(yī)療大模型的推理應用中。
通過惠每科技與英特爾的協(xié)同優(yōu)化,基于惠每科技醫(yī)療大模型構建的醫(yī)療AI應用能在保證精度的前提下有效提升醫(yī)療大模型的推理速度,幫助醫(yī)療機構有效地節(jié)約成本。接下來,雙方將對大模型技術在醫(yī)療領域中更廣泛和深入的應用開展更多探索,進而推動醫(yī)療全流程的 AI 技術加持或智能化,讓智慧醫(yī)療惠及更多醫(yī)與患,從而普惠大眾。
(責任編輯:華康)