- 平安醫療大模型獲全球醫療AI最高評分 超越Meta、OpenAI金融、醫療專業大模型均達世界一流水平
-
時間:2026-04-24 文章來源:
近日,中國平安旗下平安科技攜手平安好醫生、北大醫療聯合研發的平安“醫療大模型3.5”,在全球醫療AI權威評測集HealthBench Hard(OpenAI發布)中斬獲全球最高分(57.27分),超越百川(44.4分)、Meta(42.8分)、OpenAI(42分)等多家頭部科技企業位列排名榜首,刷新該基準的評分紀錄。此前,中國平安金融大模型在行業權威大模型評測體系CNFinBench大語言模型公開榜單上同樣位列綜合第一。相關評測方表示,目前中國平安在“金融”、“醫療”兩大專業領域的大模型技術能力均達到世界一流水平。
據了解,平安醫療大模型參與評測的HealthBench基準由OpenAI發布,由60個國家、26個醫學專業的262名醫生共同構建,包含5000組高仿真多輪醫療對話,并設置48,562項由醫生制定的評分標準系。其中,HealthBench Hard被視為高難度子集,是OpenAI從5000組對話中篩選出1000組更具挑戰性的案例,用于測試模型在復雜、不確定、高風險臨床場景中的推理能力上限,也是OpenAI評估先進模型及醫療健康產品的重要參考。
復刻真實醫生臨床推理邏輯,AI醫療大模型從“咨詢”走向“診療”
平安科技介紹,區別于通用大模型側重標準化問答的訓練邏輯,平安結合北大醫療集團、平安好醫生等醫療自營旗艦業務的真實場景,依托長期積累的“篩、管、治、康”全病程服務閉環數據,持續推動醫療AI從傳統的信息獲取、健康咨詢,進一步走向復雜病種輔助決策、多學科協同診療等更接近臨床核心的應用場景,打造主動服務式AI大模型。
結合真實場景數據,AI大模型復刻真實醫生臨床推理邏輯。針對臨床普遍存在患者癥狀描述模糊、病情動態變化、關鍵信息缺失等難題,平安科技研發團隊設計了由患者數字分身、自適應評估智能體、臨床知識圖譜組成的動態診斷模擬環境,將醫生在不確定條件下的判斷過程建模為multi-turn RL推理任務,為算法優化突破提供支撐。
錘煉頂尖算法能力,提高AI大模型可用性、準確度。針對醫療推理高復雜、低容錯的特點,研發團隊采用三階段遞進訓練:靜態框架內化構建具臨床邏輯的知識體系、動態思維鏈探索實現復雜場景下的長鏈與跨學科推理,最終實現高階推理能力躍遷。同時自研全鏈路幻覺控制引擎,融合上下文及語境學習、不確定量化等算法,實現從提示詞、訓練到推理階段的全流程風險控制,不斷降低幻覺率。
AI賦能“四到”醫療體系(到線、到院、到家、到企)。推出平安靈眸、健康管家、AI-MDT、AI康復等AI醫療產品,平安逐步構建了覆蓋"篩查-管理-治療-康復"的完整醫療鏈路,通過規模化、數據飛輪、真實世界對齊三項核心要素,實現醫療AI智能躍遷。在早篩環節,“平安靈眸”已構建90余種疾病篩查模型。目前,該產品已下沉至全國1500家基層醫療機構,累計完成150萬次早篩,每年幫助30萬客戶實現風險早發現,。在管理環節,“健康管家”通過多智能體協同,打造了“社群運營”式健康管理體系,已構建起服務200萬患者的國內最大慢病管理社區。通過AI主動干預,慢病患者的依從性提升了5倍,實現了從一次性咨詢到長期健康效果管理的質變。
落地MDT多場景,AI診療方案采納率已達85%
行業臨床數據表明,接受規范MDT(Multidisciplinary Team,多學科診療團隊)會診的腫瘤患者,五年生存率可提升15%。但受限于頂級專家稀缺、醫院流程限制、地域資源不均等問題,國內高質量MDT服務覆蓋率長期偏低。響應市場和客戶需求,中國平安依托醫療大模型,推出北大醫療AI-MDT Pro智能會診系統,面向醫生團隊提供復雜病史自動整理、多學科診療方案生成、康復及隨訪方案輔助等能力,把稀缺的多學科診療能力通過AI產品化下沉,解決用戶的就醫難題。
平安科技介紹,北大醫療AI-MDT Pro智能會診系統已落地北大醫療、平安好醫生等機構真實場景,可充分考慮患者信息,給出化療、靶向治療、放療、內分泌治療的全流程建議,并明確用藥劑量、周期、順序。內部數據顯示,平安的AI診療方案采納率達到85%;在乳腺癌等重癥領域,AI診療方案和主任專家一致性達到92.5%以上。平安首席技術官王曉航表示,平安的目標是將頂級的多學科診療能力,從中心城市大醫院的稀缺資源,轉化為觸手可及的規模化普惠供給。
值得一提的是,2026年3月,中國平安金融大模型PingAnGPT-Qwen3-32B 在CNFinBench大語言模型公開榜單上綜合排名第一,超越DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等開源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等領先的閉源商業模型,在金融事實推理與計算、金融專業知識問答、金融合規與風險控制等多項關鍵指標表現卓越。2026年4月,中國平安升級AI“快捷服務”,為2.52億客戶打造“一句話能辦事”的專屬金融AI 助手,能交易、能融資、能理賠、能救急,滿足“一個入口、一站式解決”客戶需求。該AI助手將300余項數字化服務全面封裝,構建了主動服務能力,能夠理解客戶的個性化需求,讓服務從“被動響應”走向“主動打理”。
打造領先科技能力,專業服務守護心中的平安。中國平安表示,公司將堅持深化“綜合金融+醫療養老”雙輪并行以及科技驅動戰略,秉承“AI in ALL”原則,深度扎根金融、醫療、養老等核心主業,持續推進模型優化迭代,進一步打造領先AI能力,深化場景化應用落地,重構業務效率、變革服務體驗,不斷滿足人民群眾對美好生活的向往。