近日,医联正式发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT。与通用型的大语言模型产品不同,MedGPT主要致⼒于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。
通用大语言模型在面对医学问题的准确性上存在天然缺陷,在问诊阶段,通用大语言模型往往会轻易给出结论,但对于医疗应用来说,一致性和准确性是底线问题。MedGPT则能够通过多轮问诊引导患者收集足够的诊断决策因⼦之后再进⼊到诊断环节,从而保证准确性。
医联MedGPT项目负责人王磊表示:MedGPT不会轻易给出诊断结论,而是会循序渐进地引导患者给出足够能够支撑有效诊断的病情全貌。也就是说,MedGPT 是通过收集足够信息并做出符合医学的决策,以“治愈”为目的而进行人机交互。通过独有的将⾃然语⾔⼤模型AI技术与⼀系列⼯程调优技术以及医学⼀致性校验技术相结合,并在模型微调训练阶段采⽤⼤量真实医⽣参与的RLHF(Reinforcement Learning from Human Feedback) 监督微调,有效提升模型的疾病特征判断与模式识别能⼒,确保医疗准确性。
医联还建立了基于专家评议的AI诊疗准确性与真实世界医⽣对标测试机制,不断将AI与真实诊疗场景对齐,最终实现准确诊断。
基于Transformer架构,MedGPT可以整合多种医学检验检测模态能力,首次实现线上问诊到医学检查的⽆缝衔接。在问诊环节结束之后,MedGPT会给患者开具必要的医学检查项目以进一步明确病情,患者则可以通过医联云检验等多模态能力进行检查。基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计疾病治疗方案。患者可以通过医联互联网医院实现送药到家,MedGPT会在患者收到药品后主动为患者进行用药指导与管理、智能随访复诊、康复指导等智能化疾病诊疗动作。通过多模态应用的打通MedGPT实现了预防、诊断、治疗、康复的全流程诊疗。
作为致力于疾病全流程诊疗的医疗专业大语言模型,医联MedGPT形成了一套独有的“DIAE”医疗AI建设方法论,分别从Disease(病种覆盖)、Intelligence(智能化)、Accuracy(准确性)、Efficiency(就医效率)四个维度来建设与打磨产品,不断提升MedGPT的实际医疗应用价值。
目前,医联正不断加速 MedGPT 的研发,希望数字医疗能力惠及更多人。医联MedGPT目前的参数规模为100B规模,预训练阶段使⽤了超过20亿的医学文本数据,微调训练阶段使⽤了800万条的高质量结构化临床诊疗数据,并投⼊超过100名医⽣参与⼈⼯反馈监督微调训练。目前医联MedGPT 已经可以覆盖 ICD10 的60%疾病病种,并在近期将研发重心倾斜在多发疾病,以提升数字医院的普惠率。预计在 2023 年底,可以覆盖80%病种的就诊需求。