图片来源@视觉中国
文|vb动脉网
刚结束的2023世界人工智能大会上,联影智能CEO周翔在谈及大语言模型时,将这一技术及其背后时代的特征归纳为两个词,一个是“融合”,一个是“涌现”。
“涌现”一词的广泛认知归功于凯文·凯利那本经典的《失控》,用以描述一个系统中个体间预设的简单互动行为所造就的无法预知的复杂样态的现象。如今的大语言模型便是如此,当模型的尺度不断增加,模型的能力会在一定范围内维持类线性的走势(深度学习便是如此),并在突破阈值后实现爆发式增长。
“融合”未来产业的发展路径,也是是涌现的“增程器”,指借助生态这一模式,跨越软件与硬件之间的边界、影像和文本之间的边界、环节与流程之间的边界,生成跨场景的多模态数据与多线程能力。这个过程,“融合”可为“涌现”供给多元、巨量的数据。
“融合”与“涌现”贯穿了整个世界人工智能大会,其中的健康高峰论坛同样试图探究这两个词的背后逻辑。
然后将它应用于未来的医疗领域。
2023世界人工智能大会
天壤之别,医疗大模型不能套用通用大模型
与通用领域相比,医疗领域的大模型虽有相似之处,但在模型的设计、训练、应用等环节方面均有天壤之别。
“定位”是医疗大模型与通用大模型最大的相似之处。无论是过去的机器学习、后续的深度学习还是如今的生成式AI及大语言模型,AI的本质都是一种“工具的工具”,以“赋能”为价值实现路径。AI——至少现阶段的AI——不会成为一个医生,也不会独立研制一款药物,否则Google、Microsoft早该撕下科技公司的标签,成为世界级的制药公司。
“场景需求”、“训练数据”、“应用对象”构成了医疗大模型与通用大模型的差异,三个要点将两类模型远远分隔开,开启了各自的发展路径。
先谈“场景需求”。周翔在演讲中对于两者之间的场景需求差异进行了完整解释,他认为通用的语言大模型不能完全满足医疗场景需求原因有三:
首先,医疗行业的专业性与严肃性毋庸置疑,医疗场景对问题的容错率低,这自然对语言大模型提出了更高的要求,即AI需要基于医疗专业语料给出更专业、更精准的医疗建议;其次,目前医疗数据中有超过90%的数据来自于医学影像,这也意味着一个切实有效的、能作复杂决策的医疗人工智能大模型,需要融合医学影像、文本,甚至语音或是视频等多模态信息以赋能各种医疗场景。最后,考虑到现阶段医院实际的部署环境和数据安全性要求,“大模型”不能无限“大”,院内应用的可及性是必须考虑的一环。
其次是“训练数据”。医疗数据多模态的特性实际上是对整个数据集的稀释,将海量医疗大数据分散至各个场景中,每个子数据集的数量很难冲破系统发生涌现效应需要的阈值。
已经发布的医疗大模型大都聚焦于文本数据方面,譬如医联新近发布的MedGPT,便是链接了主诉、复诊、购药等医患文本沟通的环节,尚未将影像数据接入大模型。
从长期看,大模型在医疗领域充分释放价值仍需要影像大数据助力。如今的CV、隐私计算等算法相关技术已经到了应用阶段,反而是算力分配基础设施、影像数据数据量两项要素成了制约模型发展的关键所在。因此,算力分配、影像大数据等基础设施建设及跨医院数据集的构建仍需推进,这需要数据管理方在观念上进行改变,并辅以时间的堆砌,实现医疗领域自有的“融合”。
最后是“应用对象”。医疗大模型的服务方绝大多数为B端、G端,是一个极为严肃的领域,需要精准的判断并给出支撑判断的证据,不能像通用语言模型那样给出一个模棱两可的答案,绘制要素堆砌的图像——这需要医疗大模型在结论精度上进行提升,给出精准的决策及建议。
9个方向,医疗大模型的“涌现”与“融合”
厘清大模型差异的目的是为了确立大模型的发展路径。对于医疗大模型而言,这些差异的存在意味着它不能复刻通用大模型取得的“涌现”与“融合”,而需走出一条独特的道路改进模型、探寻价值。
健康高峰论坛上,中国信通院云大所副所长闵栋便对医疗大模型可能的应用方向进行了完整概括,总计9点,或能为这一新兴行业的发展给予启迪。
◆ 1、辅助诊断、辅助决策
相对于传统CDSS而言,大模型的训练数据来源更为广泛,自我净化能力更为高效,因而能为CDSS带来较大幅度的提升。
辅助诊断方面,医生在诊断中需要调动大量医学知识,记忆大量的患者信息,常会出现疲惫的问题。此类大模型的引入可以帮助医生记录信息,缓解疲劳。同时,大模型还能通过学习电子病历、医学文献等数据同医生进行一些语言互动,提升诊断的准确性及效率。两条作用路径均能提升医生诊断质量、诊断效率。
◆ 2、治疗方案生成
可在急救药学服务、骨科、细菌感染等领域接受患者后迅速生成治疗方案。尤其是在急救场景中,大模型在急救过程中迅速根据患者信息生成治疗方案,可以辅助医生更快做出诊断,为患者谋取更多救治时间。
◆ 3、质控
可对结构化的医疗文书进行自动录入、形式质控、内涵质控。各个医生书写习惯不同,精力有限,大模型可快速的生成规范医疗文书模板,该模板具备质控逻辑清晰、内容表达丰富等特征,能够按照标准准确录入文书,减轻医生在书写、检查等环节的负担。
◆ 4、患者服务
可通过通俗的语言为患者进行导诊、答疑。传统的患者教育需要医生投入大量精力进行编写,并在专业性、易读性方面这个取得平衡,还会常常在后续沟通中为患者释疑。大模型可以针对患者母语背景生成相关的患教资料;与患者对话提供患者需要的信息。
◆ 5、医院管理
可生成医院管理所需的各类表单,为医院管理者提供辅助管理决策支持,统计包含医生基础信息、临床能力、医院后勤、医院财务等各个方面的数据,然后生成匹配医院现状的动态管理计划,对医疗资源进行一个智能高效的配置。以医疗设备管理为例,大模型可以规划各项医疗设备采购、维护计划,生成维修相关表单,有效提高管理效率。
◆ 6、教科研
研究方面,可在选题立项、研究方案设计、结果分析、成果编写方面发挥很大作用。需要注意的是,大模型也会出现伪造参考文献引文、无法甄别科研贡献,无法对于生成内容负责等等问题,有待后续逐一解决。
教育方面,可协助医生编写教案,替代医生解答部分问题。医生在履行教学职能时需耗费大量时间编写教案,回答学生提出的各类高重复度问题,导致有临床、科研任务的医生其精力被重复性劳动占用。大模型的引入可以分担医生压力,如辅导第一年资学生的学习,将医生从医学教学的任务中解放出来,帮助其专注临床科研工作。
◆ 7、中医
中医常面临其医疗知识难以显性化、结构化的问题,导致知识传承相对困难。引入大模型可对中医相关知识进行数据挖掘,推动相关知识体系的构建,以标准化的形式为患者生成诊疗方案。
◆ 8、药物研发、销售
研发方面,大模型可在药物发现、临床前研究等环节中的提高靶点发现效率,构建复杂分子;亦可在临床实验环节对临床试验的设计思路、统计方法的推荐等等方面提供支撑,极大提升药物研发效率。
销售方面,可在药物市场推广时以自动化、智能化的方式连接目标用户,降低营销成本,提升营销效率。
◆ 9、公共卫生
用于辅助流行病学的大数据分析及趋势判断。由于传播方式和传播路径具备复杂性、偶然性,疾病发展的不确信性和变化性非常大,超出常规算法的能力范畴。相比之下,大模型可以对流行病学的大数据分析和这个预测进行有效支撑,给出较为精确的判断。目前国内外拥有大量研究机构和医院进行相关探索,并已取得了不错的研究结果。
标准与伦理,制约大模型?保护大模型?
我们无法判断上述的9个方向哪一个会最先跑出优质的医疗大模型成果,但可以确定的是,要实现大模型的蓬勃发展,必须创造一个包容企业、医院、高校、研究机构等角色发力的舞台。这需要需监管机构出台法案,行业专家出台标准共识,为大模型尽早创造公平的竞争环境,引导科技朝着向善的方向发展。
健康高峰论坛上,中国信息通信研究院、国家卫生健康委医疗管理服务指导中心、中国信通院上海工创中心、讯飞医疗科技股份有限公司、北京协和医院、复旦大学智能医学研究院、华中科技大学同济医学院、中国科学技术大学附属第一医院、国家骨科与运动康复临床医学研究中心、心血管健康联盟共同参与了 医疗健康行业大模型标准研究启动仪式,踏出了推动医疗大模型规范发展的第一步。
未来,以中国信通院为首的机构们将加速开展前沿研究;研制符合医疗健康行业应用特色的AI大模型三层技术标准框架(基础设施层、模型层、应用层);从数据处理、算法模型、服务管理等三个层面,依托实验室开展医疗AI大模型合规性、安全性、可控性、可靠性评估,促进行业在发展中规范,在规范中发展。
标准研究之外,生成式AI的伦理问题也是今年世界人工智能大会讨论的核心。《生成式AI伦理与治理倡议书》、《人工智能医学影像伦理手册》相继发布,一方面要解决当代AI遗留的可信问题、隐私问题、医疗问题;另一方面要为生成式AI做好准备,防止新兴技术身处滥用的境地。
对于世界人工智能大会的各类标准制定,现场中专家们的声音并不统一。有专家认为:医疗行业需谨慎对待新技术的发展,借助层层标准解构技术,在保证可信的前提下实现技术落地,既是对患者的保护,也是对AI技术本身的保护。
也有专家认为:技术和监管不会协同发展,总是螺旋上升。因此,面对新兴技术, 应尽力探寻监管行为最为合适的“度”,避免过轻监管导致技术的应用偏离的向善的方向,也避免过度监管抑制了技术的应用与创新。
理性看待医疗大模型
尽管世界人工智能大会的每一个论坛都被大模型、生成式AI所包围,但仍有一部分企业坚持着自己的思路,按部就班的发展自己的AI应用。
譬如GE医疗便在论坛之上发布了无关于大模型的《2023创想健康新未来报告》,并将爱迪生数字医疗生态全新升级到了2.0;数坤科技董事长毛新生谈的是中国AI的创新,要在心血管疾病、肺部疾病等领域做出原创的符合中国人特征的AI产品;91360则专注于数字病理的创新,仍在努力解决乳腺癌等常见癌种的筛查问题。
毕竟,当下医疗大模型“涌现”与“融合”的产物没有跳出深度学习一代AI的应用范畴,也尚未展示新的商业路径,解决各类AI长期面临的高成本低收益问题。它还需要时间积累,既要完成技术的自我涌现,又要深入临床,与医疗进行深度融合。
在抵达那个关键阈值之前,当代医疗AI不能遗弃。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App