全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

量子位的朋友们
2025-01-24
12:48:23

来源：量子位

同时具备语言、视觉和搜索三大领域推理能力

1月24日，百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中，Baichuan-M1-preview的表现均超越了o1-preview，展现了其在多领域推理方面的独特优势。

此外，作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型，它还解锁了医疗循证模式，实现了从医疗证据检索到深度推理的完整端到端服务，能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-preview现已在百小应中正式上线，在深度思考模式下不仅能准确解答数学、代码、逻辑推理等问题，面对复杂医疗问题，还能像资深医疗专家一样，通过深度思考构建严谨的医学推理过程，为用户提供全面的疾病分析和个性化健康管理建议。

为了更好地繁荣AI医疗生态，助力医疗事业发展，百川智能还同时推出了行业首个开源医疗增强大模型Baichuan-M1-14B，其医疗能力超越了更大参数量的Qwen2.5-72B，与o1-mini相差无几。

Github: https://github.com/baichuan-inc/Baichuan-M1-14B

Huggingface(base): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base

Huggingface(Instruct): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct

Baichuan-M1-preview多项能力超越o1-preview，解锁医疗循证模式

作为一个全场景深度思考模型，Baichuan-M1-preview的能力全面，具备强大的语言推理、视觉推理及搜索推理能力。语言推理方面，其在AIME和Math等数学基准测试，以及LiveCodeBench代码任务上的成绩均超越了o1-preview等模型。

视觉推理方面，在MMMU-val、MathVista等权威评测中的成绩，超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。

Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。在面对复杂医学问题时，会将专业可靠的医疗知识作为推理依据，帮助用户做出最佳的医疗决策。

为实现这一能力，百川智能自建了涵盖亿级条目的循证医学知识库，囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容，且以天为单位进行动态更新，及时收录医疗领域的新突破、新进展。

众所周知，医学知识多样性强、因果关系复杂。因此，即使构建了庞大的医疗知识库，在调用其中的医学知识，尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。

针对这一问题，医疗循证模式能运用医学知识和证据评估标准，对证据进行多层分级，并对不同权威等级的证据进行专业分析与整合，精准识别各类权威信息的来源和可信度，从而避免因信息混杂导致的误判，然后基于这些医学证据进行可靠、准确的医学推理，最终提供可信赖的医疗答案。

通过“医疗循证模式”，Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务，能够有效地解决医疗场景中信息过载、不确定性和碎片化等痛点。无论是医生面对复杂病案，还是患者寻求权威建议，它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。不仅能在临床场景中帮助医生提升诊疗效率，在医学科研场景中大幅缩短科研探索时间，还能帮助普通用户更好地理解自身健康状况，帮助患者科学管理生活方式，提升治疗效果。

行业首个开源医疗增强通用大模型，Baichuan-M1-14B医疗能力超越Qwen2.5-72B

为了推动AI技术在医疗领域的创新发展，增强AI医疗技术的透明度和可信性，提高医疗服务的可及性，繁荣AI医疗生态，百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

作为行业首个开源医疗增强通用大模型Baichuan-M1-14B的表现非常优异，不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct，并且与o1-mini也相差无几。

为了提升Baichuan-M1-14B的医疗能力，百川智能多管齐下：数据构建方面，面向细分医疗场景，收集了万亿级 token 的严肃医疗数据，涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例，亿级的医疗问答、医疗问诊、临床数据等，还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估，确保模型能学习到有价值且全面的医疗知识。

在此基础上，百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据，包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程，进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

进入到模型训练阶段，百川智能运用行业首创的多阶段领域提升方案，将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段，依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法，优化思维链路径，避免传统奖励模型偏差，有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是百川智能在AI医疗领域的又一次重要突破，为其实现“造医生、改路径、促医学”的AI医疗愿景提供了有力支撑。于此同时，Baichuan-M1-14B开源模型则为中国AI医疗健康生态建设提供了强大助力。百川智能不仅希望加速AI技术在医疗领域的广泛应用，更旨在激发更多创新力量，共同推动中国医疗健康生态的持续进步，助力实现更公平、更高效的高质量医疗服务。

*本文系量子位获授权刊载，观点仅为作者所有

2025 年 1 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

Baichuan-M1-preview多项能力超越o1-preview，解锁医疗循证模式

行业首个开源医疗增强通用大模型，Baichuan-M1-14B医疗能力超越Qwen2.5-72B

test

test

文心AIGC

test

test

全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

全场景深度思考模型发布：囊括三大推理能力，解锁医疗循证模式

Baichuan-M1-preview多项能力超越o1-preview，解锁医疗循证模式

行业首个开源医疗增强通用大模型 ，Baichuan-M1-14B医疗能力超越Qwen2.5-72B

test

test

文心AIGC

test

test

行业首个开源医疗增强通用大模型，Baichuan-M1-14B医疗能力超越Qwen2.5-72B