量子位 让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法 让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法 衡宇 2025-01-10…