全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

335次阅读
没有评论

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

打破智力、成本、速度不可能三角

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

开源模型王座再次易主,依旧是国产模型!

不过之前霸榜的DeepSeek和Qwen来自杭州,现在变成上海的Minimax了。

在第三方评测机构Artificial Analysis的测试中,Minimax M2以61分获得了开源模型第一,紧随Claude 4.5 Sonnet。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

官方介绍,Minimax M2专为智能体和编程而生,编程能力和Agent表现出众。

而且经济高效,推理速度是Claude 3.5 Sonnet的两倍,API价格却只有8%。

Minimax表示,智能水平、速度和成本在过去被视为“不可能三角”,但随着M2的出世,这个三角被打破了。

目前,M2的完整模型权重已经开源,采用MIT协议,在线Agent平台和API也限时免费。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

8%成本实现Claude级水平

Minmax M2是一个稀疏度较高的MoE模型,总参数量230B,激活参数量仅有10B。

网友表示10B的激活参数运行起来会非常快,如果配上Cerebras或者Groq这样的推理加速平台,有望跑到每秒上千Token。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

另一个特色是采用了交错的思维格式,使得模型能够规划和验证跨多个对话的操作步骤,这对于Agent推理至关重要。

如开头介绍,Minimax官方将M2定义为一个专为智能体和编程而生的模型。

它专为端到端开发工作流程而构建,而且表现出对复杂、长链工具调用任务的出色规划和稳定执行能力,支持Shell、浏览器、Python代码解释器和各种MCP工具的调用。

在Agent最关键的三个能力——编程能力、工具使用能力和深度搜索能力上,M2在工具使用和深度搜索方面上都不逊于海外顶尖模型,编程能力也在国内名列前茅。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

综合表现上,M2在Artificial Analysis的测试中,获得了总排名第五、开源第一的成绩。

该测试使用了10个热门数据集,包括MMLU Pro、GPQA Diamond、人类最后测试、LiveCodeBench等。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

而M2的定价是0.3美元/2.1人民币每百万输入Token,1.2美元/8.4人民币每百万输出Token,只要Claude 3.5 Sonnet的8%。

以Artificial Analysis的成绩为基准,Minimax绘制了一张图来比较各大模型性价比(横轴越向右成本越低)。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

在线推理服务的速度则可达每秒100Token,Minimax也画了一张图体现以速度衡量的性价比。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

同时,Minimax团队还针对智能体、全站开发和Terminal Use三项任务对M2和其他模型进行了一对一比拼。

结果M2相比于Claude Sonnet 4.5、GLM 4.6、Kimi-K2以及DeepSeek V3.2均有极高的Win+Tie比例,同时成本非常低廉。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

为了更直观地体现M2的Agent能力,Minimax已经把M2部署到了Agent平台,限时免费使用,按官方说法,免费期直到服务器扛不住为止。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

同时在该平台上,也展示了许多Minimax Agent的现成作品。

Minimax Agent:能写程序,还会做PPT

利用Minimax的Agent平台,可以写出各式各样的网页或在线应用。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

当然像很多经典游戏,也都能用它在Web环境当中复刻并直接部署。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

甚至有网友创作的在线五子棋游戏平台,不仅有游戏本体,还引入了在线对战、观战、在线聊天,甚至是用户注册等功能。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

除了编程,也可以生成各种主题的调研报告或者PPT。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

在X上,也有网友展示了自己用M2 Agent编程的实战成果,仅通过三轮反馈就完成了一个足球小游戏的制作。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

可以说效果非常不错。

模型表现之外,M2使用的注意力机制,也引发了网友们的讨论。

混合注意力vs全注意力

有网友从vllm的代码当中看出了M2的更多技术细节,表示M2采用类似GPT-OSS的全注意力和滑动窗口注意力(SWA)的混合机制,

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

不过Minimax NLP负责人指正,表示一开始确实想在预训练阶段引入SWA,但发现会造成性能损失,所以最后使用的是全注意力。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

Falcon团队的技术人员看了之后表示,他们在训练模型的时候也发现了同样的现象,SWA混合注意力会降低模型性能,这和一些论文的研究不符。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

在部分论文和实践中,SWA在提升效率的同时可以保持性能,如Mistral和谷歌Gemma模型的相关研究均支持此观点。

但Minimax的实际测试显示其在长程依赖任务上存在局限。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

同时,M2也没有采用Lightning Attention(线性注意力的一种变体),原因也是因为性能损失。

全球开源大模型杭州霸榜被终结,上海Minimax M2发布即爆单,百万Tokens仅需8元人民币

同样与之相反,有论文主张线性注意力在长序列任务中更具优势。

到底哪种路线更优,可能还是要看具体需求,但至少从M2的表现上看,Minimax选择的的确是一种适合自己的方式。

Agent平台:https://agent.minimax.io
Hugging Face:https://huggingface.co/MiniMaxAI/MiniMax-M2
参考链接:
[1]https://www.minimax.io/news/minimax-m2
[2]https://venturebeat.com/ai/minimax-m2-is-the-new-king-of-open-source-llms-especially-for-agentic-tool
[3]https://x.com/jessi_cata/status/1982936050256490968
[4]https://x.com/JingweiZuo/status/1982822979030692356

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 10 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔 鹭羽 2025-12-24 09:1...
AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI C++oding新王登场!MiniMax M2.1拿下多语言编程SOTA 克雷西 2025-12-24 ...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
樱智α·医疗可信平台全新发布,北电数智与中日友好医院联合打造

樱智α·医疗可信平台全新发布,北电数智与中日友好医院联合打造

樱智α·医疗可信平台全新发布,北电数智与中日友好医院联合打造 十三 2026-01-04 14:02:42 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛 闻乐 2026-01-06 09:09:0...
悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 闻乐 2026-01-05 19:...