MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

861次阅读
没有评论

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

现在就能免费玩

西风 发自 凹非寺

量子位 | 公众号 QbitAI

开源模型上下文窗口卷到超长,达400万token

刚刚,“大模型六小强”之一MiniMax开源最新模型——

MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

MiniMax-01首次大规模扩展了新型Lightning Attention架构,替代了传统Transformer架构,使模型能够高效处理4M token上下文。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

在基准测试中,MiniMax-01性能与顶级闭源模型表现相当。

MiniMax-Text-01性能与前段时间大火的DeepSeek-V3、GPT-4o等打的有来有回:

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

如下图(c)所示,当上下文超过20万token,MiniMax-Text-01的优势逐渐明显。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

在预填充延迟方面也有显著优势,在处理超长上下文时更高效,延迟更低:

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

网友直呼“难以置信”:

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开放权重,拥有400万token的上下文窗口!我原本以为这可能要五年后才会实现。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

官方表示,MiniMax-01是为支持之后Agent相关应用而预备的:

因为Agent越来越需要扩展的上下文处理能力和持续的内存。

目前官方还公开了MiniMax-01的68页技术论文,并且已将MiniMax-01在Hailuo AI上部署了,可免费试用。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

另外,新模型API价格也被打下来了:

输入每百万token0.2美元,输出每百万token1.1美元。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

下面是模型更多细节。

4M超长上下文

MiniMax-Text-01

MiniMax-Text-01,参数456B,每次推理激活45.9B。

它创新性地采用了混合架构,结合了Lightning Attention、Softmax Attention以及Mixture-of-Experts(MoE)。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

并且通过LASP+、varlen ring attention、ETP等优化的并行策略和高效的计算通信重叠方法,MiniMax-Text-01训练上下文长度达100万token,推理时可以扩展到400万token上下文。

模型架构细节如下:

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

在Core Academic Benchmark上,MiniMax-Text-01在GPQA Diamond上获得54.4分,超越GPT-4o。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

在长基准测试之4M大海捞针测试,MiniMax-Text-01一水儿全绿。

也就是说,这400万上下文里,有细节MiniMax-Text-01是真能100%捕捉到。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

除此之外,还有LongBench v2、Ruler基准测试,考验的是模型长上下文理解能力,包含基于长上下文输入的逻辑推理能力。

MiniMax-Text-01模型在处理Ruler的长上下文推理任务时表现出显著的优势。

在64K输入级别的表现与顶尖模型GPT-4o、Claude-3.5-Sonnet等竞争力相当,变化微小,但从128K开始显现出明显的优势,并超越了所有基准模型。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

LongBench-V2包括不同难度级别的问答任务,涵盖多种上下文类型,包括单文档和多文档、多轮对话、代码仓库和长结构化数据等。团队考虑了两种测试模式:不使用思维链推理(w/o CoT)和使用思维链推理(w/ CoT)。

MiniMax-Text-01在w/ CoT设置中实现了所有评估系统中的最佳结果,在w/o CoT中表现也很显著。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

团队还用MTOB( Machine Translation from One Book)数据集评估了模型从上下文中学习的能力。

该任务要求模型在英语和Kalamang(一种在公开数据中非常有限的语言)之间进行翻译,因此在训练语料库中,LLM仅从一部语法书的部分内容和375个翻译示例中学习该语言。

测试结果显示,MiniMax-Text-01在无上下文场景下eng→kalam (ChrF)得分最低,团队认为其它模型可能是在预训练或后训练数据中集加入了kalam相关数据。在delta half book和full book上,MiniMax-Text-01超过了所有模型。

在kalam→eng(BLEURT)得分上MiniMax-Text-01也与其它模型表现相当。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax-VL-01

MiniMax-VL-01采用多模态大语言模型常用的“ViT-MLP-LLM”框架:

  • 一个具有3.03亿参数的ViT用于视觉编码
  • 一个随机初始化的双层MLP projector用于图像适配
  • 以及作为基础LLM的MiniMax-Text-01

MiniMax-VL-01特别具有动态分辨率功能,可以根据预设网格调整输入图像的大小,分辨率从336×336到2016×2016不等,并保留一个336×336的缩略图。

调整后的图像被分割成大小相同的不重叠块,这些块和缩略图分别编码后组合,形成完整的图像表示。

MiniMax-VL-01的训练数据涵盖标题、描述和指令。ViT从头开始在6.94亿图像-标题对上进行训练。在训练过程的四个阶段,处理了总计5120亿token。

最终,MiniMax-VL-01 在多模态排行榜上表现突出,证明了其在处理复杂多模态任务中的优势和可靠性。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

网友们已开始第一波实测

得知新模型已在Hailuo AI上部署,网友们已紧忙赶往测试。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

有网友使用相同的prompt将它和Gemini、o1对比,感叹MiniMax-01表现令人印象深刻。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

下面这个测试也没能难倒它:

给我5个奇数,这些数的英文拼写中不包含字母“e”。

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

感兴趣的童鞋可以玩起来了。

技术论文:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

参考链接:
[1]https://x.com/MiniMax__AI/status/1879226391352549451
[2]https://huggingface.co/MiniMaxAI/MiniMax-Text-01
[3]https://huggingface.co/MiniMaxAI/MiniMax-VL-01

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 1 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...