Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

399次阅读
没有评论

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

仅32B大小

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

全球最快的开源大模型来了——速度达到了每秒2000个tokens!

虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think

名字是不是有点熟悉?

没错,它和月之暗面前不久推出的Kimi K2在命名上是有点小撞车,不过阿联酋这个多了个“Think”。

但非常有意思的一点是,在K2 Think的背后,确实有“made in China”的味道。

因为从HuggingFace中的Model tree来看,K2 Think是基于Qwen 2.5-32B打造的:

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

而且“全球最快开源AI模型”之外,MBZUAI官方还称自家的K2 Think是“有史以来最先进的开源 AI 推理系统”

那么它的实力到底几何?我们继续往下看。

实测速度均超过2000 tokens/秒

目前,K2 Think已经给出了可以体验的地址(见文末)。

我们先小试牛刀测试一把IMO的试题:

Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

可以肉眼看到,在没有任何加速的情况下,K2 Think在思考过后输出答案的速度,真的就是“啪的一下”。

从底部给出的速度来看,已经达到了2730.4 tokens/秒

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

接下来,我们用中文来测试一个经典问题:

Strawberry这个单词里面有几个字母R?

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

速度依旧保持在了2224.7 tokens/秒,并且给出了正确答案:3个R。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

我们再来实测几道AIME 2025的数学题:

Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-100$ and $100$, inclusive, such that $12x^{2}-xy-6y^{2}=0$.

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

可以看到,K2 Think最大特点就是所有问题均能保持在超过2000 tokens/秒的速度,并且就目前实测结果来看,生成的答案均是正确。

但从功能角度来看,目前K2 Think还不支持文档传输,以及多模态等能力。

不过MBZUAI的高级研究员Taylor W. Killian在X上也给出了解释:

这个模型主要为数学推理而开发。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

技术报告也已发布

从体量上来看,K2 Think仅有32B,但官方却表示,它已经可以与OpenAI和DeepSeek旗舰推理模型的性能相当。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

从测试结果来看,K2 Think在多项数学基准测试中,拿下了较为理想的分数,例如AIME’24 90.83分、AIME’25 81.24分、HMMT25 73.75分,以及Omni-MATH-HARD上取得60.73分的成绩。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

并且K2 Think团队已经发布技术报告

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

从整体来看,K2 Think团队主要从六个方面做到了技术创新:

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
  1. 长链路思维的监督微调(SFT):通过精心设计的链式推理数据,训练模型逐步思考,而不是直接给答案,使其在复杂问题上更有条理。
  2. 可验证奖励的强化学习(RLVR):模型不是依赖人类偏好打分,而是直接以答案对错为奖励信号,显著提升数学、逻辑等领域的表现。
  3. 推理前的智能规划(Plan-Before-You-Think):先让一个规划代理提炼问题要点,制定解题大纲,再交给模型展开详细推理,就像人类先列提纲再解题一样。
  4. 推理时扩展(Best-of-N采样):对同一问题生成多个答案,再挑选最佳结果,从而提高正确率。
  5. 推测解码(Speculative Decoding):在推理时并行生成和验证答案,减少冗余计算,加速输出。
  6. 硬件加速(Cerebras WSE晶圆级引擎):依托全球最大的单芯片计算平台,实现单请求每秒超2000 tokens的生成速度,使长链路推理也能保持流畅的交互体验。

与此同时,研究团队还对K2 Think进行了系统的安全测试,包括拒绝有害请求、多轮对话鲁棒性、防止信息泄露和越狱攻击等,整体达到了较高水平。

Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!

那么你也想尝鲜一下目前世界最快开源AI模型的速度吗?链接放下面喽,感兴趣的小伙伴快去体验吧~

体验地址:
https://www.k2think.ai/

技术报告:
https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf

参考链接:
[1]https://www.k2think.ai/k2think
[2]https://x.com/mbzuai/status/1965386234559086943
[3]https://huggingface.co/LLM360/K2-Think
[4]https://venturebeat.com/ai/k2-think-arrives-from-uae-as-worlds-fastest-open-source-ai-model
[5]https://www.youtube.com/watch?v=8C6_B1QeyBo

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 9 月
1234567
891011121314
15161718192021
22232425262728
2930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔 鹭羽 2025-12-24 09:1...
AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA

AI C++oding新王登场!MiniMax M2.1拿下多语言编程SOTA 克雷西 2025-12-24 ...
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify

智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify

智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify 鹭羽 2025-12-23 1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
易烊千玺的华为绿手机,真的AI了

易烊千玺的华为绿手机,真的AI了

Failed to fetch content Read More 
AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背

AI狼人杀大决战!GPT、Qwen、DeepSeek大乱斗,人类高玩汗流浃背 鹭羽 2025-12-23 14...
长城首个VLA车型发布,魏建军回应「赌上姓氏造车」

长城首个VLA车型发布,魏建军回应「赌上姓氏造车」

长城首个VLA车型发布,魏建军回应「赌上姓氏造车」 贾浩楠 2025-12-23 13:57:25 来源:量子...