Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

270次阅读
没有评论

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

实测来了

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

半成品模型,已经刷下高难度数学推理测试AIME 25满分战绩

开源之王Qwen又在深夜放大招了。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

Qwen3“超大杯”推理版露出庐山真面目,虽然还是“早期预览版”,仍在训练中,但在当前的Checkpoint,已经能在AIME 25和HMMT25(哈佛-MIT数学竞赛)中达到100%的准确率。

什么概念?就是一整个全场看呆的节奏:

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

此前,AIME 25的最好成绩由GPT-5系列把持,GPT-5 Codex(high)的准确率是98.7%,GPT-5(high)是94.3%。而Qwen3 235B的成绩是91%。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

△图源:Artificial Analysis

这不Ilya和奥特曼还在为当年的“真还传”扯头花嘛,有网友感叹:

这个完成度令人难以置信。OpenAI还在搞抓马,而Qwen已经默默耕耘惊艳众人。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

目前,这个Qwen3-Max-Thinking的早期预览版已经可以在Qwen Chat中免费试用,API也已上线阿里云。官方承诺,训练还在继续,后续会持续更新版本。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

实测Qwen3-Max-Thinking

技术细节方面,Qwen官方尚未透露更多信息,但如果你感兴趣,现在就可以实测见真章。

我们已经测试了一波,以供参考。

先上经典题:小球碰撞测试。

编写一个Python程序,让一个小球在旋转的六边形内弹跳,小球运动遵循物理规律

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

Qwen3-Max-Thinking一次成功,效果很不错。

既然是AIME 25满分选手,那么接下来,我们直接上IMO竞赛题。

求所有实数α,对于任一正整数n,整数 ⌊α⌋ + ⌊2α⌋ + … + ⌊nα⌋ 一定是n的倍数。(注:⌊z⌋表示小于或等于z的最大整数。例如:⌊-π⌋ = -4,⌊2⌋ = ⌊2.9⌋ = 2。)

面对这道有数论意味的代数题,模型思考了5分钟左右,给出答案:

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

回答正确。

完整答案如下:

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

前端方面,我们用简单的提示词,要求Qwen3-Max-Thinking用Three.js构建3D太阳系。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

一开始,模型偷了个懒,只绘制了4颗行星,并且虽然设置了控制行星运动速度的按键,但实际并没有自转和公转的效果。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

经过人工提醒之后,Qwen3-Max-Thinking补全了八大行星,优化了前端效果,不过公转的问题还是没有解决。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

需要说明的是,Thinking模式下,Qwen3-Max的思考时间还挺久的……如果一时间想不明白,还会出现中英文各想一遍的情况(doge)。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

初步体验下来,Qwen3-Max-Thinking有很多值得深挖的地方,不过也正如Qwen技术负责人林俊旸所说,“要做到面面俱到确实有点难”。

我们还需要更多时间。工作尚未完成。

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

而对于网友们来说,更重要的是——

“啥时候开源?”

Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……

体验地址:
https://chat.qwen.ai/
API地址:
https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 11 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...