OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

376次阅读
没有评论

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

事后证明只是检索能力比较强

时令 发自 凹非寺

量子位 | 公众号 QbitAI

太尴尬了。

就在周末,GPT-5又双叒带来了数学方面的新突破,一道难题被宣称解决…

然鹅……很快就被发现是OpenAI的“营销过度”,小题大作,根本算不上什么突破。

友商大咖们也都不装了。

DeepMind CEO哈萨比斯贴脸热嘲得很直接:太尴尬了吧。

目前仍然供职于Meta的LeCun,吐起别人槽点时天赋全开——

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

目前:OpenAI方面已经把“大新闻”删除了。

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

GPT-5又搞出数学“大突破”

这一切的一切,还得从OpenAI研究员Mark Sellke在X上的一条推文说起。

Mark高调宣布GPT-5在数学上取得了重大突破。他们借助GPT-5成功找到了10个著名的厄尔多斯数学难题(Erdős problems)的解法,还兴奋表示到:

经过数千次GPT-5的查询,我们发现了10个原本还处于“未解状态”的厄尔多斯难题的解答,分别是223、339、494、515、621、822、883(第二部分)、903、1043、1079。

此外,还有11个难题取得了重要的部分进展,并更新到了官网上。甚至在第827题上,我们还发现厄尔多斯本人原始论文里存在错误,这个错误由Martínez和Roldán-Pensado两位学者后来进行了修正。看来,未来的科学研究真的要变得有趣了!

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

甚至连OpenAI高管Kevin Weil也在X上惊呼:

GPT-5 找到了10个此前未解决的Erdős问题的解答,并在另外11个问题上取得进展。

随后,OpenAI另一名知名研究员Sebastien Bubeck也兴奋地转发并补充道:

AI驱动的科学加速时代正式开启了!两位研究员仅靠一个周末、借助GPT-5成功解开10个厄尔多斯难题。

消息一出,全网震动,一时间不少人误以为GPT-5独立破解了这些困扰数学界数十年的难题。

但事情真这么简单吗?

哈萨比斯Lecun贴脸热嘲

这场欢呼很快被谷歌DeepMind CEO哈萨比斯狠狠泼了一盆冷水。哈萨比斯直接在Bubeck推文底下回复道:

这真是尴尬啊!

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

咦?不是重大数学突破吗?咋还尴尬上了呢?

这时,哈萨比斯冷静地引导大家去查看Thomas Bloom发布的一则关键说明。

这里值得一提的是,Thomas正是OpenAI引用的那个erdosProblems.com网站的创始人兼维护人。

Thomas澄清到:

作为erdosproblems .com网站的拥有者和维护者,我得声明:OpenAI的说法明显夸大了事实。GPT-5只是通过网络搜索,找到了早已存在的论文,这些论文中早就解答了这些问题,只是我个人不知道而已。网站上的“未解”状态只是说明我尚未发现相关的论文,而不代表全世界数学界没有解决方案。

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

简单来说,就是GPT-5实际上并没有独立地破解任何厄尔多斯难题。它所做的仅仅是比人类网站管理员更迅速地在互联网上检索到了已知的答案,而这些答案其实早已存在。

事后,Bubeck删除了之前的推文:

我删除了之前的推文,我显然不是有意误导任何人,我原本以为自己的表达很清楚,对此感到抱歉。我们仅仅是发现了已经发表在文献中的解法,仅此而已。我认为这依然是一种巨大的进步,因为我知道检索文献有多么困难。

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

LeCun也在下面回复:

这次他们被自己吹嘘GPT的言论坑惨了.

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

(梗注:原文为“Hoisted by their own GPTards”,源自英文俗语 “hoisted by their own petard”,意指“搬起石头砸自己的脚”,这里被LeCun改为GPTards,以讽刺那些盲目吹捧GPT的人。)

但话说回来,这次的乌龙事件也不是平白无故就发生的……

毕竟在解数学题方面,GPT-5的过往战绩确实有迹可循。

GPT-5有点数学能力在身上

在国庆期间,陶哲轩就用GPT-5解决数学难题:

序列lcm(1,2,…,n)是否是高度丰数的一个子集?

天才甚至直言不讳地表示:

如果没有AI帮忙,完成同样任务就需要花费数小时(主要是手动编写代码和调试)。

甚至难如量子复杂性理论,它也能在不到半小时内给出关键证明思路。

就在上个月,GPT-5还在数学教授引导下,首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

这一桩桩,一件件,GPT-5的能力确实不容小觑。

而此次乌龙事件的关键原因就在于:宣传的发言模棱两可,让人们误以为GPT-5真的自主解决了非常难的数学题。

更糟糕的是,这种误导性的说法还被自家人进一步夸大宣传,才造成了如此尴尬的局面。

当然,也有其他网友杀人诛心,主要还是GPT-5太拉胯了——越差劲越想证明自己优秀。

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

还有人拿出了卡帕西最新火爆的访谈论断:

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

总而言之,AI带来轰动大进展的节奏似乎正在过去,或者说大众已经开始对AI突破脱敏了,如果不是真正的大突破大进展,总想搞个大新闻,还是容易出偏差的…

参考链接:
[1]https://the-decoder.com/leading-openai-researcher-announced-a-gpt-5-math-breakthrough-that-never-happened/
[2]https://x.com/dotey/status/1979640848041071097?s=46&t=fzKJptGJMpr-yj3MUXd6HA
[3]https://x.com/demishassabis/status/1979417877590774063
https://x.com/ylecun/status/1979595060447416733

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 10 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 量子位的朋友们 2025-12-20 13:06:52 来源:量...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 20:49:32 来源:量子位 谁能带来更...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 22:09:18 来源:量子位 2025年...
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...