6小时告破30年数学难题,亚里士多德一夜成名

196次阅读
没有评论

6小时告破30年数学难题,亚里士多德一夜成名

“Vibe证明时代已经到来”

30年悬而未决的数学难题就这样被AI证明了?!

此时此刻,(前推特)正在刮起一股讨论之风——

来自Harmonic的数学AI模型独立证明了Erdős问题#124,而这个问题已经被数学家无奈搁置了近30年。

6小时告破30年数学难题,亚里士多德一夜成名

微软前AI副总裁、目前在OpenAI研究AGI的Sebastien Bubeck激动分享了这一消息,并表示:

该解决方案100%由AI生成,总计耗时6小时。

6小时告破30年数学难题,亚里士多德一夜成名

甚至连陶哲轩这样的顶尖数学家也跑来围观讨论,他在对比了Gemini和ChatGPT的深度研究工具后发现,Harmonic模型对该问题的证明表现更佳。

6小时告破30年数学难题,亚里士多德一夜成名

所以这到底是一个怎样的问题?Harmonic模型又是如何“大显神功”?

咱接着瞧——

AI证明了Erdős问题#124简易版

首先需要提醒,在听完各路大神讨论后,我们才意识到——

原来Harmonic模型所证明的并非原版Erdős问题#124,而是一个简易版本

Erdős问题#124需要提供的证明如下:

6小时告破30年数学难题,亚里士多德一夜成名

通俗理解即为:

假设你有k个不同的“进制生成器”,分别对应数字d1, d2, …, dk。

游戏规则为:1)你可以从每个生成器产生的数字列表中,至多挑选一个;2)然后把你挑出来的所有这些数字加起来;3)最后看能不能正好凑出你的目标数。

这个问题的核心就是——

只要你的这套“进制生成器”满足一个特定的条件,即1/(d1-1) +1/(d2-1)+…+1/(dk-1)≥ 1,那么是不是所有的、足够大的整数,都能用这种规则凑出来?

截至目前,这个问题取得的进展可以概括为:

6小时告破30年数学难题,亚里士多德一夜成名

就是说,这个问题在几十年里逐渐演变为难易两个版本。

在原版[BEGL96]中,挑战者不允许使用数字1且需要额外满足gcd条件(各个进制之间没有“重复周期”),最终仅发现,对于特定集合 {3, 4, 7}猜想成立。

而当条件放宽之后(允许使用数字1且不需要额外满足gcd条件),Harmonic模型成功证明只要满足上述特定条件,就一定能凑出所有大整数,而且相关证明已经得到Lean形式化验证。

Harmonic模型的证明方案如下,大佬们纷纷表示,这个方案出乎意料的简单。

6小时告破30年数学难题,亚里士多德一夜成名

不过,此次用Harmonic模型证明#124简易版的Boris Alexeev也补充道:

在“形式化猜想”项目中,原本有这个猜想的正式数学表述。但里面有个笔误:注释里写的是≥1,而对应的Lean程序代码里写的却是=1。这个错误让原表述的条件变弱了,即只覆盖了等于1的情况,而漏掉了大于1的情况。

因此,我修正了这个错误,并删除了原表述中我认为不必要的部分。最终,AI成功证明了这个更简洁、更准确的版本。

6小时告破30年数学难题,亚里士多德一夜成名

总结起来就是,Harmonic证明了问题#124的简易版本,而困难版本仍悬而未决。

“Vibe证明时代已经到来”

尽管如此,大佬们还是对AI模型证明数学难题的潜力纷纷给予了肯定。

而参考编程领域的Vibe Coding概念(最早由AI大神卡帕西提出),Harmonic联创兼CEO激动表示:

我们正处于数学领域深刻变革的边缘,Vibe证明时代已经到来。

6小时告破30年数学难题,亚里士多德一夜成名

顺着他的发言,我们也去扒了扒Harmonic模型背后的出品方,毕竟在陶哲轩眼中它这次可是战胜了ChatGPT和Gemini。

根据公开资料,其背后公司名为Harmonic,目标也相当明确:

打造世界上最先进的数学推理引擎。

6小时告破30年数学难题,亚里士多德一夜成名

两位联创分别为Tudor Achim和Vlad Tenev。

CEO Tudor Achim,拥有卡内基梅隆大学计算机科学学士学位,同时也在斯坦福大学攻读计算机科学PhD,不过现处于“on leave”状态。

2023年,他和Vlad Tenev共同创办了Harmonic,当时想打造世界上最先进的推理引擎。

更早之前,他还在一家自动驾驶辅助系统开发公司(Helm.ai)担任联创和CTO。

6小时告破30年数学难题,亚里士多德一夜成名

执行主席Vlad Tenev,拥有斯坦福大学数学学士学位和加州大学洛杉矶分校数学硕士学位。

除了在Harmonic担任联创和执行主席,他目前还同时在金融公司Robinhood Markets兼任CEO。

6小时告破30年数学难题,亚里士多德一夜成名

根据官网公开资料,Harmonic在大约一周前完成了1.2亿美元(约合人民币8.5亿)C轮融资。

本轮融资由Ribbit Capital领投,估值达到14.5亿美元(约合人民币103亿)。

Harmonic的旗舰模型就是本次用到的Aristotle模型(也有叫“亚里士多德”的),据悉它是第一个在2025年国际数学奥林匹克竞赛中给出其中五道题形式化验证解决方案的模型。

Aristotle在保证准确性和消除幻觉的同时,达到了金牌级别的表现。

据Vlad Tenev透露,这次用的Aristotle进行了一些更新,具有更强大的推理能力和自然语言界面。

6小时告破30年数学难题,亚里士多德一夜成名

可以预见,随着AI解决复杂数学问题的能力不断突破,越来越多曾被“束之高阁”的百年难题将重见天日,并有望被逐一攻克。

Anyway,AI浪潮之下,开弓已无回头箭。

6小时告破30年数学难题,亚里士多德一夜成名

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

Failed to fetch content Read More 
LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...