李飞飞一年前究竟说了啥?怎么又火了

408次阅读
没有评论

李飞飞一年前究竟说了啥?怎么又火了

大模型的局限在……

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

大语言模型的局限在哪里?

AI教母李飞飞这样说:

大自然中是没有语言存在的,你不会从天空中直接看到文字。

语言是一种纯粹的生成的信号。

李飞飞一年前究竟说了啥?怎么又火了

语言信号的输出主要基于人类给的输入信号,可以说,语言是不独立于人之外的。

然而,物理世界是客观存在的。所以提取、理解、生成3D世界的数据、实现空间智能和处理语言问题时截然不同。

李飞飞一年前究竟说了啥?怎么又火了

没想到,李飞飞一年前的访谈被扒出来,又引发大量围观。

她这段话意味着,大语言模型或许还不是真正的智能。

真正的智能将是信号感知、物理以及和现实世界相结合的产物。

李飞飞一年前究竟说了啥?怎么又火了

下面来看看大家还在热议些啥吧。

空间智能可以借鉴语言模型,但仍存在本质差异

这场讨论的焦点在于,现在基于语言信号训练的模型到底懂不懂物理世界的常识

首先,回顾一下李飞飞的说法。

她认为语言模型及当今的多模态语言模型的底层表示是一维的。它们在根本上就是操作于离散token的一维序列上,所以模型对于书面文本这种一维序列的表示是非常自然的。

李飞飞一年前究竟说了啥?怎么又火了

然而,在处理空间智能问题时,核心是世界的三维本质。

虽然多模态大语言模型也能看图像,但它是将其他模态硬塞进这种一维token序列的底层表示中,这种一维且由人类生成的数据,可能无法很好地表示物理世界,造成信息损失。

如果直接让模型处理3D数据,那么表示类型与模型旨在执行的任务类型之间将会有更好的匹配。

李飞飞一年前究竟说了啥?怎么又火了

而空间智能的挑战就是在于从这个真实世界中提取、表示和生成信息。

除了这个维度上的差异,从更哲学的角度来说,她认为语言是一种纯粹由生成产生的信号。自然界中并不存在预设的语言形式,也就是说语言不能独立于人类之外。

大模型能够通过学习并反刍所输入的数据,无论输入什么样的数据,模型都能用足够的泛化能力处理语言任务。这是因为语言,或者说文本的本质允许模型在生成范式下表现得出色。

李飞飞一年前究竟说了啥?怎么又火了

与语言不同,3D世界是真实存在于外部的。这个世界遵循着物理定律,并因材料等多种因素而具有其自身的结构。

因此,要让模型倒推出3D世界的信息,并能够表示和生成它,在技术层面上,空间智能可以借鉴语言模型,但从哲学的范畴来看,这两者仍存在本质差异。

李飞飞一年前究竟说了啥?怎么又火了

有人举了一堆例子来证明李飞飞的观点,同时说明语言模型在理解物理世界时确实有局限。

基于语言信号训练的模型在物理世界任务中表现差

比如用一个小实验来测试Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三个多模态大模型的物理常识,并与人类儿童表现做对比。

李飞飞一年前究竟说了啥?怎么又火了

研究用Animal-AI这个用来测试动物和人工智能体物理认知的3D环境来测试大模型,让大模型通过前进/后退、左转/右转、环境描述与规划控制三个指令控制一个小角色在虚拟环境中完成任务。

李飞飞一年前究竟说了啥?怎么又火了

第一个实验是让大模型完成一些简单的任务,如直接找到小球,还有一些稍难的任务,如躲开障碍物找到小球。

结果发现模型只能搞定最简单的任务,稍难一点就不行了。

第二个实验是在第一个实验的基础上增加教学案例,比如演示正确做法,结果模型表现也没有明显的提升。

对比之后再看,这些大模型的表现远不及人类儿童,也比不上专门为这个环境测试的机器人

李飞飞一年前究竟说了啥?怎么又火了

还有其他研究团队设计了一个名为ABench-Physics的工具,专门用来测试大语言模型在物理推理方面的能力,核心就是想搞清楚这些模型到底能不能真的理解物理、解决物理问题。

李飞飞一年前究竟说了啥?怎么又火了

测试分两部分,Phy A由400道竞赛级别的物理难题组成,先给大模型来个基础测试。

Phy B属于动态部分:修改Phy A中题目的数字,但不改变物理原理,用来测试大模型能不能进行灵活的物理推理。

结果显示,最厉害的模型在Phy A上的正确率只有43%,而在Phy B中模型的平均准确率下降了22.5%。

这说明模型并不是真懂物理。

李飞飞一年前究竟说了啥?怎么又火了

还有团队用视觉任务测试大模型,比如让模型判断照片中哪些物体更近,或者匹配相同的事物。

人类对这些任务的正确率能达到95.7%,而几个模型最高的正确率仅有51%。在视觉感知上,大模型还远不及人类。

李飞飞一年前究竟说了啥?怎么又火了

这些结果都进一步证明了李飞飞之前访谈中关于大模型理解真实物理世界局限性的观点。

也得到了网友们的认同。

李飞飞一年前究竟说了啥?怎么又火了

模型的开发确实正在扩展到将模型建立在物理与多模态理解的基础上。

李飞飞一年前究竟说了啥?怎么又火了

讨论升级

当然了,有正方就有反方。

有人先是反驳了关于语言的论述。

李飞飞一年前究竟说了啥?怎么又火了

也有人认为,在某些情况下,语言描述现实的能力可能会比感知更优。

李飞飞一年前究竟说了啥?怎么又火了

还有人说模型的语言不用局限于人类的语言、文本等,人工智能或许能创造出自己的语言来理解物理世界。

李飞飞一年前究竟说了啥?怎么又火了

或者,我们该思考,用语言训练大模型取得现有成就的根本因素又是什么呢?

李飞飞一年前究竟说了啥?怎么又火了

对于这场讨论,你又有什么样的看法呢?

参考链接:
[1]https://x.com/rohanpaul_ai/status/1965242567085490547
[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 9 月
1234567
891011121314
15161718192021
22232425262728
2930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...