地平线创始人&CEO 余凯
2022年11月,OpenAI宣布了最新的大语言预训练模型——ChatGPT,由此打开了大模型的研发竞速。自动驾驶作为AI落地的重要场景之一,是否会在这波浪潮中有更进一步的发展,也引起了不少人的探讨:为什么ChatGPT在“狂飙”,但是自动驾驶却迟迟不来?
4月1日,在中国电动汽车百人会高层论坛上,地平线创始人&CEO余凯对此发表了自己的看法。在他看来,关键在于ChatGPT和自动驾驶面临的挑战截然不同。
首先,ChatGPT未来可能会代替或辅助一些白领的工作,但这个工作本身的容错率比较高,比如代写发言稿,即使不完美,但人们还可以在他写出来的基础上进行修改。但自动驾驶不一样,特别是无人驾驶,人命关天,容错率只能是零。
其次,在计算方面,ChatGPT是在云端计算,云端能实现充足的电源供给,同时有非常好的水冷系统。但车端依赖的是电磁,散热的挑战非常大,这也就意味着自动驾驶并不能使用那么大的模型,那么大的计算。
种种挑战之下,或许自动驾驶尤其是无人驾驶还无法出现类似ChatGPT般惊人的进展。余凯甚至悲观地认为,十年以后连L3都不会真正地实现。
从整个自动驾驶行业来看,尤其是L4级自动驾驶,的确也在弥漫着一股悲观萧条的氛围。无论是Google、Waymo,还是cruise的商业化推迟、裁员,还是福特和大众投资的Argo关闭,行业都在回归冷静,回归商业本质跟用户价值。
什么是用户价值?余凯引用了一份调查数据:87% 的用户真正需要的是驾驶过程中那种轻松感,希望能消除紧张与疲劳。也就是说,用户当前并不需要真正地实现无人驾驶。
“实实在在从高级辅助驾驶开始,就已经是在为用户创造价值。”余凯继续说道。
不过,同样是辅助驾驶,但国内外的需求也大不相同。在日本和欧洲,辅助驾驶主要是L1和L2,也就是是以安全法规驱动的,包括 AEB 、ACC、车道保持、紧急自动刹车这样的安全功能。“但在中国完全不一样,安全是及格线,更多是用户体验驱动、用户价值驱动。”
因此,余凯认为,对于自动驾驶不要太过焦虑。到2025年,真正要做的是在合理的性价比下,把高速NOA、环线NOA 这种封闭道路的自动驾驶体验做到如丝般的顺滑,而且价格不能太贵。同时要有相当的投入,真正地把更复杂的城区的NOA 做到可用。
虽然业内普遍认为,2022年是 L2 +(高速 NOA)量产元年,但在余凯看来,技术研发上至少三年才会有一个比较好的进步。
尤其是在算法上,余凯表示,“要不断地在给定算力上去优化我们的软件算法,去用更多的数据,不断地去逼近用户体验的上限。”
基于ChatGPT的启发,余凯介绍说,会继续地用更大的数据,更大的模型,并且无监督地去学习人类驾驶的常识。“比如给定当前的交通环境,给定一个导航地图,给定一个驾驶员的整个驾驶行为的历史,怎么预测他的下一个驾驶动作?实际上可以从大量的无监督的、不需要标注的行为里面去获得学习。构建这样的一个自回归的驾驶的大语言模型,是我们下一步要做的事情。”
当汽车领域不断地向自动驾驶领域逼近的时候,不少车企开始发力自动驾驶芯片。除了广汽出资奕行智能外,大众集团、长城汽车也都通过各自的方式发力自动驾驶芯片领域。
对此,余凯表示,打造自己的自动驾驶芯片这件事情,每一个车厂要慎重考虑。第一是巨量的资金跟成本研发的投入;第二是如何持续地去保持竞争力。
“自研”跟“他山之石”是一个战略选择,余凯给车厂的建议是“如果你的销量预期不到 100 万辆的话,这个资金的效率是不高的。”
对于自动驾驶未来的发展,余凯还发表了一些“反共识”的看法。
他认为,十年以后连L3级自动驾驶都不会真正地实现。但是在专用道路上面,在车云协同的自动驾驶专用道路上面是可以实现无人驾驶的。不过有个前提,就是在这个环境里面不许有人驾驶,一定是要全部的车在专用道路上进行自动驾驶。
同时,他还认为,随着这个人工智能的发展,会形成一个机器的霸权。人类表面上觉得很满足现在算法的发展,但实际上是更多地放弃了自己的思考。“机器是一个黑盒,它到底是怎么发展的?对我们来讲是失控的。”
在他看来,一定要去推动分布式的、本地化的、保护用户隐私的,并且计算对于人类来讲是透明的的人工智能计算。比如,未来的车载实际上会成为分布式的储能中心,上亿辆车装了上千T的算力的芯片,在停车的时候如何实现它相应的功能,这是全世界最大的计算资源池。
“未来,一定会是除了车载计算以外的其他的计算去提供无限可能。我觉得计算革命才刚刚开始。”余凯最后说。
(本文首发钛媒体App, 作者|韩敬娴,编辑|张敏)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App