智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

23次阅读
没有评论

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

AI大牛印奇带队

贾浩楠 发自 副驾寺

智能车参考 | 公众号 AI4Auto

智能汽车迈进“L3时代”,现在已经有了明确时间表:

2025年内

率先落地L3级智能汽车的,既不是新势力,也不是AI科技大厂,反而很有可能是一家自主TOP3车企。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

这意味着,手握20多万购车预算的用户,可能比百万级车型用户更快拥有L3智能体验。

背后的推动者:全栈汽车智能化技术玩家千里科技,坐落在西南汽车工业重镇重庆。

据他们自己说,这套L3超越了“大模型上车”,全面升维到车载AI Agent

L3要上路了?

今年的WAIC上,千里科技联合阶跃星辰推出了最新的智能座舱Agent OS

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

没错,“L3”级智能汽车,是智能座舱推进至L3时代

这并不是生拉硬拽的牵强类比。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

推出ChatGPT、启发大模型革命的OpenAI,提出了一套大模型五级发展框架

L1是聊天机器人,具有对话能力;
L2是推理者,能像人类一样解决问题;
L3是智能体,可以采取行动
L4是创新者,协助发明创造;
L5是组织者,完成组织工作。

跳出我们熟知的手机、PC端大模型应用,会发现OpenAI的五级发展框架其实对AGI形态、发展路径的描述,涵盖一切与人交互、为人服务的AI模型。

智能座舱当然是其中之一。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

千里科技做的,就是彻底抛弃“车载APP”模式的现有座舱,用AI Agent 重新塑造智能汽车和你交互的体验。

千里科技智舱产品负责人贾秀江举了几个例子,说明AI Agent相对现有智能座舱的突破之处。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

场景一:

你刚刚下班回家想点一份外卖吃,你直接告诉车载AI:

帮我点一份上周吃过的那个湖南菜,辣少一点,大概四五十块钱,我差不多到家的时候送到。

一句话,系统帮你点餐、下单、付款、留言送达时间。

其实现在很多车机都支持安装外卖APP,但要完成点餐,你还是得找个地方把车停好,然后像操作手机一样去点单付款,还要自己估算送达时间。

你也发现滑稽之处了:我本来就有手机可以完成类似操作,为啥非要用车机?

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

而车载的AI Agent,会自动调用一连串能力,包括理解你的意图、回溯以前的交互历史记忆、生成任务决策链条、找到对应APP点单、调用支付软件,然后再根据导航信息计算送达时间……

这就是Agent OS的第一项突破:智能座舱从被动的可见即可说,变成主动的可想即可说

场景二:

你的心上人坐在副驾刷小红书,看到心仪种草好物或者旅行日志分享,直接把手机屏幕对准舱内摄像头:

帮我找一下这个商品的链接。
帮我看一下这是什么景点,什么时候去玩比较合适?

AI Agent首先会准确理解意图,明白你询问的是手机屏幕呈现的内容,而不是手机这件商品本身。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

然后把识别目标聚焦在手机屏幕图像内,接着自动调用对应APP,输入需要搜索的关键字或图片,然后将商品链接、游玩攻略返回给你。

当然也能直接帮你下单或者预定酒店,同样不需要你自己打开APP操作。

这是Agent OS的第二项突破多模态能力融汇贯通,让智能座舱适应用户自然的语言动作,而不是让用户学习生硬的交互方式——你的第一反应一定是用一系列复杂手势控制车载电视

记不住招式不说,识别率还不行,更别提巨大的延迟,真的不如遥控器。

场景三:

车上带着宝宝,可以让车载AI直接化身“小猪佩奇”陪孩子聊天;当然也能变成任何你的男神女神,陪伴用户聊天。

更进一步,用户的用车习惯、常用出行范围、饮食偏好,甚至每个家庭成员的座椅、空调、娱乐偏好等等,都会被车载AI“记忆”,形成懂你的智能管家。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

没错,就是你的专属“贾维斯”,也是通用人工智能的第一步。

千里科技强调,这里的记忆功能严格保护用户隐私,车端、云端用户数据完全脱敏处理,要是还不放心可以随时停止或删除“记忆”。

这其实也是Agent OS的第三项突破:智能座舱从助手,到伙伴。

千里科技将智能座舱推向L3时代,体验上是绝对符合OpenAI关于AGI五级发展框架定义的。

相对地看,现在绝大部分座舱产品形态其实是简单的L1,最多集成一部分语音指令调用车载功能,算是稍稍摸到L2座舱的门槛:本质是把一块平板电脑怼到车上,主要交互形式是触屏,各位肯定深有体会。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

头部新势力处在L2阶段,通过车端VLM模型融合语言、动作识别,再通过复杂的后端协议,尽量做到车内功能“可见即可说”。

但千里科技认为,这两个发展阶段的智能座舱,核心都是对用户指令做被动式反应,功能再多算力再大,也跳不出“车载平板”的限制。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

想想看近年从业内到普通用户关于智能汽车的讨论和关注,几乎全部集中在智能辅助驾驶,智能座舱却很少成为焦点,原因就在这里。

体验上避免不了跟手机同质化的尴尬处境,自然也不会成为用户购车的关键影响因素。

千里科技认为,真正的L3级智能座舱,从底层技术架构就需要完全重构。

Agent OS和传统智能座舱有什么不同

千里科技的L3智能座舱给出的颠覆性体验,最容易被用户感知到的是:

我再也不用一板一眼地说明意图,也不用自己动手去操作车机了。

就好像有一个“人”帮我完成了所有操作。

没错,就是一个“人”——AI Agent,以前流行的翻译是“智能体”。

技术层面的解释,AI Agent是能感知环境、做出决策并采取行动以实现特定目标的系统—— 所有过程都记忆并保持历史的上下文关系,并根据结果调整其方法。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

它代表了AI系统运作方式和能力的根本性转变。

举个例子,你要求DeepSeek给你出一篇文章,但只能得到一个一次性的回应,如果你对结果不满意,就需要反复多次向DeepSeek描述修改要求,到了下次再打开DeepSeek,这样的流程又会重复一次。

AI Agent更加细致全面:它会根据你的要求先写一个大纲,确定是否需要研究,接着撰写草稿,接着根据你之前向它提出的规范要求评估是否需修订……

更直观的类比,AI Agent其实就是游戏中的“一键宏”:之前是大模型的各种牛X“技能”摆在你面前,你要自己琢磨技能一个个按出来;现在是一键自动释放最佳组合,直接打出最高伤害。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

千里科技在车端构建的AI Agent有很多。比如UI Agent,可以像人类一样对任何车载应用进行调用、点击、操作,不牵扯任何应用底层的接口调用,不需要车企对APP进行逐一适配上车。

更进一步,今后任何车机其实不需要安装任何APP,UI Agent可以通过底层的多模态大模型完成几乎所有指令,车内屏幕只需要呈现最终结果就行。

再比如出行Agent,它所组合的“技能”就更加复杂,包括端到端语言模型去理解用户意图、操作地图导航、参考用户历史偏好做出正确的决策建议,也包括和其他的Agent进行协作。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

就比如刚才说过的“点外卖”场景,出行Agent会把计算好的到家时间提供给UI Agent去完成下单动作。

所以最直观的解释,Agent OS构建了一批车载“员工”,千里科技为他们设计了不同的能力,比如对话管理、TTS、时延控制等等。

这些员工对接的“下层”,可以是各项车载功能控制器,也可以是一个成熟的安卓OS,各个Agent根据自己的任务目标去调用不同能力。

Agent们对接的“上层”,就是不同的车端应用,按需操作。

Agent如何理解用户需求并生成合理的决策动作链条?背后其实是超大规模的大模型能力,来自和千里科技紧密协作的阶跃星辰

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

车端本地部署的,是40亿参数的多模态大模型,云端则是国内首个千亿参数端到端语音大模型Step-Audio,具备语音理解和生成一体化能力,既能理解人类复杂语义和语音语调背后的情绪信息,又拥有丰富的知识储备与思辨能力,显著提升模型的智商和情商上限。

Agent之间如何协作?

这其实颇有“套娃”的感觉:一个任务要求不同Agent协作,那么最简单直接的办法就是再构建一个“经理”级别的Agent,去指挥分发任务

千里科技不需要动手写代码去制定不同AI Agent的合作流程,只需要提供好大模型间的通信协议(MCP)即可。

这是用户层面之外,L3智能座舱的颠覆之处:

多模态大模型上车可能不是难事,但要靠人工调用能力、定义功能,反而限制了AI的潜力发挥。

不如让AI去管理AI使用AI。

“L3”仅仅止于座舱吗?

Agent OS其实是千里科技掌舵人印奇车圈首次演讲的承诺兑现。

他认为现阶段千里科技的任务是:超自然人机交互的诞生,以阶跃星辰多模态大模型为基础,千里自研的AI Agent技术栈为手段。

这一阶段其实已经蕴含着巨大的潜力。比如,AI Agent成为用户专属“贾维斯”之后,保存的实际上是和用户生活点点滴滴密切相关的记忆片段,而“记忆”是人类最大的情绪价值。

车变成了延续生活归属感、安全感的载体,这是最好的用户留存手段,也是具身智能与人类交互模式的初步探索。

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

再比如用车端的AI Agent直接回应用户关切,以前需要人工在多个APP来回反复操作的过程如今一步到位,实际上完全解构了车机APP的必要性。

意味着互联网大厂激烈争夺的用户入口,现在自然而然被车企收回“主权”,围绕“流量”的甲方乙方模式可能会被颠覆。

前不久,千里科技联席总裁王军、技术负责人杨沐亮相,面向L2+级的智能辅助驾驶解决方案——千里智驾1.0也正式发布。

千里智驾1.0从100 TOPS-700 TOPS包含覆盖各个车型价位的配置方案,可实现多场景自主决策与复杂交互、车位到车位等核心功能——也是适合当前智能化标配趋势的主流量产方案。

另一方面,千里科技进一步披露了面向L3级、L4级别智驾方案的全景路线图:

智能座舱率先L3!AI Agent上车颠覆体验,千里科技WAIC交卷

背后其实是印奇提到的泛世界模型:包括与机器人同源的VLA,与仿真世界生成模型。

实际上国内率先实现机器人学习的基准测试平台——RLBench的跨任务测试中平均成功率达到90%的团队,正是千里科技。

千里科技在车圈的首秀交卷,落在智能座舱而非智能辅助驾驶,多少令人意外。

因为对于印奇这位中国最早投身AI创业浪潮的先驱、计算机视觉大牛来说,外界自然而然认为他所追求的是“争夺一张智能汽车终局的入场券”。

但Agent OS展现出来的是印奇对大模型能力、AI交互方式、AI终极价值的本质思考:

现阶段智能汽车是具身智能的初期产品形态,以及最大规模的机器人落地场景。

更有可能是一条有场景、有数据、可操作AGI落地路径。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy