智能座舱率先L3！AI Agent上车颠覆体验，千里科技WAIC交卷

449次阅读

没有评论

智能座舱率先L3！AI Agent上车颠覆体验，千里科技WAIC交卷

贾浩楠
2025-07-28
20:00:25

来源：量子位

AI大牛印奇带队

贾浩楠发自副驾寺

智能车参考 | 公众号 AI4Auto

智能汽车迈进“L3时代”，现在已经有了明确时间表：

2025年内。

率先落地L3级智能汽车的，既不是新势力，也不是AI科技大厂，反而很有可能是一家自主TOP3车企。

这意味着，手握20多万购车预算的用户，可能比百万级车型用户更快拥有L3智能体验。

背后的推动者：全栈汽车智能化技术玩家千里科技，坐落在西南汽车工业重镇重庆。

据他们自己说，这套L3超越了“大模型上车”，全面升维到车载AI Agent。

L3要上路了？

今年的WAIC上，千里科技联合阶跃星辰推出了最新的智能座舱Agent OS：

没错，“L3”级智能汽车，是智能座舱推进至L3时代。

这并不是生拉硬拽的牵强类比。

推出ChatGPT、启发大模型革命的OpenAI，提出了一套大模型五级发展框架：

L1是聊天机器人，具有对话能力;
L2是推理者，能像人类一样解决问题；
L3是智能体，可以采取行动；
L4是创新者，协助发明创造；
L5是组织者，完成组织工作。

跳出我们熟知的手机、PC端大模型应用，会发现OpenAI的五级发展框架其实对AGI形态、发展路径的描述，涵盖一切与人交互、为人服务的AI模型。

智能座舱当然是其中之一。

千里科技做的，就是彻底抛弃“车载APP”模式的现有座舱，用AI Agent 重新塑造智能汽车和你交互的体验。

千里科技智舱产品负责人贾秀江举了几个例子，说明AI Agent相对现有智能座舱的突破之处。

场景一：

你刚刚下班回家想点一份外卖吃，你直接告诉车载AI：

帮我点一份上周吃过的那个湖南菜，辣少一点，大概四五十块钱，我差不多到家的时候送到。

一句话，系统帮你点餐、下单、付款、留言送达时间。

其实现在很多车机都支持安装外卖APP，但要完成点餐，你还是得找个地方把车停好，然后像操作手机一样去点单付款，还要自己估算送达时间。

你也发现滑稽之处了：我本来就有手机可以完成类似操作，为啥非要用车机？

而车载的AI Agent，会自动调用一连串能力，包括理解你的意图、回溯以前的交互历史记忆、生成任务决策链条、找到对应APP点单、调用支付软件，然后再根据导航信息计算送达时间……

这就是Agent OS的第一项突破：智能座舱从被动的可见即可说，变成主动的可想即可说。

场景二：

你的心上人坐在副驾刷小红书，看到心仪种草好物或者旅行日志分享，直接把手机屏幕对准舱内摄像头：

帮我找一下这个商品的链接。
帮我看一下这是什么景点，什么时候去玩比较合适？

AI Agent首先会准确理解意图，明白你询问的是手机屏幕呈现的内容，而不是手机这件商品本身。

然后把识别目标聚焦在手机屏幕图像内，接着自动调用对应APP，输入需要搜索的关键字或图片，然后将商品链接、游玩攻略返回给你。

当然也能直接帮你下单或者预定酒店，同样不需要你自己打开APP操作。

这是Agent OS的第二项突破：多模态能力融汇贯通，让智能座舱适应用户自然的语言动作，而不是让用户学习生硬的交互方式——你的第一反应一定是用一系列复杂手势控制车载电视。

记不住招式不说，识别率还不行，更别提巨大的延迟，真的不如遥控器。

场景三：

车上带着宝宝，可以让车载AI直接化身“小猪佩奇”陪孩子聊天；当然也能变成任何你的男神女神，陪伴用户聊天。

更进一步，用户的用车习惯、常用出行范围、饮食偏好，甚至每个家庭成员的座椅、空调、娱乐偏好等等，都会被车载AI“记忆”，形成懂你的智能管家。

没错，就是你的专属“贾维斯”，也是通用人工智能的第一步。

千里科技强调，这里的记忆功能严格保护用户隐私，车端、云端用户数据完全脱敏处理，要是还不放心可以随时停止或删除“记忆”。

这其实也是Agent OS的第三项突破：智能座舱从助手，到伙伴。

千里科技将智能座舱推向L3时代，体验上是绝对符合OpenAI关于AGI五级发展框架定义的。

相对地看，现在绝大部分座舱产品形态其实是简单的L1，最多集成一部分语音指令调用车载功能，算是稍稍摸到L2座舱的门槛：本质是把一块平板电脑怼到车上，主要交互形式是触屏，各位肯定深有体会。

头部新势力处在L2阶段，通过车端VLM模型融合语言、动作识别，再通过复杂的后端协议，尽量做到车内功能“可见即可说”。

但千里科技认为，这两个发展阶段的智能座舱，核心都是对用户指令做被动式反应，功能再多算力再大，也跳不出“车载平板”的限制。

想想看近年从业内到普通用户关于智能汽车的讨论和关注，几乎全部集中在智能辅助驾驶，智能座舱却很少成为焦点，原因就在这里。

体验上避免不了跟手机同质化的尴尬处境，自然也不会成为用户购车的关键影响因素。

千里科技认为，真正的L3级智能座舱，从底层技术架构就需要完全重构。

Agent OS和传统智能座舱有什么不同

千里科技的L3智能座舱给出的颠覆性体验，最容易被用户感知到的是：

我再也不用一板一眼地说明意图，也不用自己动手去操作车机了。

就好像有一个“人”帮我完成了所有操作。

没错，就是一个“人”——AI Agent，以前流行的翻译是“智能体”。

技术层面的解释，AI Agent是能感知环境、做出决策并采取行动以实现特定目标的系统—— 所有过程都记忆并保持历史的上下文关系，并根据结果调整其方法。

它代表了AI系统运作方式和能力的根本性转变。

举个例子，你要求DeepSeek给你出一篇文章，但只能得到一个一次性的回应，如果你对结果不满意，就需要反复多次向DeepSeek描述修改要求，到了下次再打开DeepSeek，这样的流程又会重复一次。

AI Agent更加细致全面：它会根据你的要求先写一个大纲，确定是否需要研究，接着撰写草稿，接着根据你之前向它提出的规范要求评估是否需修订……

更直观的类比，AI Agent其实就是游戏中的“一键宏”：之前是大模型的各种牛X“技能”摆在你面前，你要自己琢磨技能一个个按出来；现在是一键自动释放最佳组合，直接打出最高伤害。

千里科技在车端构建的AI Agent有很多。比如UI Agent，可以像人类一样对任何车载应用进行调用、点击、操作，不牵扯任何应用底层的接口调用，不需要车企对APP进行逐一适配上车。

更进一步，今后任何车机其实不需要安装任何APP，UI Agent可以通过底层的多模态大模型完成几乎所有指令，车内屏幕只需要呈现最终结果就行。

再比如出行Agent，它所组合的“技能”就更加复杂，包括端到端语言模型去理解用户意图、操作地图导航、参考用户历史偏好做出正确的决策建议，也包括和其他的Agent进行协作。

就比如刚才说过的“点外卖”场景，出行Agent会把计算好的到家时间提供给UI Agent去完成下单动作。

所以最直观的解释，Agent OS构建了一批车载“员工”，千里科技为他们设计了不同的能力，比如对话管理、TTS、时延控制等等。

这些员工对接的“下层”，可以是各项车载功能控制器，也可以是一个成熟的安卓OS，各个Agent根据自己的任务目标去调用不同能力。

Agent们对接的“上层”，就是不同的车端应用，按需操作。

Agent如何理解用户需求并生成合理的决策动作链条？背后其实是超大规模的大模型能力，来自和千里科技紧密协作的阶跃星辰。

车端本地部署的，是40亿参数的多模态大模型，云端则是国内首个千亿参数端到端语音大模型Step-Audio，具备语音理解和生成一体化能力，既能理解人类复杂语义和语音语调背后的情绪信息，又拥有丰富的知识储备与思辨能力，显著提升模型的智商和情商上限。

Agent之间如何协作？

这其实颇有“套娃”的感觉：一个任务要求不同Agent协作，那么最简单直接的办法就是再构建一个“经理”级别的Agent，去指挥分发任务。

千里科技不需要动手写代码去制定不同AI Agent的合作流程，只需要提供好大模型间的通信协议(MCP)即可。

这是用户层面之外，L3智能座舱的颠覆之处：

多模态大模型上车可能不是难事，但要靠人工调用能力、定义功能，反而限制了AI的潜力发挥。

不如让AI去管理AI使用AI。

“L3”仅仅止于座舱吗？

Agent OS其实是千里科技掌舵人印奇车圈首次演讲的承诺兑现。

他认为现阶段千里科技的任务是：超自然人机交互的诞生，以阶跃星辰多模态大模型为基础，千里自研的AI Agent技术栈为手段。

这一阶段其实已经蕴含着巨大的潜力。比如，AI Agent成为用户专属“贾维斯”之后，保存的实际上是和用户生活点点滴滴密切相关的记忆片段，而“记忆”是人类最大的情绪价值。

车变成了延续生活归属感、安全感的载体，这是最好的用户留存手段，也是具身智能与人类交互模式的初步探索。

再比如用车端的AI Agent直接回应用户关切，以前需要人工在多个APP来回反复操作的过程如今一步到位，实际上完全解构了车机APP的必要性。

意味着互联网大厂激烈争夺的用户入口，现在自然而然被车企收回“主权”，围绕“流量”的甲方乙方模式可能会被颠覆。

前不久，千里科技联席总裁王军、技术负责人杨沐亮相，面向L2+级的智能辅助驾驶解决方案——千里智驾1.0也正式发布。

千里智驾1.0从100 TOPS-700 TOPS包含覆盖各个车型价位的配置方案，可实现多场景自主决策与复杂交互、车位到车位等核心功能——也是适合当前智能化标配趋势的主流量产方案。

另一方面，千里科技进一步披露了面向L3级、L4级别智驾方案的全景路线图：

背后其实是印奇提到的泛世界模型：包括与机器人同源的VLA，与仿真世界生成模型。

实际上国内率先实现机器人学习的基准测试平台——RLBench的跨任务测试中平均成功率达到90%的团队，正是千里科技。

千里科技在车圈的首秀交卷，落在智能座舱而非智能辅助驾驶，多少令人意外。

因为对于印奇这位中国最早投身AI创业浪潮的先驱、计算机视觉大牛来说，外界自然而然认为他所追求的是“争夺一张智能汽车终局的入场券”。

但Agent OS展现出来的是印奇对大模型能力、AI交互方式、AI终极价值的本质思考：

现阶段智能汽车是具身智能的初期产品形态，以及最大规模的机器人落地场景。

更有可能是一条有场景、有数据、可操作AGI落地路径。

智能座舱率先L3！AI Agent上车颠覆体验，千里科技WAIC交卷

智能座舱率先L3！AI Agent上车颠覆体验，千里科技WAIC交卷

L3要上路了？

Agent OS和传统智能座舱有什么不同

“L3”仅仅止于座舱吗？

潞晨尤洋：日常办公没必要上私有模型，这三类企业才需要 | MEET2026

世界模型和具身大脑最新突破：90%生成数据，VLA性能暴涨300%｜开源

SpaceX估值8000亿美元超OpenAI，IPO就在明年

“豆包手机”在二手市场价格都翻倍了……

中国AI计算开放架构创新风向标：HAIC2025重磅启幕

库克不忍了！挥刀优化苹果AI大总管

中国移动亿元战略投资港科大系触觉智能企业

做难而正确的AI Infra创新——专访国产大模型推理引擎xLLM社区负责人刘童璇

PixVerse（拍我AI）V5.5发布：国内首款分镜+音频一键生成AI视频大模型

灵光 “一闪”，330万个“闪应用”已创建