苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

1,151次阅读
没有评论

苹果布局人形机器人:“自我为中心”感知系统动态避障,比英伟达cuRobo计算效率提升26倍

软硬件协同增强机器人的“空间意识”

西风 发自 凹非寺

量子位 | 公众号 QbitAI

苹果要搞人形机器人这事儿现在传得沸沸扬扬。

最近他们确实有新动作——开发了一套机器人感知系统!

系统名为ARMOR,软硬件协同增强机器人的“空间意识”,能动态防碰撞的那种。

硬件方面,ARMOR通过在机器人手臂上安装小型智能深度传感器,为机器人提供几乎完整的环境视图,解决了传统机器人感知中的盲点和遮挡问题。

软件方面,苹果开发了一个基于Transformer的AI驱动ARMOR-Policy,能够从人类动作中学习,帮助机器人动态规划行动。

团队还将ARMOR部署在了傅利叶GR-1机器人上进行实验。

实验结果显示,与使用四个头戴式和外部安装的深度相机(外心感知)相比,ARMOR系统使碰撞降低了63.7%!

与基于采样的运动规划专家系统cuRobo相比,ARMOR-Policy计算效率提升26倍,确保机器人能够迅速行动。

看到苹果在人形机器人方面的布局,网友直呼这是大势所趋:

他们不可能永远依赖智能手机赚钱。从长远来看,机器人市场将远大于智能手机市场。

ARMOR系统长啥样?

当前,传统人形机器人通常依赖头部或躯干安装的集中式相机和激光雷达进行环境感知,这种方式虽然易于集成且能提供较好的视野范围,但在手臂和手部区域常常存在严重的遮挡问题。

虽然一些研究尝试在机器人终端执行器上集成触觉传感,但这种方案成本高昂,且难以大规模应用于机器人手臂,同时在策略学习中如何有效利用触觉输入仍待解决。

ARMOR系统,提供了一种硬件和软件整合设计,它由来自卡内基梅隆大学的学者Daehwa Kim在苹果实习期间与苹果团队共同开发。

在硬件方面,与集中式RGBD相机一次性捕捉密集帧中的全部细节不同,团队选择了SparkFun VL53L5CX飞行时间(ToF)激光雷达作为基础传感单元,将稀疏感知分布在多个传感器上,形成“以自我为中心的感知”。

这种传感器体积为6.4×3.0×1.5mm,可以以15Hz的频率提供8×8分辨率的深度图像,对角视场为63°,测距范围达4000mm。

研究团队在机器人的每个手臂上布置了20个这样的传感器,共计40个传感器形成分布式感知网络。

每四个传感器连接到一个XIAO ESP微控制器,通过I2C总线进行数据读取,再通过USB传输到机器人的板载计算机(Jetson Xavier NX),最后无线传输到配备NVIDIA GeForce RTX 4090 GPULinux主机进行处理,确保整个系统能够维持15Hz的刷新率。

在软件方面,研究团队开发了基于Transformer编码器-解码器架构的ARMOR-Policy,类似于动作分块Transformer(ACT)。

该策略通过模仿学习从无碰撞的人类运动演示中学习。

为了训练这个策略,研究团队使用了AMASS数据集中的311922个人类真实运动序列(约86.6小时),这些数据包含了各种相关的人类姿态,如操作、舞蹈和社交行为等。

团队将这些人类动作轨迹重定向到机器人的关节配置上,并在轨迹周围生成紧凑的障碍物,确保轨迹本身不发生碰撞。

训练数据的生成采用了三种策略:避障运动、紧急停止和无碰撞运动。

ARMOR-Policy的网络架构设计考虑到了运动规划可能存在多个有效解的特点。通过引入额外的编码器层来推断潜在变量z,使策略能够通过调整z生成不同的运动轨迹候选。

在推理阶段,系统会并行计算N个候选轨迹,并通过最小化机器人与点云之间的距离来选择最优路径。网络输入包括潜在变量z、当前和目标关节位置(28维向量),以及40个ToF激光雷达传感器的深度图像数据。

深度图像通过修改后的单通道ResNet18骨干网络处理,提取512维特征。整个网络架构包含约84M参数。

实验验证显示,ARMOR系统在多个方面都优于现有方案。

与使用四个头戴式和外部安装的深度相机(外部感知)的传统策略相比,ARMOR系统在避障性能上取得了显著提升,碰撞降低63.7%,成功率提升78.7%。

同时,与基于采样的运动规划专家系统cuRobo相比,ARMOR-Policy表现出更好的性能,碰撞减少31.6%,成功率提高16.9%,计算效率更是提升了26倍。

研究团队还通过在傅利叶GR-1人形机器人上部署28个ToF激光雷达,实际验证了ARMOR系统在真实环境中的应用可行性,系统能够实现15Hz的实时避障轨迹更新。

“苹果做机器人几乎是必然的”

最近,关于苹果发力人形机器人的爆料频出。

比如彭博社爆料,苹果正在寻找其“下一个重大项目”,机器人正是其关注的领域之一。苹果工程团队正在开发多种家庭机器人设备以及可能增强家庭机器人实用性的AI软件和功能。

而苹果机器人研发活动由硬件工程部门和John Giannandrea领导的AI与机器学习团队共同进行。

更有爆料指出,苹果将优先打造桌面机器人,它将作为“家庭指挥中心”,可用于 FaceTime视频通话以及家庭安全监控。

这一系列举动也引发了网友大量讨论。

有网友分析,苹果在人形机器人赛道的布局,几乎是必然的:

苹果人形机器人?这不仅是可能的,几乎是必然的。凭借他们的设计理念和生态系统整合,他们将为个人机器人设定一个高标准。

随着智能手机的逐渐淘汰,机器人确实有可能成为下一个普遍存在的技术。想象一下,Siri体现在一个时尚的人形助手中,这将是一个游戏规则的改变者!

这种分析立马遭到其他网友反驳,揭老底:

苹果之前也吵吵着要做自动驾驶汽车,但最后还是放弃了。虽然苹果有能力开发人形机器人,但会不会真做还是不太清楚。

苹果偏好主导市场,不喜欢面对激烈的竞争,而人形机器人和AI市场将极具竞争性。

那么,你看好苹果做人形机器人吗?

论文链接:https://arxiv.org/pdf/2412.00396v1参考链接:https://x.com/Dr_Singularity/status/1873374876867723435

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 12 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...