小雪 | 通用的移动操作机器人还有多远?

1,166次阅读
没有评论

小雪 | 通用的移动操作机器人还有多远?

近年来,得益于大量数据和先进的视觉语言模型,通用移动操作机器人技术上取得了显著进展。例如,我们已经可以看到机器人根据指令完成清理桌面和分类物品等复杂任务的演示。这些突破性成就逐渐激发了大众对于移动操作机器人融入日常生活的期待。但要实现这一目标,我们还有多远的路要走?

视频来源:

https://robotics-transformer1.github.io/img/saycan_rt1_demo1_comp.mp4

首先,我们需要明确移动操作机器人(Mobile Manipulator Robots)的定义。移动操作机器人是一种复杂的机器人系统,它结合了移动平台(如轮式或足式)和机械臂的功能(如图示中的 TIAGo 和 Unitree 移动机器人)。移动平台赋予机器人在空间中的移动能力,而机械臂则提供执行具体任务的功能,如抓取、搬运、装配或其他精细的机械操作。由于这种机器人兼具灵活性和操作能力,它们在帮助或替代人类执行特定任务方面显示出巨大潜力。通用移动操作机器人算法则是研究如何让移动操作机器人具有泛化执行多项任务的能力,使其能够适应各种不同环境和任务,而不仅仅局限于特定场景或任务。

小雪 | 通用的移动操作机器人还有多远?

TIAGo 机器人(左);Unitree B1 +Z1(右)

在近年来的通用移动操作机器人算法研究中,主要存在两类方法。第一类是基于技能协调(Skills Coordination)的方法,这类方法通过整合多种子任务(例如抓取、物体导航、语言决策等)来逐步增强机器人的能力。这类方法的代表性工作包括 Meta AI的Adaptive Skill Coordination[1]和 Language-guided Skill Coordination[2]。这种方法能够从机器人学领域的进展中直接受益,并通过人为设计或者学习特定的协调策略来整合这些子任务,从而实现更复杂的长期任务。这种做法的主要优点是灵活性高:无论是通过算法设计还是收集特定数据用于学习,掌握这些子任务要容易得多,成本也较低。相对应的,这类方法的表现受限于各个子任务的能力,并且随着子任务数量的增加,对协调策略的要求也相应提高。

小雪 | 通用的移动操作机器人还有多远?

Adaptive Skill Coordination pipeline overview[1]

第二类工作则关注于构建大规模泛化移动操作机器人的数据集,并通过端到端的学习方法来训练通用移动操作机器人。一个典型的例子是谷歌的 Rt 系列研究[3,4]。谷歌的机器人硬件团队(Everyday Robots Project)开发了自己的移动操作原型机器人。利用这些原型机,他们收集了约13万条数据,这些数据包括13台原型机执行的700种不同任务的示范(demonstration)。通过学习大量的真实世界示范数据,模型展现出一定程度的在真实环境中执行泛化任务的能力。但这种方法的一个问题是,收集这种规模的真实数据成本极高。有些研究团队考虑用模拟器来获取更多数据,但这也引入了机器人从模拟器到真实世界环境的泛化能力的挑战(sim-to-real gap)。尽管如此,数据收集的重要性在学术界逐渐形成共识,一些研究项目,如 Open X-Embodiment[5],已经开始收集大量数据,以支持真实世界机器人的学习需求。

小雪 | 通用的移动操作机器人还有多远?

RT-1 pipeline overview[3]

关于这两类方法是否能满足我们对通用移动操作机器人的期望,作者认为,已有的研究展示了通用移动操作机器人的潜在可行性。然而,这种可能性目前仍属于探索阶段,存在多方面的局限性,包括应用场景、任务种类以及被操作物体的多样性等。在真实环境中,机器人会遇到许多边缘情况,例如透明的物体,柔性物体和镜子,这些情况会给任务的执行带来额外的难度。更坏的情况是,机器人在实际执行任务时的错误还可能对环境和机器人自身造成物理损害和其他风险。

未来,通过收集更多的数据和设计更优的算法,通用移动操作机器人的性能有望得到持续提升。与此同时,确定机器人适用的最佳场景和任务类型也会是一个需要持续探索的问题。这要求研究者不仅要关注技术的进步,还需考虑机器人在不同环境和应用中的实际适用性。

幸运的是,尽管通用移动操作机器人在实现日常生活应用方面仍面临诸多挑战,但近年来的研究进展令人鼓舞 。例如在2019年,Meta 的研究人员发起了 Habitat Challenge[6],创建了一个模拟器来评估机器人在给定特定目标位置下的简单的路径规划能力。四年后,在2023年的 CVPR 会议上,Meta 的研究团队已经实机展示了机器人根据语言指令寻找、抓取和放置特定物体的能力。虽然通用移动操作机器人进入千家万户的日常生活还有很长的路要走,但该领域的发展速度足够让我们对未来保持乐观的态度。

小雪 | 通用的移动操作机器人还有多远?

左图:Habitat challenge PointGoal Navigation;右图:拍摄于 CVPR 2023 Meta AI 展台

References:

[1] Yokoyama N, Clegg A W, Undersander E, et al. Adaptive Skill Coordination for Robotic Mobile Manipulation[J]. arXiv preprint arXiv:2304.00410, 2023.

[2] https://languageguidedskillcoordination.github.io/

[3] Brohan A, Brown N, Carbajal J, et al. Rt-1: Robotics transformer for real-world control at scale[J]. arXiv preprint arXiv:2212.06817, 2022.

[4] Brohan A, Brown N, Carbajal J, et al. Rt-2: Vision-language-action models transfer web knowledge to robotic control[J]. arXiv preprint arXiv:2307.15818, 2023.

[5] Padalkar A, Pooley A, Jain A, et al. Open x-embodiment: Robotic learning datasets and rt-x models[J]. arXiv preprint arXiv:2310.08864, 2023.

[6] Savva M, Kadian A, Maksymets O, et al. Habitat: A platform for embodied ai research[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2019: 9339-9347.

小雪 | 通用的移动操作机器人还有多远?

文 | 张嘉曌

图 | 除标注外,源自网络

小雪 | 通用的移动操作机器人还有多远?

—   版权声明  —

本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。

小雪 | 通用的移动操作机器人还有多远?

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 11 月
 12345
6789101112
13141516171819
20212223242526
27282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...