纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

1,582次阅读
没有评论

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

注意看,这个机器人用手中的钳子轻松剪断了一根金属丝。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

盖上的铁盒子,也三下五除二就打开了。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

除此之外,物体抓取等任务更是能轻松完成。

这个机器人的背后,是纽约大学联合Meta AI实验室推出的最新具身智能成果。

研究人员提出了一种名为TAVI的新训练方法,将视觉与触觉相结合,把机器人执行任务的效果提高一倍以上。

目前,研究团队的论文已经公开发表,相关代码也已经开源

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

看到这个机器人的表现,Meta首席科学家LeCun也不禁感叹这是一项惊人的进展。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

那么用这种方法训练出的机器人,还能做些什么呢?

取物置物易如反掌

它可以把摞在一起的两只碗分开,然后拿取上面的一个。

仔细观察可以发现,在分开的过程当中,机器人的手部做出了撵的动作,让黄色的碗沿着绿色碗的内壁滑动。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

这个机器人不仅能“分”,还能“合”。

将红色的物块拿起之后,机器人将它精准地放入了紫色的盖子当中。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

或者,给橡皮翻个身。

只见它将一大块橡皮拿起,然后利用下面的盒子调整角度。

虽然不知道为什么不多用几根手指,但毕竟也是学会了借助工具。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

总之,用TAVI方式训练出的具身智能机器人,动作已经和人类有了几分相似。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

数据上,TAVI方式在6项典型任务中明显优于只用触觉或视觉反馈的方法。

和不使用触觉信息的AVI方式相比,TAVI的平均成功率提高了135%,和图像+触觉奖励模型的方式相比也翻了倍。

而同样采用视觉触觉混合模式的T-DEX训练方式,成功率还不到TAVI的四分之一。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

TAVI训练的机器人还有很强的泛化能力——对于未曾见过的物体,机器人也可以完成任务。

在“拿碗”和“装盒”两项任务中,机器人面对未知物体的成功率均超过了半数

此外,TAVI方法训练出的机器人不仅能出色完成各项任务,还能按顺序依次执行多项子任务。

鲁棒性方面,研究团队通过调整相机角度进行了测试,结果机器人依旧保持了高成功率。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

那么,TAVI方法是如何实现这样的效果的呢?

用视觉信息评价机器人表现

TAVI的核心是使用视觉上的反馈来训练机器人,工作主要分为三个步骤。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

首先是从视觉和触觉两个维度收集人类给出的演示信息。

收集到的视觉信息会被用于建立奖励函数,以供后续学习过程中使用。

这一过程中,系统通过对比学习的方式来获取对完成任务有用的视觉特征,对机器人动作完成度进行评价。

然后结合触觉信息和视觉反馈,通过强化学习方式进行训练,让机器人反复尝试,直到获得较高的完成度评分。

而TAVI的学习是一个循序渐进的过程,随着学习步骤的增加,奖励函数越来越完善,机器人的动作也越来越精准。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

而为了提高TAVI的灵活性,研究团队还引入了一种残差策略。

遇到与基础策略出现差别时,只需要对有差别的部分进行学习,而不必从头开始。

消融实验结果表明,如果没有残差策略,而是每次都从头学起,机器人完成任务的成功率将有所降低。

如果对具身智能有兴趣,可以阅读研究团队的论文了解更多详情。

论文地址:
https://arxiv.org/abs/2309.12300
GitHub项目页:
https://github.com/irmakguzey/see-to-touch

AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「广告营销」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

纽大具身智能新进展:靠视觉反馈学会开罐头,任务成功率提高135%,LeCun点赞

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 10 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...