活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体

1,158次阅读
没有评论

活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体

报告主题:Creative Agents创造式任务和具有想象力的智能体

报告日期:12月18日(周一)11:00-12:00

活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体

主题简介:

北京大学和清华大学等机构组成的团队提出了一类解决创造式任务的智能体——Creative Agents,并推出了首个创造式任务的测试基准。

如何设计具有创造力的智能体,让它能够在现实世界中做各种开放式的复杂任务?这是我们迈向通用决策智能的重要一步。现有的很多工作构建了能够根据语言指令做任务的开放式智能体,但它们设计的语言指令往往清晰明确地描述了任务,没有让智能体表现出创造力。

本文考虑一类更具挑战性的创造式任务,要求智能体从抽象的语言指令中创造出新颖多样的任务解决方案,进而进行多步的规划完成复杂的任务。受人类借助想象力来创造性地完成任务启发,本文提出了一个具有创造力的智能体的框架Creative Agents。其中,智能体被分解为想象模块和控制器两个部分:想象模块能够根据给定的任务指令,以文本或图像的形式构思任务的细节,为完成任务提供具体的目标;控制器根据想象的任务细节进行规划,并在环境中执行动作序列。

本文对想象模块和控制器模块分别提出了两种实现方式,构建了Creative Agents的多个变种。作者在Minecraft游戏中设计了20个创造式任务作为测试基准,提出了多种任务评测指标,对Creative Agents做了详细的实验分析。本文还提出了基于视觉-语言模型GPT-4V的评测指标,并与现有的人工评价方法进行对比实验,显示GPT-4V与人工评测的结果具有一致性。

Creative Agents是对在开放世界中构建具有创造力的智能体的第一步尝试;同时,作者开源了Minecraft创造式任务的测试环境、评价指标、数据集,为后续相关领域的研究提供了基准。

论文链接:https://arxiv.org/pdf/2312.02519.pdf

代码链接:https://github.com/PKU-RL/Creative-Agents

项目主页:https://sites.google.com/view/creative-agents

报告嘉宾:

蔡鹏霖,北京大学元培学院本科生,研究兴趣主要包括强化学习、开放环境下智能体的构建及其协作等。他也对大语言模型、视觉-语言模型在任务分解和目标规划等方面的应用有浓厚的兴趣。

袁昊琦,北京大学计算机学院博士生,研究方向是设计高效的决策算法和模型,涉及强化学习、生成模型和表示学习。目前的研究工作有:结合大语言模型和强化学习的开放世界智能体,离线的多任务强化学习,预训练决策模型。

扫描下方二维码

活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体

或点击「阅读原文」报名

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 闻乐 2026-01-05 19:...
全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026 量子位的朋友们 2026-01-06 16...
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了 梦瑶 2026-01-0...
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...