如果将语言大模型比喻成一个能思考能交流的大脑,多模态语言大模型则是给大脑赋予了眼睛,让它能够像人一样看到世界。2月20日,19:00-20:00,DataFun在线公开课第76期分享,将邀请来自腾讯的研究员张驰老师介绍团队在多模态大模型方向的努力与尝试,分享在多模态智能体(Agent)方向的研究成果AppAgent——让图文大模型像人一样操作手机App。
欢迎感兴趣的小伙伴扫码进群,免费观看直播!
议题与嘉宾介绍
🔥演讲题目:AppAgent: 多模态智能体代理操作手机App
🔍演讲关键词:agent、智能体、大语言模型
👨💻演讲嘉宾:张驰 腾讯 研究员
张驰博士,现就职于腾讯公司担任研究科学家。2021年博士毕业于新加坡南洋理工大学计算机学院。他的博士研究课题专注于高效低成本的机器学习和计算机视觉算法,目前的研究方向是大模型时代下的多模态模型与AIGC模型。曾在CVPR、ICCV、NeurIPS、TPAMI等顶级国际会议期刊上发表多篇学术论文。2023年入选美国斯坦福大学发布的《2023年度全球前2%顶尖科学家榜单》。
📆演讲时间:2/20 19:00-20:00
📌演讲提纲:
如果将语言大模型比喻成一个能思考能交流的大脑,多模态语言大模型则是给大脑赋予了眼睛,让它能够像人一样看到世界。本次报告我将介绍团队在多模态大模型方向的努力与尝试,重点介绍我们最近在多模态智能体(Agent)方向的研究成果AppAgent——让图文大模型像人一样操作手机App。
🔑听众收益:
1. 了解多模态大语言模型的前沿应用
2. 了解智能体代理的最新发展
扫码进群,会后免费领取PPT
点击『阅读原文』
正文完
可以使用微信扫码关注公众号(ID:xzluomor)