活动报名|2023年ICLR杰出论文作者贺笛,长序列建模的理论与算法设计

592次阅读
没有评论

活动报名|2023年ICLR杰出论文作者贺笛,长序列建模的理论与算法设计报告主题:长序列建模的理论与算法设计报告日期:2月27日(周二)14:30-16:00主题简介:Towards Efficient and Effective Long Sequence Generation如何对长序列进行建模是当前自然语言处理中的一个热点问题。长序列建模面临诸多挑战,例如如何正确生成超长序列?如何加速语言模型对长序列的生成?在这个领域,过去已经有许多研究工作提出Transformer的高效变体,但这些变体模型是否存在理论缺陷?到底哪些变体模型能真正完美地取代Transformer?在这个talk中,我将围绕着团队最近的一系列工作,试图对上述问题进行理论层面、模型层面与算法层面的回答。报告嘉宾:
贺笛,北京大学智能学院助理教授,前微软亚洲研究院主管研究员。主要从事机器学习模型、算法与理论方向的研究工作,已发表ICML、NeurIPS、ICLR等重要期刊/会议论文50余篇,谷歌引用数超过7500,指导学生2次在图神经网络国际顶级评测竞赛上取得冠军。所设计的模型、算法多次被DeepMind、OpenAI、微软、Meta等国际顶尖研究机构使用。获得机器学习顶级国际会议ICLR 2023杰出论文奖。扫描下方二维码活动报名|2023年ICLR杰出论文作者贺笛,长序列建模的理论与算法设计或点击「阅读原文」报名

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy