人工智能研究与应用范式正经历一场剧变,越来越多的顶级团队和杰出人才纷纷加入这一变革浪潮。作为AI大模型科研先锋,智源研究院携手一批卓越的学者与工程师,致力于将尖端技术与经验传授给有潜力的学习者,通过高效的学习方式,让更多人能迅速融入这一重要的历史进程,提升中国在这一领域的人才数量和质量。
大模型前沿技术讲习班第一季第四期(S01E04)将在 2023年10月28日至29日于智源大厦(北京市海淀区成府路150号)召开,本期主题聚焦于“智源FlagOpen大模型开源体系与应用”。本次讲习班将由智源研究院9位研究员担纲介绍 FlagOpen 的近期进展以及落地实践。
其中,10月28日下午14:00-15:30智源研究员刘政&肖诗涛将讲授《链接大模型与外部知识,语义向量模型 BAAI General Embedding(BGE) 及应用实践》。
专家介绍
刘政,北京智源人工智能研究院信息检索与知识计算组负责人,香港科技大学博士,曾担任MSRA主管研究员、华为2012实验室技术专家等职务,主持研发BAAI General Embedding等开源模型,参与开发BING Ads、Microsoft News、Huawei Petal Search等多个商用信息检索系统开发;在自然语言处理、信息检索、与数据挖掘领域等领域的顶级刊物发表论文数十篇。
肖诗涛,北京智源人工智能研究院信息检索与知识计算组研究员;北京邮电大学硕士;智源FlagEmbedding项目核心开发者,主持开发BAAI General Embedding等开源模型;在KDD、SIGIR、ACL、EMNLP等顶级学术会议发表多篇论文。
课程内容
语义向量是连接大语言模型与世界知识的桥梁。语义向量检索可以高效地为大语言模型补充世界知识和本地知识;同时,精准且通用的语义表征能力对于提升大语言模型的事实性、实现其长期记忆、以及快速构建大语言模型面向垂直领域的应用都具备深远的意义。本次报告将介绍智源研究院语义向量模型 BAAI General Embedding(BGE) 及应用实践。
课程提纲
-
基础理论
-
语义检索基础
-
面向语义表征的预训练语言模型
应用实践
-
BGE模型代码解析
-
BGE模型结合大语言模型的应用
欢迎扫码查看更多精彩议题和了解报名详情