智源 ACM MM2023论文:Food-500 Cap:用来评测视觉-语言模型的细粒度图像描述数据集 01 研究动机 随着视觉–语言模型(Visual-Language Models, VLMs)…
智源 LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界 新智元报道 编辑:alan 润 【新智元导读】近日,斯坦福的华人研究人员提出全新视频生成框架——W…
智源 社区供稿 | 南方科技大学联合 IDEA 研究院CCNL 中心发布 34B Chat 模型 南方科技大学和粤港澳大湾区数字经济研究院(简称IDEA研究院)认知计算与自然语言研究中心(简称CCNL中心…
智源 2023人工智能年度评选结果揭晓!大模型元年最值得关心的AI公司&人物&产品都在这里 组委会 发自 凹非寺量子位 | 公众号 QbitAI 这注定是人工智能发展史上载入史册的一年。 ChatG…