6月14日消息,图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)联合Abacus.AI、纽约大学等机构推出全新的大模型测评基准LiveBench AI,并公布首个测评榜单。阿里云通义千问刚刚开源的大模型Qwen2-72B成为排名最高的开源大模型,是前十榜单中唯一的开源大模型、唯一的中国大模型,成绩超过Meta的Llama3-70B模型。
LiveBench AI的首次测评针对34个全球领先的开闭源大模型进行,结果显示,GPT-4o排名第一,紧随其后的有Cluade-3、Gemini-1.5和Qwen2-72B,其中Qwen2-72B是排名最高的开源大模型,也是唯一进入前十的中国大模型。
LiveBench AI的完整榜单显示,通义千问Qwen系列共有7款模型进入榜单,分别是Qwen2-72B、Qwen1.5-72B、Qwen1.5-110B、Qwen1.5-7B、Qwen1.5-4B、Qwen1.5-1.8B、Qwen1.5-0.5B,是除GPT之外入选最多的大模型团队。目前,Qwen系列开源模型目前下载量已经突破1600万。
正文完
可以使用微信扫码关注公众号(ID:xzluomor)