3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

1,394次阅读
没有评论

3DGen 发自 凹非寺

量子位 | 公众号 QbitAI

3D生成也有自个儿的人工评测竞技场了~

来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测。

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

3DGen-Arena同样是让两个模型进行比较,分文生3D、图生3D两个赛道。

展示形式上考虑到3D生成的复杂性,3DGen-Arena同时提供3D资产的法线图、无纹理几何图和贴纹理RGB图的360°环绕视频

投票方式很简单:

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

第一步点击“Sample”选择prompt(共有1000+条),第二步点击“Send”让模型生成,第三步分别从几何合理性、几何精细度、纹理质量、几何-纹理一致性、文本/图像-3D一致性这5个维度上对模型投票,投完票就能看到背后模型的真面目了。

目前场上已有19个开源3D生成模型,其中9个文生3D模型,13个图生3D模型。

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick
3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

除匿名投票外,3DGen-Arena还支持参与者与指定模型进行比较,以及与单个模型交互。

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

已开赛,来pick

近两年,得益于Diffusion模型在2D领域取得的巨大成功,以及Objaverse系列大规模3D数据集的开源,3D物体生成领域已经进入迅速发展阶段,3D生成模型数量激增。

然鹅,如何科学、公平地评价这些模型成为了领域内公认的难题。

目前已有的3D评测指标大多沿用了2D领域的范式。其中,Clip系列模型表现出的强大图文对齐能力使得基于Clip的方法尤为受欢迎,如Clip-Similarity、Clip R-Precision等。

但由于2D和3D领域间存在不容忽视的域差异(domain gap),这类不具备3D先验知识的2D指标,在实际应用中,常常并不能满足人们的需要。

例如,3D工作者们关心的几何合理性、3D一致性、纹理伪影等等关键问题,2D指标远远无法达到令人满意表征水平。

于是,目前工作中更具可信度的评价大多来自于定性的用户评价(user-study),但缺少一个统一、多样的prompt集,使得不同模型间的user-study并不那么容易对齐。

最近,因大语言模型以及多模态大模型表现出的优异性能,出现了一些基于大模型问答的3D评测体系。但此类依赖黑盒模型的评测系统,可能会引入一些潜在的系统性误差,而且不具备好的可解释性。

3D生成评测是一项不适定问题(ill-posed problem),需要综合考虑几何质量、纹理质量、以及与输入信息的匹配程度。

自动化评测系统的探索面临很多技术难题,但令人振奋的是,语言和图像领域为我们提供了人工评测的新思路。

由此,来自复旦大学和上海AI lab的开发者推出了3DGen-Arena。

为实现多维度、全方位的评估,3DGen-Arena划分出的5个独立维度各有侧重,互为补充:

“几何合理性”是3D模型的基本要求,能够衡量生成模型习得的3D先验水平;

“几何精细度”则是更高层次的要求,是提升生成质量的关键方向;

“纹理质量”直接影响生成的3D资产的视觉效果,视角一致、富有美学的纹理贴图是纹理优化的目标;

“几何-纹理一致性”在现实世界中,常常被忽略。但在生成过程中,我们发现保证一致的贴图并不总是容易的;

“文本/图像-3D一致性”是条件生成方式的内在要求,实现跨模态精准控制是不断追求的目标。

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

除了匿名模型投票外,3DGen-Arena还允许参与者指定模型进行比较,以及与单个模型交互,满足社区的多样需求。

开发人员表示,考虑到部分文生3D模型漫长的训练时长,以及复杂的数据后处理,目前3DGen-Arena暂不支持开放式输入的在线生成功能。

但他们精心设计1k+条prompt,其中文生3D和图生3D各500余条,是现有其他评测系统prompt集数量的10倍(~10x),涵盖了“交通工具”、“动物”、“植物”、“食物”、“室内物品”、“室外物品”等6大基础类别。

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

为了观察3D生成模型对prompt复杂程度的敏感程度,除了单个物体生成外,开发人员还设计了物体间的多种排列组合方式,以及一些带有交互的“微场景”。

截至目前,3DGen-Arena平台已经内嵌了1w+个3D资产,可以提供5.8w组不同的比较对。

开发人员还表示,之后将继续维护和完善3DGen-Arena:增添更多的开源、甚至闭源模型;定期维护、更新排名榜;上线支持开放式输入的在线生成服务……

3D生成为何需要一个科学、全面、鲁棒的评价体系?这当中益处不言而喻。

一方面, 通过质量评测,深入理解现有生成模型的优缺点,挖掘潜在的发展方向,进而指导模型改进和新算法的开发,不断探索AIGC的能力边界。

另一方面,多维度的3D质量评测对实践应用有指导性作用, 便于针对不同的下游需求,把握关键维度,权衡次要维度。

话不多说了,从事3D生成的或者对3D生成任务感兴趣的家人们,快去pick你喜欢的模型吧~

https://huggingface.co/spaces/ZhangYuhan/3DGen-Arena

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 5 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...