单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

927次阅读
没有评论

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

渲染零件、拍摄的3D打印零件等均能重建

CADCrafter团队 投稿

量子位 | 公众号 QbitAI

单张图直接就能生成可编辑的CAD工程文件!

来自魔芯科技、NTU等的研究人员提出图生3D新框架,名为CADCrafter

CADCrafter和过去得到网格(Mesh)或3D高斯泼溅(3DGS)的图生3D方法大不相同。

不管是零件渲染图,还是拍摄的3D打印零件,甚至是随意拍摄的日常生活中的物体,CADCrafter均能够生成的对应的原始CAD文件(以CAD指令的方式表示,包括表征每个几何特征的指令和对应参数)

并且通过CAD编译器进行编译,可得到直接生产加工的3D文件(如STP格式的文件)

用户可以通过编辑CAD指令实现对物体的编辑(下图右)

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

实验中,从落地实用性、表面质量等特点来看,CADCrafter相较于目前的图生3D方法均有显著提升。

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

这项研究的作者来自KOKONI 3D(魔芯科技)、新加坡南洋理工大学、新加坡A*STAR、西湖大学、德州大学奥斯汀分校和浙江大学。

通讯作者为魔芯科技创始人Tianrun Chen和新加坡A*STAR研究科学家Fayao Liu。

论文已被CVPR 2025接收。

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

以下是更多细节。

从图像到高质量CAD模型的端到端生成流程

在现实世界中,大多数人造物体最初都是通过计算机辅助设计(CAD)软件以参数化的方式建模的。

然而,如今大热的3D AI生成内容(3D AIGC技术,例如TRELLIS等方法,大多仍依赖于“网格模型”(Mesh)作为基础。

问题也随之而来。

相比CAD的参数化设计,网格模型不仅难以理解,更难精确编辑。用户想要修改一个小部件的尺寸?在CAD中只需调整参数,在网格模型中却可能要大动干戈。

而且,这些AI生成的网格模型表面常常不够光滑,边缘也不够锐利,尤其是使用像Marching Cubes这样的算法从隐式函数转换生成网格时,几何质量更容易受到影响。

这种粗糙不清的表面,在需要高质量渲染或动画的应用中,显得格外捉襟见肘。

相比之下,CAD的参数化模型则提供了极高的可控性和精度。它们允许用户直接通过参数调整几何形状,实现快速且精准的修改,大大提升了设计的灵活性与可解释性。

CADCrafter就率先尝试了从Image-to-Mesh到Image-to-CAD的范式转变。

方法概述如下:

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

1. 基于VAE与Diffusion Transformer的隐空间生成框架

CADCrafter采用了一种结合VAE与扩散模型的两阶段生成架构

首先,团队训练了一个变分自编码器(VAE),将CAD指令序列映射到一个结构化的隐空间。

接着,在该隐空间中引入条件扩散生成过程:基于Diffusion Transformer(DiT)架构,训练一个扩散生成大模型,输入条件为用户提供的图像,从而实现图像引导下的CAD隐空间采样与生成。

2. 蒸馏策略:从多视图到单视图的高效建模转移

考虑到从单张图像重建CAD模型的挑战性,团队首先构建了一个多视图输入的DiT生成模型,以更稳定地学习图像到CAD空间的映射关系。

随后,通过引入蒸馏机制(使用Ldistill损失),将多视图模型的知识迁移到单视图模型中,从而实现了仅基于单张图像进行高质量CAD生成的能力。

3. 引入基于DPO的可编译性代码检查机制

在CAD生成过程中,CAD指令还需经过CAD内核(CAD Kernel)解析,才能生成可视的3D模型。

然而,若生成指令存在语义错误,例如不闭合曲线等问题,模型构建将直接失败。

为解决这一关键挑战,作者设计了一个代码合理性判别模块,用于判断生成的CAD代码是否能够被成功编译。

作者进一步采用DPO(Direct Preference Optimization)损失,引导模型倾向于生成更可编译、几何结构完整的CAD指令,从而显著提升最终3D模型生成的成功率与实用性。

渲染零件、拍摄的3D打印零件等均能重建

研究团队选取多个标准CAD模型,使用KOKONI SOTA 3D打印机将其打印成实物,并通过拍照获取图像输入。

实验表明,CADCrafter能够基于单张图像,准确生成结构清晰、符合几何特征的CAD建模指令,其生成效果在细节还原度方面优于现有方法。

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

拍摄日常生活中的物体,CADCrafter也能直接生成其设计制造时可用的工程文件,其表面平面度、棱角等细节均符合物体被生产加工制造时的特点(良好表面、尺寸和几何特征均可编辑)

单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品

这一成果不仅展示了CADCrafter在建模精度上的突破,也展现了其在实际应用场景中的可行性。

例如,在制造与维修领域,工程师可通过拍摄现有零件照片,快速生成可编辑的CAD模型,进而加速原型设计或零件重建流程。

团队相信,CADCrafter为AI辅助工业设计提供了新的解决方案,其从Image-to-Mesh到Image-to-CAD的范式转变,有助于推动图像驱动的AI 3D建模向真正可落地应用迈出关键一步。

论文链接:https://arxiv.org/pdf/2504.04753

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 4 月
 123456
78910111213
14151617181920
21222324252627
282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...