场景理解的分解神经表示法

1,345次阅读
没有评论

Factored Neural Representation for Scene Understanding

解决问题:本文旨在解决场景理解中的一个长期目标,即获得可解释和可编辑的表示形式,该表示形式可以直接从原始单目RGB-D视频中构建,而不需要专门的硬件设置或先验知识。该论文的目标是在多个移动和/或变形物体存在的情况下实现这一目标。

关键思路:本文提出了一种分解的神经场景表示法,可以直接从单目RGB-D视频中学习,以生成具有显式编码对象运动(例如刚性轨迹)和/或变形(例如非刚性运动)的对象级神经表示。相比当前领域的研究状况,该论文的创新点在于使用了神经隐式表示和辐射场,并且可以进行端到端优化,以共同捕捉几何、外观和物体运动。

其他亮点:本文的实验结果表明,该表示方法是高效、可解释和可编辑的,并且可以用于改变对象轨迹。作者提供了一个项目网页,其中包括实验数据和代码。

关于作者:本文的主要作者是Yu-Shiang Wong和Niloy J. Mitra。Yu-Shiang Wong是新加坡国立大学的博士研究生,他在计算机图形学和计算机视觉方面有多年的研究经验。Niloy J. Mitra是伦敦帝国学院计算机科学系的教授,他的研究兴趣包括计算机图形学、计算机视觉和计算机辅助设计。他们之前的代表作包括:“Learning to Reconstruct 3D Manhattan Wireframes from a Single Image”和“Unsupervised Discovery of Parts, Structure, and Dynamics”。

相关研究:近期其他相关的研究包括:“NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis”(Mildenhall等人,UC Berkeley)和“GRAF: Generative Radiance Fields for 3D-Aware Image Synthesis”(Lombardi等人,Facebook AI Research)。

论文摘要:这篇论文的一个长期目标是获得可解释且可编辑的表示形式,这些表示形式可以直接从原始单目RGB-D视频中构建,无需特殊的硬件设置或先验知识。在存在多个移动和/或变形对象的情况下,这个问题变得更加具有挑战性。传统方法采用一些简化方法、场景先验、预训练模板或已知变形模型来解决这个问题。神经表示法的出现,特别是神经隐式表示法和辐射场,开启了通过端到端优化来共同捕捉几何、外观和物体运动的可能性。然而,目前的方法产生全局场景编码,假设多视角捕捉并且场景中的运动受到限制或没有运动,而且不能方便地进行新视角合成之外的易于操作。在这项工作中,我们介绍了一种分解的神经场景表示法,可以直接从单目RGB-D视频中学习,以产生具有显式编码物体运动(例如刚性轨迹)和/或变形(例如非刚性运动)的对象级神经表示。我们在合成和真实数据上对我们的方法进行了评估,以证明该表示方法高效、可解释且可编辑(例如更改物体轨迹)。该项目网页可在以下链接中访问:$href{https://yushiangw.github.io/factorednerf/}{text{link}}$。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...