参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

604次阅读
没有评论

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

PointKAN团队 投稿

量子位 | 公众号 QbitAI

架构选择用KAN做3D感知,点云分析有了新SOTA!

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

来自哈尔滨工业大学(深圳)宾夕法尼亚大学的联合团队最近推出了一种基于Kolmogorov-Arnold Networks(KANs)的3D感知解决方案——PointKAN,在处理点云数据的下游任务上展现出巨大的潜力。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

PointKAN与同类产品的比较

替代传统的MLP方案,PointKAN具有更强的学习复杂几何特征的能力。

此外团队还提出PointKAN-elite版本,使用Efficient-KANs结构,在保持准确率的同时显著降低参数量。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

以下是更多详细内容介绍。

为什么要选择KANs

当前多层感知机(MLPs)凭借其高效的特征学习机制,已成为点云分析的基础架构组件。

然而在处理点云复杂几何结构时,MLP的固定激活函数难以有效捕捉局部几何特征,同时存在参数量冗余大、模型效率低下的问题。

而KANs是以Kolmogorov-Arnold表示定理(KART)作为数学依据的一种新颖的神经网络架构,与多层感知机(MLP)结构的最大区别是KANs使用可学习函数替代固定激活函数

KANs使用一维B样条函数作为基函数通过相加和复合运算实现高维复杂函数,为函数拟合提供了一个灵活且可解释的框架。

目前,KANs已初步应用于计算机视觉和医学成像等领域,展现出了有效性和通用性,但在点云分析领域中基于KANs的模型拥有巨大潜力尚未开发。

因此,探索在点云分析任务中有效整合KANs与现有模型的方法,仍是一个重要且有前景的研究方向。

PointKAN框架解析

PointKAN的整体流程如下图所示。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

相比于MLPs,尽管KANs具有更强的高维函数逼近能力和更高的参数效率,但将其适配到3D点云上并非易事。

一方面,KANs的样条激活函数通过离散节点逼近单变量函数,很难充分捕捉局部点云的几何特征,限制了其学习细节特征的能力。

另一方面,每一维输入的激活函数需要存储多个参数,对于大规模网络,KANs的内存需求可能成为瓶颈,并且KANs中使用的B样条函数对于现代硬件上的并行计算未进行优化,导致推理速度较慢。

为了解决上述问题,研究团队提出了PointKAN,其特点是包含几何仿射模块并行结构的局部特征提取模块,以及KANs的高效版本Efficient-KANs来减少内存占用并加快训练和推理速度。

Geometric Affine Module

为了在后续的局部特征提取阶段能得到更加丰富的信息,在这个模块中包含两个部分Group-NormS-Pool

Group-Norm对分组内特征进行归一化、仿射变换和组中心特征传播,整个过程表达如下:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

S-Pool用于对各组特征进行聚合,作为后续模块的输入,对各组点云进行全局信息的补充,考虑到最大池化会导致信息丢失,而S-Pool则最大限度保留组内各点特征信息,数学形式如下:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

Local Feature Processing

对Geometric Affine Module的两部分输出在Local Feature Progress (LFP)中分别使用KAN Block进行并行处理。

在KAN Block中,团队在KAN Layer 后加上深度卷积(DwConv)操作来协助KANs在高维通道信息上学习到丰富的特征表示,整个过程可以被表示为:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

共享的LFP旨在从分组点云中学习到局部特征,在经过最大池化后与从各组中心点云学习到的全局信息相加,使得各组点云最终输出的聚合特征更加丰富。

Global Feature Processing

Global Feature Progress(GFP)由Residual Point(Resp)Block组成,用于提取深度聚合特征。

由于结构中只包含前馈MLP,使得可以在GFP中添加多个重复Residual Point(Resp)Block,整个模型仍然能高效运行。

总的来说,代替使用复杂的局部几何提取结构,PointKAN的一个阶段由Geometric Affine ModuleLocal Feature ProcessingGlobal Feature Processing三部分组成,通过重复的四个阶段来构造一个层次化处理点云的深度网络。

Efficient-KANs结构

KANs中的激活函数是由B样条函数生成的,而B样条函数需要递归计算,这并不适合现代GPU的并行计算架构。

在参数量和计算效率上,每个输入-输出对都有不同的参数和基函数,那么随着KANs中隐藏层宽度的增加,参数量呈指数增长,这也导致了巨大的计算开销和可扩展性问题。

Efficient-KANs很好的解决了这些问题,首先使用有理函数代替B样条函数作为KANs中的基函数,激活函数如下所示:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

其中的参数通过反向传播进行训练。有理函数计算过程简单,非常适合并行计算,提高了模型的计算效率。

另外Efficient-KANs对输入通道进行分组,在组内进行参数共享,来减少参数量和计算量。

下图展示了Efficient-KANs、原始KANs和标准MLP之间的区别。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

实验结果

分类任务

ModelNet40ScanObjectNN数据集上进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

部分分割任务

ShapeNetPart数据集上进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

小样本学习

ModelNet40数据集上采用“n-way, m-shot”范式进行实验。

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

实验结果表明,PointKAN以及PointKAN-elite在各个下游任务上相比于基于MLPs的点云分析架构都有出色的表现,特别是在小样本学习任务上,体现了KANs具有极强的泛化能力和知识迁移能力,更重要的是参数量和FLOPs都有明显的下降。

此外消融实验如下图所示:

参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA
参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA
参数量暴降,精度反升!哈工大宾大联手打造点云分析新SOTA

总结

在本文中,研究人员提出了PointKAN,一种基于Kolmogorov-Arnold网络(KANs)的高效点云分析架构。

相较于基于多层感知机(MLPs)的PointMLP架构,PointKAN在多项任务中均表现出更优性能,充分验证了KANs在提取局部细节特征方面的强大能力。

此外,研究团队还提出了更高效的轻量化版本PointKAN-elite,该版本在保持精度的同时,进一步降低了参数量与计算成本。

团队期待PointKAN能够推动KANs在点云分析领域的应用,充分发挥其相较于MLPs的独特优势。

论文链接:https://arxiv.org/abs/2504.13593
代码链接:https://github.com/Shiyan-cps/PointKAN-pytorch

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 5 月
 1234
567891011
12131415161718
19202122232425
262728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...