南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

1,488次阅读
没有评论

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

 

Machine Intelligence Research

近年来,准确的人脸检测技术取得了巨大发展。然而,由于模型庞大、计算成本高,人们难以将多个检测器部署在模型大小和延迟严重受限的移动和嵌入式设备上。南方科技大学于仕琪副教授团队介绍了专门为边缘设备设计的毫秒级无锚点人脸检测器YuNet。在提高效率和准确性的权衡方面,该研究做出了几项重要贡献。首先分析了近年来有影响力的先进人脸检测器,并总结了缩减模型大小的规律。然后介绍了一种轻量级人脸检测器YuNet。该检测器包含一个微小而高效的特征提取骨干网络和一个简化的金字塔特征融合模块。YuNet在准确性和速度之间达到了最佳平衡。YuNet只有75856个参数,不到其他小型检测器的1/5。此外,该研究还提出了一种针对小型人脸检测器的训练策略,可以有效地训练具有相同训练集分布的模型。所提出的YuNet在WIDER FACE验证集最难的数据上实现了81.1%的mAP(单尺度),推理效率极高(英特尔 i7-12700K:320×320分辨率下每帧 1.6毫秒)。由于其独特的优势,YuNet 及其前身的资源库在GitHub上很受欢迎,获得了超过11000个点赞,并被OpenCV Model Zoo采纳。

论文中介绍的YuNet网址为:

https://github.com/ShiqiYu‍/libfacedetection

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

 

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

图片来自Springer

全文下载:

YuNet: A Tiny Millisecond-level Face Detector

Wei Wu, Hanyang Peng, Shiqi Yu

https://link.springer.com/article/10.1007/s11633-023-1423-y

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1423-y

 

全文导读

几十年来,人脸检测一直是计算机视觉领域的一个热门话题。人脸识别、人脸美化、人脸对齐、人脸跟踪等许多与人脸相关的应用都离不开人脸检测这一前提步骤。给定图像后,人脸检测通过边界框定位人脸区域。为了提高人脸检测性能,人们提出了很多方法,从早期的手工特征到现在的基于CNN的特征。

 

人脸检测的难度低于一般物体检测。在具有挑战性的基准WIDER FACE上,人脸检测准确率达到了饱和状态。有些人可能认为人脸检测问题已经解决。然而,事实并非如此。准确率排名靠前的几种方法都使用了大型预训练骨干网络、复杂的特征增强模块和大量测试时间增强(TTA),以获得更好的排名。例如,最好的检测器之一Mog-face使用了711M参数和808 GFLOPs(VGA 图像),达到了最高的准确度。只有消耗大量存储和计算资源,才会有较高的精确度。

 

然而,在现实世界的应用中,人脸检测被广泛用于在手机、服务类机器人、监控摄像头和物联网(IoT)设备等边缘设备上。由于成本原因,这些设备的存储资源和计算能力有限。此外,在许多应用场景中,设备只需要检测几个明显的人脸,而背景中的微小人脸通常是不需要的。即使是应用在中央服务器中,快速高效的检测器也能节省大量能源,并使服务器同步处理大量数据。与能在某些基准测试中略微提高平均精度(AP)的大型人脸检测器相比,人们急需高效的微型人脸检测器。

 

人脸检测器中的骨干网络对检测器的性能至关重要。VGGNet 系列中的VGG-16、ResNet系列中的ResNet- 50/101/152,以及MobileNet等一些常见的骨干网络,最初都是为ImageNet 的图像分类而设计的。如图 1 所示,人脸检测不同于图像分类,后者将最深层的输出作为特征向量。为了处理不同尺度的物体,需要使用不同层的不同特征图进行检测。由于信息丰富,大型人脸更容易检测。此外,大的人脸通常是从较深的特征图中检测出来的,比小的人脸更容易检测。这明显说明,在人脸检测中,主干应侧重于小的人脸。

 

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器 图1 为了处理不同大小的人脸,通常会从较深的特征图中检测出大人脸,而从较浅的特征图中检测出小人脸,因为不同特征图上的像素具有不同的视野。

 

还应该注意到人脸尺寸的分布。在WIDER FACE数据集中,大多数人脸都很小,且小于20 像素。许多与人脸相关的应用也有类似情况。许多数据增强操作,尤其是随机裁剪,都会改变人脸尺寸的分布。如果用不同分布的数据集(图2中的分布A、B和C)来训练模型,平均精度会明显下降。离原始分布越远,平均精度越低。

 

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

图2 如果用不同分布的数据集(A为红线,B为绿线,C为蓝线)来训练模型,平均精度会明显下降。离原始分布越远,平均精度越低。

 

本文以下部分将介绍一种微型毫秒级人脸检测器: YuNet。本文的贡献如下。

1) 根据本文作者对人脸检测的独特理解,本文设计了一个微型人脸检测器,它的参数数量非常有限,延迟非常低,精度也很高。

2) 本文提出了一种用于模型训练的数据采样策略。这种策略可以明显提高深度检测器,尤其是轻量级检测器的精度。

3) 本文所提出的YuNet应该是最好的微型人脸检测器,它在WIDER FACE验证硬集上的平均精度达到了81.1%,并因其有效性在GitHub.com上获得了超过11000次点赞。

 

全文下载:

YuNet: A Tiny Millisecond-level Face Detector

Wei Wu, Hanyang Peng, Shiqi Yu

https://link.springer.com/article/10.1007/s11633-023-1423-y

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1423-y

BibTex:

@Article{MIR-2022-09-275,
author = {Wei Wu and Hanyang Peng and Shiqi Yu},
journal = {Machine Intelligence Research},
title = {YuNet: A Tiny Millisecond-level Face Detector},
year = {2023},
volume = {20},
number = {5},
pages = {656-665},
doi = {10.1007/s11633-023-1423-y}
}

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

 

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://www.wjx.cn‍/vm/eIyIAAI.aspx#  

 

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选”中国科技期刊卓越行动计划”,已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。

 

 


好文推荐

乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法
西电公茂果团队 | 综述: 多模态数据的联邦学习
高文院士团队 | 综述: 大规模多模态预训练模型
前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究
港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法
南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)
Luc Van Gool团队 | 深度学习视角下的视频息肉分割
专题综述 | 高效的视觉识别: 最新进展及类脑方法综述
北大黄铁军团队 | 专题综述:视觉信息的神经解码
专题综述 | 迈向脑启发计算机视觉的新范式
专题好文 | 新型类脑去噪内源生成模型: 解决复杂噪音下的手写数字识别问题
戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络
ETH Zurich重磅综述 | 人脸-素描合成:一个新的挑战
华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算
东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法
联想CTO芮勇团队 | 知识挖掘:跨领域的综述
复旦邱锡鹏团队 | 综述:自然语言处理中的范式转换

 


往期目录

2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习……
2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习… 
2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调
2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测… 
2022年第6期 | 因果推理、视觉表征学习、视频息肉分割…
2022年第5期 | 重磅专题:类脑机器学习
2022年第4期 | 来自苏黎世联邦理工学院Luc Van Gool教授团队、清华大学戴琼海院士团队等
2022年第3期 | 聚焦自然语言处理、机器学习等领域;来自复旦大学、中科院自动化所等团队
2022年第2期 | 聚焦知识挖掘、5G、强化学习等领域;来自联想研究院、中科院自动化所等团队
主编谭铁牛院士寄语, MIR第一期正式出版!

 


MIR资讯

2022影响因子发布!人工智能领域最新SCI & ESCI期刊一览
主编谭铁牛院士主持,MIR第二次国内编委会议圆满召开
喜报 | MIR入选图像图形领域 T2级 “知名期刊”!
2023年人工智能领域国际学术会议参考列表 | 机器智能研究MIR
恭喜!MIR 2022年度优秀编委
双喜!MIR入选”2022中国科技核心期刊”,并被DBLP收录 | 机器智能研究MIR
报喜!MIR入选2022年国际影响力TOP期刊榜单
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录

南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器

 

 

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 10 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...