学习鲁棒的视觉-语义嵌入以实现可推广的人物再识别

1,489次阅读
没有评论

Learning Robust Visual-Semantic Embedding for Generalizable Person
Re-identification

解决问题:论文旨在解决通用人员再识别中的泛化问题,即在新领域中应用时的性能下降。此问题并非新问题,但之前的方法主要关注视觉表示学习,忽略了语义特征的潜力。

关键思路:论文提出了一种名为MMET的多模态等效变压器,用于在视觉、文本和视觉文本任务中进行更强大的视觉-语义嵌入学习。为了进一步增强变压器上的鲁棒特征学习,引入了一种名为MMM的动态遮罩机制,用于遮盖图像补丁和文本标记,可以联合作用于多模态或单模态数据,并显著提高通用人员再识别的性能。

其他亮点:论文的实验设计充分,使用了多个基准数据集,并在这些数据集上进行了广泛的实验,表现出优异的性能。此外,作者还提供了源代码,以供其他研究人员使用。值得深入研究的工作包括更广泛的实验和更多的数据集测试,以及在其他领域中应用该方法。

关于作者:主要作者包括Suncheng Xiang、Jingsheng Gao、Mengyuan Guan、Jiacheng Ruan、Chengfeng Zhou和Ting Liu。他们分别来自中国科学技术大学和清华大学。他们之前的代表作包括“Deep Spatial-Temporal Neural Networks for Click-Through Rate Prediction”和“Dual-Attention Network for Scene Segmentation”。

相关研究:近期的其他相关研究包括“Generalizable Person Re-Identification with Adversarial Examples”(作者:Xuanyi Dong、Shoumeng Yan和Shengfeng He,机构:南京大学)和“Learning to Transfer: Unsupervised Meta-Domain Translation”(作者:Yifan Ding、Haoxuan You、Yifan Xu和Tong Zhang,机构:浙江大学)。

论文摘要:本文提出了一种名为MMET的多模态等效Transformer,用于更加健壮的视觉-语义嵌入学习,分别针对视觉、文本和视觉-文本任务。为了进一步增强Transformer上下文中的强健特征学习,引入了一种动态遮罩机制,称为遮罩多模态建模策略(MMM),可联合作用于多模态或单模态数据,并显著提高可推广的人员再识别性能。在基准数据集上的广泛实验表明,我们的方法比以前的方法具有竞争性能。我们希望这种方法能够推动视觉-语义表示学习的研究。我们的源代码也公开在https://github.com/JeremyXSC/MMET上。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...