体验完整Gemini

Google官网体验Gemini

北大 | GestureDiffuCLIP: 采用CLIP潜变量的手势扩散模型

2,057次阅读

没有评论

【推荐理由】本文提出GestureDiffuCLIP，一个神经网络框架，用于合成具有灵活风格控制的逼真风格化共同语言手势。

GestureDiffuCLIP: Gesture Diffusion Model with CLIP Latents
TENGLONG AO, ZEYI ZHANG, LIBIN LIU

[Peking University & National Key Lab of Genaral AI]

【论文链接】https://arxiv.org/pdf/2303.14613.pdf

【Demo链接】https://www.youtube.com/watch?v=Psi1IOZGq8c

【摘要】最近，针对自动生成风格化共同语言手势的研究引起了越来越多的关注。先前的系统通常允许通过预定义的文本标签或示例动作片段进行风格控制，但这些方法通常不足以准确地传达用户的意图。本文提出GestureDiffuCLIP，一个神经网络框架，用于合成具有灵活风格控制的逼真风格化共同语言手势。我们利用大规模对比语言图像预训练（CLIP）模型的能力，并提出了一种新的CLIP引导机制，从多个输入模态中提取有效的风格表示，如文本片段、示例动作片段或视频。该系统学习了一个潜在扩散模型，以生成高质量的手势，并通过自适应实例归一化（AdaIN）层将CLIP风格表示注入到生成器中。作者还设计了手势-转录对齐机制，以确保基于对比学习的语义正确手势生成。本系统也可以扩展到允许对个体身体部位进行细粒度的风格控制。作者进行了广泛的示例，展示了该模型对各种风格描述的灵活性和普适性。在用户研究中，展示了该系统在人类相似度、适当性和风格正确性方面优于最先进的方法。

北大 | GestureDiffuCLIP: 采用CLIP潜变量的手势扩散模型

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AR RSS 视频设计

发表至：智源

2023年3月28日

ChatGPT发癫已读乱回，网友：“高速运转的机械”AI版？

揭开Groq LPU神秘面纱：世界最快硬件加速器的底层架构设计！

共享老刘说NLP技术社区：专注底层原理、前沿技术、知识分享的知识社区对外纳新

Nature发文：室温超导体将如何改变科学？

重磅！企业微信加好友要收钱了！

EVA-CLIP：提升CLIP大规模语言模型的训练技巧

评论（没有评论）

2023 年 3 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 3 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31