腾讯图生视频全面开源,更懂物理规律,一手实测来了

999次阅读
没有评论

腾讯图生视频全面开源,更懂物理规律,一手实测来了

全网疯狂试玩ing

就在刚刚,腾讯版Sora补齐了又一重要拼图——图生视频

而且还是熟悉的配方,和去年12月发布的文生视频模型HunyuanVideo一样,发布即开源

腾讯图生视频全面开源,更懂物理规律,一手实测来了

那么,此次上新的「图生视频」到底有多强呢?

有网友直接用它制作了一部电影

腾讯图生视频全面开源,更懂物理规律,一手实测来了

可以看到,新功能在画质、物体一致性等方面有了很大提升。

目前该功能已上线腾讯混元AI视频,人人都可免费体验(有次数限制)。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

话不多说,量子位一手实测走起~

实测腾讯混元「图生视频」

有一说一,图生视频这项功能本身在视频AI领域已不新奇,但难的是生成效果好。

而在各位玩家狂卷生成效果的途中,一些老大难问题逐渐“露面”,并成为检验和驱动视频AI进化的法宝。

所以,为了直观展示腾讯版Sora的「图生视频」能力,我们直接从这些难题入手。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

难题1:是否符合现实物理规律

众所周知,从视频AI诞生至今,生成符合现实物理规律的视频堪称行业难题。

一不小心就各种手脚满天飞,让人直呼恐怖:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

所以这第一关,我们直接来个大招——让腾讯混元视频AI还原运动员跳水

而且为了整活儿,选取的原图就有“炸鱼”的倾向了(doge):

(右侧为AI生成的原图和提示词,选取2K视频)

腾讯图生视频全面开源,更懂物理规律,一手实测来了

最终效果be like:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

首先,为了保证画质,我们一开始就特意选了「2K视频」(默认为高品质),并选择更通用的混元图生1.0(另一个针对人像优化)。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

从结果可以看到,整体画面还是比较高清的,随手一截都有点像体育频道报道。

质量上,相比早期的“手脚乱飞”也明显有很大进步,一眼看去没有明显错误。

然鹅,如果要拿放大镜来看,一些细节还是经不起推敲。

比如运动员左手的大小比例在下面这个瞬间有点问题,手掌明显过宽;另外手势在变换的过程中,抠图感明显,能从这里看出视频由AI生成。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

所以,要想实现100%还原真实物理规律,大噶还得加油啊~

BTW,虽然生成的视频目前只有5秒,但不难想见这位小哥落水时即将炸鱼了。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

难题2:能否“无中生有”

Okk,难题继续。

为了考验视频生成AI的可控性,我们来看这样一张原图:(草原上没有一只动物)

腾讯图生视频全面开源,更懂物理规律,一手实测来了

输入prompt,“图中出现了一匹马”,最终结果如下:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

可以看到,视频中确实出现了一匹白色骏马在草原上慢慢行走。

除此之外,我们继续搬出大家心心念念的一个功能来挑战——在画面中生成文字(中文或英文)。

个人多次实测后发现,目前暂时无法在视频中凭空生成文字(大家有成功案例可以在评论区补充)。

不过也有一种间接方法能够实现:先在图片中生成文字(可以用腾讯豆包AI的画图功能),再将图片转换成动态视频。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

嗯,也是给量子位打上了赛博广告(doge)~

腾讯图生视频全面开源,更懂物理规律,一手实测来了

所以,在让视频“无中生有”这方面,除了添加文字不可控,其他元素已经可以轻松拿捏了。

难题3:能否准确遵循指令

接下来,图片搭配文字提示词,也能用来考察视频生成AI是否理解用户意图了。

腾讯混元视频AI,在上传图片后,可以通过正面(想要哪些画面)和反面(不想要哪些)提示词来设计整个画面。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

这里我们又拿腾讯混元视频的“独家艺能”来测试。早在文字生成视频的功能发布后,他们就主推了在画面主角保持不变的情况下自动切镜头的这项功能,当时号称这是业界大部分模型所不具备的能力。

所以,我们这次的prompt如下:

一位外国美女穿着汉服,头发飘扬,背景是长城,然后镜头切换到正面特写。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

最终生成结果如下:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

乍看之下,镜头从侧脸切换到正脸衔接挺自然,连发丝都始终在空中飘扬。

但是一抠细节,后来的黄色发夹有点突兀了,所以在整体一致性上仍有完善空间。

难题4:能否保证连贯一致性

当然,光是准确还原指令还不够,更重要的是要让所有元素自然铺开。

换句话说,还要考察图片转化成视频后的动作、场景过渡是否自然流畅,有无明显的卡顿、跳跃或不连贯的情况。

嗯,依旧上难度——镜子题材下的运动一致性考验

穿着白床单的幽灵面对着镜子。镜子中可以看到幽灵的倒影。幽灵位于布满灰尘的阁楼中,阁楼里有老旧的横梁和被布料遮盖的家具。阁楼的场景映照在镜子中。幽灵在镜子前跳舞。电影氛围,电影打光。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

最终效果如下:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

一般来说,镜子题材可以用来考验模型对光影的理解,以及镜子内外主体运动是否能保持一致。

而上面这个生成效果着实惊艳,当身披白床单的幽灵“手舞足蹈”时,镜子里的动作非常一致,而且连地上的光影变换也非常符合物理规律。

整体看起来相当丝滑~

Okk,几个堪称最难的测试到此告一段落。实测下来,腾讯混元的「图生视频」新功能在这些最难挑战上有了很大进步,但离100%符合物理规律和完全一致性仍有一段距离。

最后附上来自官方的写prompt小tips:

用法1:提示词 = 主体+动作 (相对简短的表述效果更优)

主体:视频的主要表现对象要与与输入图片一致,可以为人、动物、植物、物品等,简单描述即可,比如一个女孩、一个熊猫等。

动作:对主体动作或状态的描述,用词建议简单且清晰具体,最好有动态感,比如戴眼镜->用手戴上眼镜,喝水->用手举起杯子喝水。

用法2:提示词 = 主体+动作 +运镜方式

运镜方式:镜头的运动方式,比如静止镜头、镜头平移向右,镜头缩放等。

腾讯图生视频全面开源,更懂物理规律,一手实测来了

网友疯狂试玩ing

与此同时,网友们的第一波鲜测也出炉了:

腾讯图生视频全面开源,更懂物理规律,一手实测来了

感兴趣的童鞋可以玩起来了~

在线免费体验:
https://video.hunyuan.tencent.com/

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 3 月
 12
3456789
10111213141516
17181920212223
24252627282930
31  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...