PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

227次阅读
没有评论

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

诗科技正式发布了PixVerse V5.5,国内版为拍我AI V5.5。这一新版本标志着 AI 视频从“镜头生成”向自动“讲故事”的进化,进入具备“完整叙事能力”的实用阶段。与以往只能产出单镜头或零散画面的大模型不同,V5.5 可以生成具备叙事结构的短片,甚至接近“成片”质量的视频。

这一版本是继 Sora2 发布后,国内首个实现“分镜 + 音频”一键直出的重大更新,让创作者能够在几秒钟内生成完整的视频故事,而无需再从素材中拼接。

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

AI具备导演思维:多镜头生成和多角色音画同步

V5.5 的核心进步来自于底层模型的全面升级。此次更新首次支持音频(Audio)与多镜头(Multi-shot)同步生成,并强化了多角色音画同步能力。AI 能够根据用户输入的提示词,自动理解并生成完整的故事段落,而非仅仅提供单一镜头的素材。用户只需要输入一个简短的提示,AI 就能完成镜头推进、景别切换、人物对白、环境声和背景音乐的生成,直接呈现一个可被使用的叙事片段。

在拍我AI(PixVerse)中,用户可以在V5.5大模型多镜头和音画同步打开状态下,生成5秒、8 秒、10秒的视频。用户现在可以在提示词(Prompt)里直接控制「音效、台词、音色、音乐、镜头」,AI 能自动理解提示词中的叙事意图,自动设计推拉、摇移、切换、景别变化等镜头语言。AI 的运镜节奏更自然,紧贴真实制作逻辑,带给用户“成为导演”般的创作体验。

V5.5 的智能化程度还体现在它对模糊信息的理解能力上。即使用户只输入“一只小熊在森林里讲笑话”的简单提示词(Prompt),勾选音频( Audio )和多镜头( Multi-shot )后,AI 就能自动生成具有景别变化、搞笑情绪并搭配匹配笑声的完整片段。镜头骨架、情绪走向都由AI自动搭建,让普通人也能以“导演思维”进行表达。

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

从体验角度来看,V5.5 进一步缩短了创作工作流中的时间差。生成速度大幅提升,镜头语言更丰富,控制方式更加直观,使得 C 端用户和创作者都能以更低的门槛,迅速将抽象的灵感变成可观看的成品视频。

音画同步的能力也得到了飞跃性提升。V5.5 成为国内首个可以在一次生成中实现“分镜 + 声音”的 AI 视频生成大模型。画面生成的同时,人物对白、口型、表情、动作、环境声和背景音乐被自动融合,呈现出自然协调的多角色互动。这一能力的实现,使得创作者无需再额外调参或上传音频,便能生成近乎“直出成片”的高质量视频。

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

拍我AI V5.5先导片中运用V5.5多镜头生成段落

拍我AI(PixVerse)海内外创作者社区的测试反馈来看,V5.5 多镜头能力足以改变短视频的创作方式。过去,创作者需要依赖摄影师和剪辑师的配合,才能完成具有“黄金三秒开场节奏”的镜头。现在, AI 就能自动生成这一部分内容。

从图像到视频:一条龙工作流

随着视频生成能力的升级,爱诗科技正在为创作者提供更加完整的AI视频工作流,全流程的一体化制作能力,加上全球最快的1080p生成速度(V5Fast模式下约30秒即可出片),帮助创作者更好地在效率、成本与成片质量取得平衡。

在 PixVerse.ai 和 pai.video 上,用户可以上传多张图片,利用内置的 Nano Banana Pro 模型生成高清图像,并一键转入视频制作流程。平台此前已接入 Qwen-image、Seedream 4.0 和 Nano Banana 等图像模型,为“从图到视频”的生产路径提供基础能力;Nano Banana Pro 的加入进一步提升了图像质量与衔接顺畅度,使整体创作效率显著增强。

过去一个月,爱诗科技还推出了 Swap、Remix 和 Modify 三大视频编辑功能。结合Diffusion + Transformer视频生成大模型和多模态特征融合技术(Fusion),为创作者提供更加自由、自然的编辑体验:

Swap(替换):支持替换视频中的角色、场景与背景,满足影视再创作、品牌 定制与社交娱乐内容的需求;

Remix(二创):从“单向生成”到“互动共创”,允许用户基于他人创作进行二次创 作,推动内容的循环传播。

Modify(精修):基于关键帧编辑的“全视频推理与追踪”方式,用户像修改照片 一样,轻松PS视频,确保跨帧一致、自然衔接。

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

这些能力正在成为新一代创作者的日常工具。今日正式开启预售的电影《比如父子》也与拍我AI合作推出“未完成的对话”项目,通过老照片生成动态影像,帮助用户跨越时间表达情绪,使 AI 视频技术首次进入更具情感价值的场景。

AI 视频正在成为基础设施

从 2023 年成立至今,爱诗科技在两年内完成了五代 PixVerse 模型、八个版本的快速迭代。从基础模型的突破,到功能创新,再到规模化应用,技术与产品的共同演进为 V5.5 的推出奠定了坚实基础。2025 年初,PixVerse V4 曾领先实现 5 秒极速生成高质量视频,并成为全球首家上线“人声+音效”的 AI 视频平台。如今,PixVerse 已成为全球创作者使用 AI 视频生成的首选平台之一,用户规模超过1个亿。

依托“速度快、易上手、创意可控”的产品理念,以及准实时生成、角色驱动视频等核心技术,它正在让 AI 视频真正成为可规模化的内容生产方式,在影像、广告、游戏、营销和社交娱乐等领域不断拓宽应用空间。

拍我AI(PixVerse) V5.5 指向的是一个更普惠的视频创作未来:让更多人能以“导演思维”进行表达。无论是漫剧、玩梗、MV、Vlog、复古影像还是动画与二次元内容,制作成本都被进一步降低。从灵感浮现到看到成片,也许只需要一杯咖啡的时间。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 量子位的朋友们 2025-12-20 13:06:52 来源:量...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 20:49:32 来源:量子位 谁能带来更...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 22:09:18 来源:量子位 2025年...
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...