阿里开源全新图像模型Qwen-Image-Layered,可实现PS级图层精准编辑生成

91次阅读
没有评论

阿里开源全新图像模型Qwen-Image-Layered,可实现PS级图层精准编辑生成

视觉大模型从“像素预测”转向“结构重组”

12月22日,阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成

千问新模型采用自研创新架构,可将图片“拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎“零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。

Qwen-Image-Layered打破了主流视觉大模型的“扁平式思维”,模型通过“分层”和“补全”建立起对现实世界更准确的“物理式理解”,让AI从平面的“看图说话”迈向真实的“空间重构”。

阿里开源全新图像模型Qwen-Image-Layered,可实现PS级图层精准编辑生成

在当前的视觉大模型领域,图像一致性编辑始终是一个核心挑战。AI生图有创意但难编辑,主要是因为大模型对图片的理解是扁平的,是一堆像素点紧密耦合在一起,而不能像人一样感知出图中物体的远近、遮挡等物理关系。

因此,让大模型生图和编辑就像抽卡“开盲盒”:比如你想把画里的猫往左挪10厘米,但AI完全不知道猫左挪后空出来的背景会有什么,只能再重新生成一次,猫和背景全都变了样。

这种“牵一发而动全身”的随机性,让AI绘图在追求极致精准的商业广告设计、UI界面设计、影视后期处理等专业领域,始终只能作为一种参考,而无法真正取代专业工具。

Qwen-Image-Layered 的出现,意味着视觉大模型从“像素预测”转向“结构重组”。

千问团队自研了一种全新的RGBA-VAE编码,在传统的RGB图像中引入代表透明度图层的“Alpha通道”,让模型有了图层的概念;同时新模型采用了创新的VLD-MMDiT架构,配合独特的“图层级3D位置编码”,让AI自动“脑补”被遮挡部分的背景纹理,实现对图层和空间的更深入理解和生成。

据了解,为训练这种能力,千问团队从海量的专业Photoshop(PSD)文件中提取真实图层逻辑,让AI从出生起就拥有专业设计师的“分层思维”。

阿里开源全新图像模型Qwen-Image-Layered,可实现PS级图层精准编辑生成

Qwen-Image-Layered模型架构图

业内人士指出,千问新模型将为创意产业带来实质性变革。AI生图不再是死板一块,而成为一个活生生的、可无限调整的素材库;图片编辑也不再需要复杂精细的人工抠图,而是AI原生地实现了“内在可编辑性”,设计师、动画和影视制作人员可在保持背景或主体完全不变的前提下,对特定图层的构件进行位移、缩放或重绘,显著提升数字内容创作的生产效率。

据了解,Qwen-Image-Layered已在魔搭社区和HuggingFace开源,开发者和企业可免费下载商用。截至目前,阿里已开源近400个千问模型,全球下载量突破7亿次,衍生模型数超18万个,是全球第一的开源模型。通义大模型已服务超100万家客户,在中国企业级大模型调用市场中通义位居第一,是中国企业选择最多的大模型。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE 闻乐 2025-12-14 14:2...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026 西风 2025-12-13 12:5...
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了 鹭羽 2025-12-13 22:43:25 来源...
美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型 鹭羽 2025-12-13 22:41:00 来源:量子位 三连发:真实场景...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026 西风 2025-...