反超Nano Banana!OpenAI旗舰图像生成模型上线

227次阅读
没有评论

反超Nano Banana!OpenAI旗舰图像生成模型上线

Jay 发自 凹非寺量子位 | 公众号 QbitAI

OpenAI的红色预警,还在发力。

憋了大半年的图像生成模型——GPT-Image-1.5,终于发布。

官方表示,本次更新主要有四个亮点:

  • 更严谨的指令遵循;
  • 精确编辑;
  • 细节保留;
  • 速度比以前快4倍。

感觉……这是要全面对标Nano Banana了啊。

目前的玩法也很类似。比如,将汽车颜色改为橙色。

反超Nano Banana!OpenAI旗舰图像生成模型上线

拯救这个被烤焦的饼。

反超Nano Banana!OpenAI旗舰图像生成模型上线

根据奶昔架、芝士汉堡等元素,做一个复古风格的餐馆广告。

反超Nano Banana!OpenAI旗舰图像生成模型上线

指令遵守和精确编辑方面,的确比之前强了不少。

而且今天就能用上了,GPT-Image-1.5将在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5推出。

OpenAI最强图像生成模型

被谷歌一轮正面「拷打」之后,OpenAI藏了大半年的GPT-Image-1.5,终于憋不住了。

这个旗舰级图像生成模型,主打精准编辑、细节保留,图像生成速度最高提升4倍。所有改进,都指向同一个产品理念——实用性

编辑图像时,GPT-Image-1.5对指令的遵循更加严谨:光照、构图、人物外观等关键要素,能够在输入、输出及多轮编辑中保持高度一致。

例如:生成一张2000年代胶片相机风格的照片,画面中两名男子和一条狗出现在孩子的生日派对上,神情略显无聊。

反超Nano Banana!OpenAI旗舰图像生成模型上线

在不改变原始画面结构的前提下,还可以「加戏」,邀请一群小朋友入镜捣蛋,整体风格与细节依然能保持一致。

反超Nano Banana!OpenAI旗舰图像生成模型上线

在图像风格层面,真实感也有了明显提升。比如下面这个Prompt

拍摄一张20世纪70年代伦敦切尔西的场景照片,画面要逼真,所有景物清晰对焦,人群密集,还有一辆公交车,车身贴着「ImageGen 1.5」的广告,广告上印有OpenAI标志和「创造你的想象」的副标题。整体风格像业余摄影作品,iPhone快照画质……

左边是新模型,右边是旧模型,差距还是挺明显。

反超Nano Banana!OpenAI旗舰图像生成模型上线

即便是更偏创意的任务,同样能够稳定保留关键信息与人物特征。

根据这两位男士的图片,制作一张名为《Codex》的好莱坞黄金时代电影海报。演员姓名改为Wojciech Zaremba(左)和Greg Brockman(右),由奥特曼执导,菲吉·西莫制片,AGI影业出品。

反超Nano Banana!OpenAI旗舰图像生成模型上线

创作一张深海生物在不同深度的海报,采用垂直海洋剖面图,风格为精美细致的日式动漫风格。

反超Nano Banana!OpenAI旗舰图像生成模型上线

前段时间,Nano Banana在答题卡上写「小作文」的能力火爆全网。GPT也能实现了。

这次,GPT-Image-1.5在文本渲染上进步明显,能够处理更密集、更小字号的文字。甚至可以根据给定资料,直接把GPT-5.2的技术报告做出来了。

反超Nano Banana!OpenAI旗舰图像生成模型上线

除了模型能力的升级,产品形态也随之调整。

OpenAI在ChatGPT中新增了专门的图片板块,内置数十种滤镜与Prompt,可通过App侧边栏或官网直接访问。

来到Benchmark环节,自然少不了「秀肌肉」。

评测机构Artificial Analysis指出,GPT-Image-1.5在文本转图像图像编辑方面中均位列第一,超过Nano Banana Pro。

反超Nano Banana!OpenAI旗舰图像生成模型上线

不过,在更强调精细化图像编辑能力的GenAI Image Editing Showdown中,GPT-Image-1.5仍未能反超谷歌。

但值得注意的是,其指令遵守率高达90%,断层式领先

反超Nano Banana!OpenAI旗舰图像生成模型上线

按照OpenAI的说法,该模型将于今日起面向全球所有ChatGPT用户与API用户全面开放。

定价方面,GPT-Image-1.5的API相较上一代GPT Image 1,输入与输出成本整体下降20%。

具体价格因分辨率而异:

  • 高质量图像约为每千张133美元;
  • 低质量图像约为每千张9美元。

不得不说,这波谷歌立大功。(doge)

世界理解,还得看香蕉?

「精细编辑+降价」,OpenAI这次,看来是铁了心要把图像功能推向生产力工具。

新模型发布后,曾任微软AI副总裁、现就职于OpenAI的Sebastien Bubeck也第一时间下场,为GPT-Image-1.5站台。

反超Nano Banana!OpenAI旗舰图像生成模型上线

但质疑也随之而来。

有网友指出,GPT-Image-1.5在「理解世界」这一层面,似乎仍不如Nano Banana:

问题太多了。左边球体中的「线」是由三个不相连的环组成,每个方程式都有错……像是在凭感觉做数学题?

反超Nano Banana!OpenAI旗舰图像生成模型上线

对此,Sebastien Bubeck解释道:

这只是做着玩的,如果是正式海报,肯定会在此基础上迭代。

反超Nano Banana!OpenAI旗舰图像生成模型上线

事实上,对GPT-Image-1.5世界理解能力的质疑,并非个例。

AI社区的知名「内部」人士,Jimmy Apples在评测后直言:

相比上一代提升很大,但不如香蕉聪明。

反超Nano Banana!OpenAI旗舰图像生成模型上线

具体而言,他认为:如果只是创意性工作,影响不大;但如果是做PPT,GPT-Image-1.5给出的图片可能会有信息错误。

Nano Banana感觉更像一个世界模型。

参考链接:
[1]https://x.com/ArtificialAnlys/status/2001016199094948185?s=20
[2]https://x.com/SebastienBubeck/status/2001038641469194588?s=20
[3]https://x.com/apples_jimmy/status/2001053915278926228?s=20
[4]https://genai-showdown.specr.net/image-editing
[5]https://openai.com/index/new-chatgpt-images-is-here/

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书

首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书

首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书 Jay 2026-01-07 15:24:04...
悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 闻乐 2026-01-05 19:...
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛 闻乐 2026-01-06 09:09:0...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...