
速途网消息,北京时间4月22日凌晨,OpenAI 在毫无征兆的情况下,甩出了一张王炸——ChatGPT Images 2.0。

上线不到24小时,它就在大模型竞技场(LMArena)的文本生图任务中,以断层式的评分差距登顶全球第一,领先第二名Nano Banana 2高达241分(1512分 vs 1271分)。

在以前,AI生图最大的痛点是——不可控。但Images 2的逻辑不是直接“画”,而是先“思考”,分析任务本身。当你在ChatGPT中启用Thinking模型时,Images 2.0会做以下几步:联网检索信息 → 规划图像结构 → 推理布局 → 最后下笔。
OpenAI创始人山姆·奥尔曼在直播中直言:“从gpt-image-1到gpt-image-2的飞跃,相当于从GPT-3跳到GPT-5。”

目前,GPT Images 2 在所有 7 个文本转图像类别中均排名第一,全面超越了排名第二、带有网络搜索功能的 Nano banana 2。
即使是同样的提示词,在GPT Images 2和Nano Banana 2上的表现也完全不同,比如我们给出“多米诺骨牌活动,练习乘法”。下图中左侧为Nano Banana 2的输出,右侧为GPT Images 2的输出。

可以看出,GPT Images 2精准理解了“练习”这个词指向的教育场景,需要的是教学材料。而Nano Banana 2给出的画面是一堆小孩围坐在桌子旁,手里拿着带点数的骨牌,整体氛围像在玩桌游。它捕捉到了“骨牌”和“活动”这两个表层元素。
然而,GPT Images 2的可怕之处远不止文字渲染,它对数字世界视觉规律的掌握才真正夸张。速途网将Images 2与Gemini Nano Banana 2 进行了一些场景的对比。具体如下:
对比案例一:老相片风格提示词:帮我生成一张,爷爷奶奶在看报纸的样子,2000年前后的画风。
对比:左图为Nano Banana 2生成,虽然清晰但AI创作、润色的比重极高,不像是长辈们在过去会拍出来的真实照片;右图为Images 2生成,照片整体风更有年代感,人物状态、环境都高度还原。

提示词:生成一张中国的物理试题图片,要有作答、批改痕迹,有对有错,试卷也可以有一些折叠痕迹。有铅笔写的试卷主人的碎碎念。
对比:左图为Nano Banana 2生成,但试卷的折叠痕迹不明显、碎碎念笔记跳脱出图,摆在课桌上的协调性欠佳;右图为Images 2生成,试卷的痕迹、碎碎念的铅笔笔迹、给大家一种秒回“学生时代”的感觉。

提示词:生成一张李白的《行路难》在教室黑板上的粉笔书写图片。字体为普通人的工整风格。
对比:左图为Nano Banana 2生成,文字更偏向打印体、周边微露的教室和课桌反而降低了真实性,与实际摆置完全相反;右图为Images 2生成,粉笔痕迹、黑板光影等,更像是实拍的感觉。

可以看出,Images 2的效果整体上远超于Nano Banana 2,当用户输入的提示词文本有限时,更贴近用户的真实意图,场景更逼近真实、更像是取自一张手机拍照/截屏。
过去几个月,外界吐槽OpenAI挤牙膏、Sora关闭、被Gemini压制……仿佛那个不可一世的AI霸主真的变菜了。
但今天 GPT Images 2.0 的出现,是一次响亮的回击。它把Nano Banana最引以为傲的文字渲染能力直接碾压,把“思考能力”首次引入图像生成,把多图一致性这个行业难题彻底解决。
目前,GPT Images 2.0 基础功能对所有ChatGPT免费用户开放,这意味着每个人现在都可以去体验这款“登顶第一”的生图模型。
可以说,“全民艺术家”的时代正式来临,而当一个AI能随手生成一张以假乱真的数学试卷、能完整复刻抖音直播间的每一个UI按钮时,我们也不得不承认:那个“有图有真相”的年代,是真的回不去了。