一拳撂倒“香蕉人” ！GPT Images 2.0实测

速途网消息，北京时间4月22日凌晨，OpenAI 在毫无征兆的情况下，甩出了一张王炸——ChatGPT Images 2.0。

上线不到24小时，它就在大模型竞技场（LMArena）的文本生图任务中，以断层式的评分差距登顶全球第一，领先第二名Nano Banana 2高达241分（1512分 vs 1271分）。

在以前，AI生图最大的痛点是——不可控。但Images 2的逻辑不是直接“画”，而是先“思考”，分析任务本身。当你在ChatGPT中启用Thinking模型时，Images 2.0会做以下几步：联网检索信息 → 规划图像结构 → 推理布局 → 最后下笔。

OpenAI创始人山姆·奥尔曼在直播中直言：“从gpt-image-1到gpt-image-2的飞跃，相当于从GPT-3跳到GPT-5。”

目前，GPT Images 2 在所有 7 个文本转图像类别中均排名第一，全面超越了排名第二、带有网络搜索功能的 Nano banana 2。

即使是同样的提示词，在GPT Images 2和Nano Banana 2上的表现也完全不同，比如我们给出“多米诺骨牌活动，练习乘法”。下图中左侧为Nano Banana 2的输出，右侧为GPT Images 2的输出。

可以看出，GPT Images 2精准理解了“练习”这个词指向的教育场景，需要的是教学材料。而Nano Banana 2给出的画面是一堆小孩围坐在桌子旁，手里拿着带点数的骨牌，整体氛围像在玩桌游。它捕捉到了“骨牌”和“活动”这两个表层元素。

然而，GPT Images 2的可怕之处远不止文字渲染，它对数字世界视觉规律的掌握才真正夸张。速途网将Images 2与Gemini Nano Banana 2 进行了一些场景的对比。具体如下：

对比案例一：老相片风格

提示词：帮我生成一张，爷爷奶奶在看报纸的样子，2000年前后的画风。

对比：左图为Nano Banana 2生成，虽然清晰但AI创作、润色的比重极高，不像是长辈们在过去会拍出来的真实照片；右图为Images 2生成，照片整体风更有年代感，人物状态、环境都高度还原。

对比案例二：物理试卷生成

提示词：生成一张中国的物理试题图片，要有作答、批改痕迹，有对有错，试卷也可以有一些折叠痕迹。有铅笔写的试卷主人的碎碎念。

对比：左图为Nano Banana 2生成，但试卷的折叠痕迹不明显、碎碎念笔记跳脱出图，摆在课桌上的协调性欠佳；右图为Images 2生成，试卷的痕迹、碎碎念的铅笔笔迹、给大家一种秒回“学生时代”的感觉。

对比案例三：名作古诗板书

提示词：生成一张李白的《行路难》在教室黑板上的粉笔书写图片。字体为普通人的工整风格。

对比：左图为Nano Banana 2生成，文字更偏向打印体、周边微露的教室和课桌反而降低了真实性，与实际摆置完全相反；右图为Images 2生成，粉笔痕迹、黑板光影等，更像是实拍的感觉。

可以看出，Images 2的效果整体上远超于Nano Banana 2，当用户输入的提示词文本有限时，更贴近用户的真实意图，场景更逼近真实、更像是取自一张手机拍照/截屏。

过去几个月，外界吐槽OpenAI挤牙膏、Sora关闭、被Gemini压制……仿佛那个不可一世的AI霸主真的变菜了。

但今天 GPT Images 2.0 的出现，是一次响亮的回击。它把Nano Banana最引以为傲的文字渲染能力直接碾压，把“思考能力”首次引入图像生成，把多图一致性这个行业难题彻底解决。

目前，GPT Images 2.0 基础功能对所有ChatGPT免费用户开放，这意味着每个人现在都可以去体验这款“登顶第一”的生图模型。

可以说，“全民艺术家”的时代正式来临，而当一个AI能随手生成一张以假乱真的数学试卷、能完整复刻抖音直播间的每一个UI按钮时，我们也不得不承认：那个“有图有真相”的年代，是真的回不去了。

DC娱乐网