BY 媒介360
2026年4月22日,OpenAI在几乎没有任何预告的情况下,发布了ChatGPT Images 2.0模型,这是其首次将“思考能力”引入图像生成领域的重要升级。
在此之前,OpenAI在视觉生成领域似乎经历了一段漫长的静默期,主力生图模型GPT-Image-1.5在画质、排版和文本处理方面已显老态,而竞争对手却在持续迭代。然而,Images 2.0的登场迅速改变了这一格局,在知名大模型盲测平台LM Arena的Text-to-Image排行榜上,它以1512分的超高分空降榜首,领先第二名整整242分——这个分数差在头部模型之间通常只有个位数的情况下,堪称“代差碾压”。
OpenAI官方将此次升级形容为“从GPT-3到GPT-5的一次跃迁”,但Images 2.0的真正意义远不止于画质的提升。当图像生成模型第一次能够“思考”——在落笔之前先规划构图,生成之后自我检查,必要时联网搜索补充信息——这标志着AI图像生成从“视觉实验工具”正式向“生产力工具”转型。用OpenAI自己的话来说:“图像是一种语言,而不是装饰。”






