AIPress.com.cn报道
4月22日消息,前段时间热度颇高的图像模型ChatGPT Images 2.0全量上线。

据OpenAI的官方介绍,ChatGPT Images 2.0 的目标是成为最先进的模型,能够处理复杂的视觉任务,并生成精确、可直接使用的视觉内容。
官方称,Images 2.0 是首个具备“思考能力”的图像模型。当在 ChatGPT 中选择思考模型或专业模型时,Images 2.0 可以联网搜索实时信息、基于单一提示生成多张不同图像,并对自身输出进行校验。在这种模式下,模型能够承担从想法到图像之间更多工作,尤其是在对准确性、时效性、一致性和视觉连贯性要求较高的场景中。
更高的精度与控制力
Images 2.0 不仅能够构思更复杂的图像,还能够有效实现这些构想,遵循指令、保留细节,并呈现以往图像模型难以处理的精细元素,例如小尺寸文字、图标、界面元素、复杂构图以及细微风格约束。在 API 中,其分辨率最高可达 2K。
与其生成“接近你想法的图像”,不如说它可以生成“真正可用的图像”。
这张是Images 2.0生成的电脑截屏。

更强的多语言能力
此前,图像生成模型在英语及拉丁字母语言中的表现较为稳定,但在复杂或密集文本的非拉丁语言中准确性较低。
Images 2.0 突破了这一限制,在多语言理解方面显著提升,尤其在日语、韩语、中文、印地语和孟加拉语等语言的文本渲染能力上表现更强。它不仅能正确生成非英语文本,还能保证语言自然流畅。
不仅限于简单翻译标签,在海报、说明图、漫画等视觉作品中,Images 2.0同样能够将语言作为设计的一部分进行整合,使输出更具整体一致性。


风格表现与真实感提升
Images 2.0 在多种视觉风格下的表现更加真实和一致。它能够更好地捕捉照片特征、电影画面、像素艺术、漫画等风格,在纹理、光线、构图和细节方面表现更加稳定。


灵活的画面比例
Images 2.0 支持从 3:1(超宽)到 1:3(竖向)的多种画面比例,可满足横幅、幻灯片、海报、移动端界面、书签及社交媒体图像等不同场景需求。用户可以在提示中指定比例,或在生成后选择预设比例进行调整。


更贴近现实世界的理解
据官方介绍,Images 2.0 拥有2025年12月前的知识更新,使其在图像生成中具备更高的现实相关性与准确性,可以完成从信息整合、内容撰写到视觉排版的全过程,输出结构清晰、布局合理、信息流畅的视觉内容。


视觉思考伙伴
在启用“思考模型”时,模型会在后台进行更深入的分析,以更好理解并执行任务。它可以联网获取信息,将上传内容转化为视觉说明,并在生成前推理图像结构。

在该模式下,Images 2.0 更像是一个“视觉思考伙伴”,可以从初步概念推进到最终成品,大幅降低用户工作量。

同时,它还能一次生成最多8张图片,且保持角色与元素一致。还能支持漫画、设计方案等多张连续创作,免去逐张拼接的烦恼。


在灰度测试期间,普瑞斯已经实测过了Images 2.0的各项能力,表现的确不俗。封神!GPT-Image-2直播神图刷屏,你敢信是AI生成?
局限性
OpenAI也表示,尽管取得显著进展,但Images 2.0 仍存在局限。例如对折纸、魔方等复杂物理结构理解有限,对隐藏或倾斜表面细节表现不稳定,针对诸如沙粒等高密度重复细节处理仍然存在困难等问题。
定价与可用性
ChatGPT Images 2.0 即日起向所有 ChatGPT 和 Codex 用户开放。高级“思考模式”功能向 Plus、Pro 和企业用户提供。
GPT-Image-2 已在 API 中提供,价格根据图像质量与分辨率有所不同。
目前,图像能力已集成至 Codex,用户可以在同一工作环境中完成设计、开发及内容生产。
开发者可通过 GPT-Image-2 API,将图像生成能力集成至产品中,支持广告、本地化内容、教育材料、设计工具等场景。
总体看下来,Images 2.0的效果比谷歌的Nano Banana Pro要好上不少,设计师们可能真的要当心自己的饭碗了。
点击关注AIPress公众号:
扫码加入AIPress读者群:

访问AIPress网站,请点击“阅读原文”
或访问网址:aipress.com.cn
网友评论