局限性
GPT Image 模型(gpt-image-2、gpt-image-1.5、gpt-image-1 和 gpt-image-1-mini)是功能强大且用途广泛的图像生成模型,但仍存在一些需要注意的局限性:
- 延迟:处理复杂的提示词可能需要长达 2 分钟。
- 文本渲染:尽管已显著改进,模型在精确的文本定位和清晰度方面仍可能存在困难。
- 一致性:虽然能够生成风格一致的图像,但在多次生成过程中,模型偶尔可能难以保持重复出现的角色或品牌元素的视觉一致性。
- 构图控制:尽管指令遵循能力有所提升,但在结构化或对布局敏感的构图中,模型可能难以精确放置元素。
内容审核
所有提示词和生成的图像均会根据我们的内容政策进行过滤。
对于使用 GPT Image 模型(gpt-image-2、gpt-image-1.5、gpt-image-1 和 gpt-image-1-mini)生成的图像,您可以通过 moderation 参数控制审核严格程度。该参数支持两个值:
- auto(默认):标准过滤,旨在限制生成某些可能不适合未成年人的内容类别。
- low:限制较少的过滤。
支持的模型
在 Responses API 中使用图像生成功能时,gpt-5 及更新版本的模型应支持该工具。请查看您所选模型的详情页面,以确认该模型是否支持使用图像生成工具。
