OpenAI hat mit ChatGPT Images 2.0 ein neues Modell zur KI-Bildgenerierung vorgestellt. Es ist in ChatGPT, Codex und über die API verfügbar. Nutzer können ihre Bildideen detaillierter beschreiben und erhalten verlässlichere Ergebnisse. Laut Entwicklern setzt die KI komplexe Anweisungen besser um als frühere Versionen. Dazu gehören die zuverlässige Verarbeitung detaillierter Vorgaben, die präzise Darstellung von Text in Bildern und die genaue Platzierung von Objekten.
Optimiert für komplexe Anforderungen
Images 2.0 richtet sich an Nutzer, die KI-Bilder möglichst passgenau zu ihren Vorgaben erzeugen möchten. Laut OpenAI hilft das Modell besonders bei Anweisungen mit mehreren Details. Auch bei komplexen Layouts, Diagrammen und UI-Elementen sollen die Ergebnisse konsistenter sein. Es geht nicht nur um einzelne Motive, sondern auch um Bilder, bei denen Aufbau, Text und Anordnung wichtig sind.
Flexible Formate und Mehrsprachigkeit
Das Modell unterstützt Seitenverhältnisse von 3:1 bis 1:3, sodass es sich für sehr breite Motive ebenso wie für hochformatige Inhalte eignet. OpenAI nennt als Beispiele Banner und mobile Formate. Zudem kann Images 2.0 Inhalte in mehreren Sprachen erzeugen, was die internationale Nutzung erleichtert.
Intelligente Workflows in ChatGPT
In ChatGPT ermöglicht das neue Modell sogenannte „Thinking“-Workflows, bei denen Aufgaben schrittweise verarbeitet werden. Es lassen sich bis zu acht Bildvarianten pro Anfrage erzeugen, was das Vergleichen verschiedener Fassungen erleichtert. Images 2.0 ist ab sofort für alle ChatGPT- und Codex-Nutzer verfügbar.
API-Zugang und Abomodelle
Neben ChatGPT und Codex kann Images 2.0 über die API „gpt-image-2“ in eigene Anwendungen integriert werden. Erweiterte Funktionen sind an kostenpflichtige Abos gebunden, sodass die Möglichkeiten vom jeweiligen Zugang abhängen.



