OpenAI launcht ChatGPT Images 2.0: KI-Bilder präziser und detailgetreuer

OpenAI hat mit ChatGPT Images 2.0 ein neues Modell zur KI-Bildgenerierung vorgestellt. Es ist in ChatGPT, Codex und über die API verfügbar. Nutzer können ihre Bildideen detaillierter beschreiben und erhalten verlässlichere Ergebnisse. Laut Entwicklern setzt die KI komplexe Anweisungen besser um als frühere Versionen. Dazu gehören die zuverlässige Verarbeitung detaillierter Vorgaben, die präzise Darstellung von Text in Bildern und die genaue Platzierung von Objekten.

Optimiert für komplexe Anforderungen

Images 2.0 richtet sich an Nutzer, die KI-Bilder möglichst passgenau zu ihren Vorgaben erzeugen möchten. Laut OpenAI hilft das Modell besonders bei Anweisungen mit mehreren Details. Auch bei komplexen Layouts, Diagrammen und UI-Elementen sollen die Ergebnisse konsistenter sein. Es geht nicht nur um einzelne Motive, sondern auch um Bilder, bei denen Aufbau, Text und Anordnung wichtig sind.

Flexible Formate und Mehrsprachigkeit

Das Modell unterstützt Seitenverhältnisse von 3:1 bis 1:3, sodass es sich für sehr breite Motive ebenso wie für hochformatige Inhalte eignet. OpenAI nennt als Beispiele Banner und mobile Formate. Zudem kann Images 2.0 Inhalte in mehreren Sprachen erzeugen, was die internationale Nutzung erleichtert.

—

Breites Pickt-Banner — kollaborative Einkaufslisten-App für Telegram

Intelligente Workflows in ChatGPT

In ChatGPT ermöglicht das neue Modell sogenannte „Thinking“-Workflows, bei denen Aufgaben schrittweise verarbeitet werden. Es lassen sich bis zu acht Bildvarianten pro Anfrage erzeugen, was das Vergleichen verschiedener Fassungen erleichtert. Images 2.0 ist ab sofort für alle ChatGPT- und Codex-Nutzer verfügbar.

API-Zugang und Abomodelle

Neben ChatGPT und Codex kann Images 2.0 über die API „gpt-image-2“ in eigene Anwendungen integriert werden. Erweiterte Funktionen sind an kostenpflichtige Abos gebunden, sodass die Möglichkeiten vom jeweiligen Zugang abhängen.