Zurück zur Übersicht
OpenAI hat drei neue Modelle für Echtzeit-Sprache, Übersetzung und Transkription in seine API aufgenommen. Der Ausbau richtet sich an Entwickler von Sprachassistenten, Voice-Interfaces und Live-Übersetzung.
OpenAI hat seine API um drei neue Audio-Modelle erweitert: GPT-Realtime-2, GPT-Realtime-Translate und GPT-Realtime-Whisper.
GPT-Realtime-2 ist für Echtzeit-Sprachanwendungen mit stärkerem Reasoning ausgelegt. GPT-Realtime-Translate dient der Live-Übersetzung, GPT-Realtime-Whisper der Streaming-Transkription. OpenAI positioniert das Update damit klar für Anwendungen, die Sprache in Echtzeit verstehen, übersetzen und beantworten müssen.
Weiterlesen
Das System soll Kontexte und Präferenzen über längere Zeiträume besser speichern. Zunächst erhalten Plus- und Pro-Nutzer in den USA Zugriff.
Ab Herbst sollen in den USA und in Brasilien Live-Ergebnisse der Associated Press in ChatGPT erscheinen. Die Ankündigung zeigt, dass Wahlintegrität und Inhaltskontrolle für KI-Plattformen zu zentralen Produkt- und Governance-Fragen werden.
OpenAI hat Codex um Computer-Use auf Windows erweitert. Die Funktion erlaubt es, Aufgaben auf einem Windows-Rechner auszuführen und später auf anderen Geräten fortzusetzen.
Das Modell ersetzt GPT-5.3 Instant in ChatGPT und in der API. Für zahlende Nutzer bleibt die bisherige Variante noch drei Monate verfügbar, parallel kündigt OpenAI die Abkündigung von o3 und GPT-4.5 an.
OpenAI legt ein Leitfaden für unabhängige Evaluierungen von Frontier-Modellen vor. Im Zentrum stehen valide Testumgebungen, sogenannte Harnesses, und Prüfungen, die bei agentischen Systemen nicht das Setup statt die Modellleistung messen.