In partnership with

Guten Morgen, 🕯️🕯️🕯️🕯️

wir wünschen Dir einen schönen vierten Advent! Eine weitere Woche ist vergangen, und KI WEEKLY hält Dich auf dem neuesten Stand des KI-Universums.

In eigener Sache: KI Weekly verabschiedet sich bis zum 11. Januar in die Weihnachtspause. Wir wünschen Dir ruhige Feiertage und einen schönen Jahreswechsel. Danke, dass Du KI Weekly in diesem Jahr begleitet hast. Wir freuen uns auf ein neues Jahr voller spannender Entwicklungen und noch mehr KI. 🎄🎆

KI-Tools der Woche

  1. 👀 Cursor - Neuer visueller Editor, der Drag-and-Drop mit KI-Agenten kombiniert

  2. 🤖 Nemotron 3 - Nvidias neue Familie von Open-Source-Modellen

  3. 📚 Gemini Deep Research Agent - Googles SOTA-Agent für lang andauernde Aufgaben

  4. 📜 Mistral OCR 3 - SOTA-Modell zum Extrahieren von Text und Bildern aus Dokumenten

  5. 🎬 Ray3 Modify - Bearbeite und gestalte Videos neu

#Bonus: 📒 Notion - Jetzt mit der zweiten Generation von Notion AI: Dein smarter Partner für alles. 30 Tage kostenlos testen mit KI Weekly*

- 01 -

🤝 Disney und OpenAI schließen Milliarden-Deal

Bildquelle: Unsplash

Disney hat einen dreijährigen Lizenzvertrag mit OpenAI bekanntgegeben. Nutzer von Sora erhalten damit Zugriff auf mehr als 200 Figuren aus Disney, Marvel, Pixar und Star Wars. Gleichzeitig investiert Disney rund 1 Milliarde US-Dollar in OpenAI.

Die Details:

  • Nutzer können ikonische Figuren wie Micky Maus, Darth Vader oder die Avengers für eigene Videogenerierungen einsetzen, und ausgewählte Kreationen sollen sogar auf Disney+ erscheinen.

  • Disney integriert darüber hinaus die APIs von OpenAI in verschiedene Produkte und führt ChatGPT intern ein, um die digitale Transformation des Konzerns zu beschleunigen.

  • Der Vertrag schließt die Nutzung von Persönlichkeitsrechten, insbesondere von Stimmen und Gesichtern prominenter Darsteller, ausdrücklich aus. Damit vermeidet Disney die derzeit besonders heiklen IP-Konflikte in Hollywood.

  • Am selben Tag verschickte Disney eine Unterlassungsaufforderung an Google, da dort angeblich unerlaubt Disney-Inhalte in großem Umfang generiert worden seien.

Warum das wichtig ist: Disney CEO Bob Iger hatte bereits im vergangenen Monat angekündigt, dass KI eine zentrale Rolle für Disney+ spielen werde. Der nun geschlossene Deal geht allerdings weit über die Erwartungen hinaus. Für OpenAI entsteht ein strategischer Vorteil, weil das Unternehmen als einziges führendes KI-Modell legal auf weltweit bekannte Marken zugreifen darf. Gleichzeitig verschärft Disney damit den Ton gegenüber konkurrierenden Generatoren, um diesen Vorteil konsequent zu verteidigen.

- 02 -

🎧 Google bringt Echtzeit-Audioübersetzung

Bildquelle: Google

Google hat eine Reihe neuer Gemini-gestützter Übersetzungsfunktionen vorgestellt. Kern ist ein Beta-Feature, das gesprochene Sprache in Echtzeit an beliebige verbundene Kopfhörer überträgt. Bislang war diese Funktion ausschließlich den Pixel Buds vorbehalten.

Die Details:

  • Das neue Gemini-2.5-Flash-Native-Audio-Modell verbessert die Leistungsfähigkeit für stimmgesteuerte Agenten.

  • Die Integration in Google Übersetzer funktioniert mit jedem beliebigen Earbud auf Android und unterstützt mehr als 70 Sprachen, während Tonfall, Sprechtempo und Rhythmus der Sprecherin beziehungsweise des Sprechers möglichst präzise erhalten bleiben.

  • Das Weltwissen von 2.5 Flash Native Audio erleichtert ein differenziertes Verständnis von Slang oder kulturell geprägten Formulierungen, was zu deutlich nuancierteren Übersetzungen führt.

  • Google erweitert außerdem seinen Duolingo-ähnlichen Übungsmodus auf 20 weitere Länder, ergänzt um neue Funktionen wie Streak-Tracking und Feedback zur Aussprache.

Warum das wichtig ist: Die Sci-Fi-Vorstellung des universellen Übersetzers rückt spürbar näher. Mit Googles Update werden Gespräche über Sprachgrenzen hinweg so mühelos wie nie zuvor. Da künftig auch Plattformen wie YouTube oder soziale Netzwerke auf diese Technik setzen dürften, könnten Sprachbarrieren im KI-Zeitalter weitgehend verschwinden.

- 03 -

🚀 OpenAI kontert Googles Nano Banana Pro mit neuem Bild-Generator

Bildquelle: OpenAI

OpenAI hat GPT Image 1.5 vorgestellt, ein großes Update des ChatGPT-Bildgenerators. Das Modell erzeugt Grafiken bis zu viermal schneller, rendert Text deutlich sauberer und hält Motive über mehrere Bearbeitungen hinweg konsistent. Der Schritt gilt als direkte Antwort auf Googles jüngste Fortschritte mit Nano Banana Pro.

Die Details:

  • Image 1.5 steigert die Generierungsgeschwindigkeit spürbar und kann Gesichter, Beleuchtung und Bildkomposition bei Anpassungen zuverlässig beibehalten.

  • Auch die Textdarstellung verbessert sich deutlich. Im Gegensatz zu den Problemen von GPT-image-1 meistert das neue Modell lange Texte, Infografiken und stark variierende Schriftgrößen weitgehend fehlerfrei.

  • Auf den Ranglisten von Artificial Analysis und LM Arena übernimmt Image 1.5 die Spitzenposition in den Kategorien Text-zu-Bild und Bildbearbeitung.

  • OpenAI ergänzt das Update um ein neues Kreativpanel in der Seitenleiste, das ergänzend zum klassischen Chat-Workflow schnelle Vorlagen und kuratierte Stiloptionen bereitstellt.

Warum das wichtig ist: GPT-image-1 war zwar ein viraler Erfolg, doch verlor ohne Weiterentwicklung rasch an Wettbewerbsfähigkeit. Mit Version 1.5 liefert OpenAI wieder auf Augenhöhe ab. Das Upgrade reiht sich damit in die jüngsten 5.2-Verbesserungen ein und stärkt OpenAIs Position gegenüber Googles Modellen zum Jahreswechsel.

- 04 -

⚡️ Googles neues Gemini 3 Flash setzt auf Tempo

Bildquelle: Google

Google hat Gemini 3 Flash vorgestellt, eine auf Geschwindigkeit optimierte Variante seines jüngsten Spitzenmodells. Trotz des Fokus auf Effizienz soll Flash weiterhin Intelligenz auf Spitzenniveau bieten und wird nun als Standardmodell in Gemini sowie im KI-Modus der Google-Suche eingesetzt.

Die Details:

  • Gemini 3 Flash erreicht in vielen Benchmarks die Leistung von 3 Pro oder übertrifft sie sogar, kostet jedoch nur ein Viertel des Preises und arbeitet etwa dreimal so schnell.

  • In dem Leistungstest Humanity’s Last Exam erzielte Flash 33,7 Prozent und verdreifachte damit den Wert seines Vorgängers. Gleichzeitig rückt das Ergebnis mit GPT-5.2 und dessen 34,5 Prozent fast gleichauf.

  • Sowohl die Gemini-App als auch der KI-Modus der Google-Suche nutzen nun standardmäßig 3 Flash und verbinden aktuelle Webinformationen mit schnellerem, präziserem Reasoning.

Warum das wichtig ist: Gemini 3 Flash wirkt fast bedeutender als 3 Pro. Das Verhältnis aus hoher Intelligenz, massiv gesteigerter Geschwindigkeit und deutlich geringeren Kosten setzt die Konkurrenz unter Druck. Google gewinnt weiter Marktanteile, und Flash dürfte diesen Trend spürbar verstärken.

- 05 -

📱 OpenAI eröffnet ChatGPT-App-Marktplatz für Entwickler

Bildquelle: OpenAI

OpenAI hat sein bislang internes App-Verzeichnis in ChatGPT erweitert und erstmals für Drittentwickler geöffnet. Nutzer erhalten damit eine zentrale und übersichtliche Oberfläche, um externe Dienste direkt in ChatGPT zu entdecken und zu nutzen.

Die Details:

  • Das neue Verzeichnis strukturiert die verfügbaren Angebote in die Kategorien „Empfohlen“, „Lifestyle“ und „Produktivität“ und ist sowohl über das Menü „Tools“ als auch über die Seite „Apps“ erreichbar.

  • Entwickler können mit dem neuen Beta-SDK von OpenAI arbeiten, das Beispielcode, Schnittstellenbibliotheken und detaillierte Schritt-für-Schritt-Anleitungen für die Einreichung eigener Apps bereitstellt.

  • Zu den derzeit verfügbaren Anwendungen zählen unter anderem Photoshop, Canva, DoorDash, Spotify und Zillow, die sich direkt innerhalb von ChatGPT-Konversationen verwenden lassen.

  • Monetarisierung ist bislang nur über Verlinkungen auf externe Websites möglich. OpenAI prüft jedoch zusätzliche Modelle, darunter digitale Güter und weitergehende Erlösmechanismen.

Warum das wichtig ist: OpenAI positioniert ChatGPT weiterhin als „Alleskönner“-Schnittstelle und nicht als eigenständigen Assistenten. Die Öffnung für Apps von Drittanbietern kann diese Erfahrung für Verbraucher weiter verbessern. Aber wie wir bereits bei den Schwierigkeiten des GPT Store gesehen haben, bedeutet die Entwicklung einer App nicht automatisch, dass auch Nutzer kommen werden.

🥇 Wöchentliches KI-Ranking

And the Winner is... Gemini-3-Pro von Google. Verfügbar kostenlos in Gemini / Gemini App und unter Google AI Studio.

🗞️ In aller Kürze

1️⃣ OpenAI hat GPT-5.2-Codex veröffentlicht, ein aktualisiertes Modell speziell fürs Programmieren mit verbesserten Fähigkeiten im Bereich Cybersicherheit.

2️⃣ xAI hat die Grok Voice Agent API vorgestellt, mit der Entwickler Sprachtechnologie auf Basis des führenden Sprache-zu-Sprache-Modells des Unternehmens bauen können.

3️⃣ Google Labs hat CC eingeführt, einen experimentellen KI-Assistenten auf Gemini-Basis, der sich mit Gmail, Kalender und Dateien verbindet und personalisierte Morgenzusammenfassungen verschickt.

4️⃣ Google bietet mit dem Gemini Deep Research Agent einen spezialisierten Agenten für umfangreiche Rechercheaufgaben und die Synthese komplexer Informationen an.

5️⃣ Adobe hat Photoshop, Acrobat und Express direkt in ChatGPT integriert. Nutzer können jetzt Fotos bearbeiten, Designs erstellen und PDFs anpassen, einfach per Texteingabe.

Tipps & Tricks

⚖️ ChatGPT Bildgenerierung vs. Nano Banana Pro im Vergleich

Googles Nano Banana Pro und ChatGPTs neues Bildgenerierungsmodell liefern beide beeindruckende Ergebnisse, aber welches passt besser zu deinen Anforderungen? Mit dieser Methode baust du dir eine wiederverwendbare Vergleichsmatrix, die du auch für künftige Modellvergleiche nutzen kannst.

Schritt für Schritt

  1. Anwendungsfälle definieren: Wähle 5 konkrete Einsatzszenarien aus (z.B. Logo, Website-Grafik, Instagram-Post, Marketing-Broschüre, fotorealistisches Bild). Lege Testregeln fest: gleicher Prompt für beide Modelle, je 4 Bilder, Bewertung von 1-5 in den Kategorien Konsistenz, Kreativität, Nutzen und Qualität.

  2. Prompts generieren lassen: Gib deine Anwendungsfälle in Claude, ChatGPT oder Gemini ein mit dem Prompt: „Hier sind meine Anwendungsfälle: [X]. Schreib mir für jeden einen JSON-Prompt mit 4 Variationen in einem 4x4-Raster."

  3. Bewertungsmatrix erstellen: Bau dir eine Tabelle, in der die Gesamtbewertung = (Konsistenz + Kreativität + Nutzen + Qualität) / 4 ergibt.

  4. Bilder generieren und bewerten: Teste jeden Prompt in beiden Tools (jeweils in einem neuen Chat pro Anwendungsfall) und bewerte die Ergebnisse nach deinen Kriterien.

🚀 Profi-Tipp: Um Zeit und Tokens zu sparen, lass dir Prompts schreiben, die direkt 4 Variationen in einem 4x4-Raster erzeugen.

Das war’s schon! 😔

Mehr davon? Hol dir jetzt KI Weekly Plus (kostenlos testen!).

© Deutsches Institut für Service-Qualität (DISQTrust)

Nur bei mit einem Sternchen (*) gekennzeichneten Links handelt es sich um Affiliate-Links. Wir erhalten für jeden Kauf eine Provision. Dies hat keinen Einfluss darauf, wie wir ein Tool oder einen Anbieter bewerten.

Antworten

or to participate

Weiter lesen

No posts found