ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Ein am 24. März veröffentlichter Benchmark testet agentische KI in turn-basierten Umgebungen statt mit kurzen Einzelantworten. Laut der Arbeit lösen Menschen alle Aufgaben, während Frontier-Modelle unter 1 Prozent bleiben.

30. März 2026 · 07:03Quelle: arXiv / ARC Prize Foundation

Zurück zur Übersicht

ARC-AGI-3 testet agentische KI: Menschen bei 100 Prozent, Modelle unter 1 Prozent | KI Weekly

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Erwähnt

OpenAI zieht Empfehlung für Coding-Benchmark SWE-Bench Pro zurück

WHO berät mit 37 Ländern über Regeln für KI im Gesundheitswesen

26 Meta-Beschäftigte klagen gegen mutmaßlich KI-gestützte Auswahl für Entlassungen

Meta deaktiviert umstrittene Muse Image Funktion nach Kritik

OpenAI ordnet Forschung und Sicherheit neu, Sicherheitschef Heidecke soll gehen

OpenAI zieht Empfehlung für Coding-Benchmark SWE-Bench Pro zurück

WHO berät mit 37 Ländern über Regeln für KI im Gesundheitswesen

26 Meta-Beschäftigte klagen gegen mutmaßlich KI-gestützte Auswahl für Entlassungen

Meta deaktiviert umstrittene Muse Image Funktion nach Kritik

OpenAI ordnet Forschung und Sicherheit neu, Sicherheitschef Heidecke soll gehen

Google führt Kennzeichnung für KI-generierte Werbung ein

Anthropic plant Prototyp für beweisbare Herkunft von KI-Ausgaben

LangChain und NVIDIA präsentieren offenen Agenten Stack

SpaceXAI veröffentlicht Grok 4.5 als 'Opus-class'-Modell

Einzelkamera-Modell steuert Roboter in unbekannte Umgebungen

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

ARC-AGI-3 soll agentische KI unter offenen Mehrschritt-Aufgaben prüfen

Erwähnt

Das könnte dich auch interessieren

OpenAI zieht Empfehlung für Coding-Benchmark SWE-Bench Pro zurück

WHO berät mit 37 Ländern über Regeln für KI im Gesundheitswesen

26 Meta-Beschäftigte klagen gegen mutmaßlich KI-gestützte Auswahl für Entlassungen

Meta deaktiviert umstrittene Muse Image Funktion nach Kritik

OpenAI ordnet Forschung und Sicherheit neu, Sicherheitschef Heidecke soll gehen

Das könnte dich auch interessieren

OpenAI zieht Empfehlung für Coding-Benchmark SWE-Bench Pro zurück

WHO berät mit 37 Ländern über Regeln für KI im Gesundheitswesen

26 Meta-Beschäftigte klagen gegen mutmaßlich KI-gestützte Auswahl für Entlassungen

Meta deaktiviert umstrittene Muse Image Funktion nach Kritik

OpenAI ordnet Forschung und Sicherheit neu, Sicherheitschef Heidecke soll gehen

Google führt Kennzeichnung für KI-generierte Werbung ein

Anthropic plant Prototyp für beweisbare Herkunft von KI-Ausgaben

LangChain und NVIDIA präsentieren offenen Agenten Stack

SpaceXAI veröffentlicht Grok 4.5 als 'Opus-class'-Modell

Einzelkamera-Modell steuert Roboter in unbekannte Umgebungen