Zurück zur Übersicht
Der neue Forschungsbenchmark prüft agentische KI in komplexen, mehrstufigen Analyse- und Entscheidungsaufgaben der Genomik und Medizin. OpenAIs bestes Modell erreicht auf dem höchsten Reasoning-Level nur 28,7 Prozent und bleibt damit deutlich hinter menschlichen Expert:innen zurück.
OpenAI hat am 2026-06-30 GeneBench-Pro vorgestellt. Der Benchmark umfasst 129 Probleme in zehn Domänen, darunter statistische Genetik, Populationsgenetik, funktionelle Genomik und klinische Diagnostik, und stellt Agenten realistische Datensätze, Fallbeschreibungen und eine Standard-Bioinformatik-Toolchain zur Verfügung.
Auf dem höchsten Reasoning-Level erzielt OpenAIs Modell GPT-5.6 Sol eine Bestehensrate von 28,7 Prozent; im Pro-Modus 31,5 Prozent. OpenAI bezeichnet das als Fortschritt, betont aber zugleich, dass Systeme weiterhin zu unzuverlässig sind, um menschliche Expert:innen zu ersetzen. Gutachter schätzten, ein menschlicher Experte benötige für ein Problem 20 bis 40 Stunden.
OpenAI weist darauf hin, dass partielle Automatisierung trotz der derzeitigen Kosten wirtschaftlichen und wissenschaftlichen Wert schaffen könne. GeneBench-Pro soll die Forschung und Entwicklung vergleichbarer agentischer Systeme in der Genomik standardisieren.
Weiterlesen
Laut Berichten soll CEO Sam Altman in frühen Gesprächen vorgeschlagen haben, rund 5 Prozent von OpenAI in einen staatlich verwalteten Public Wealth Fund einzubringen. Die Initiative befinde sich im Frühstadium und ist nicht unabhängig verifiziert.
Die US-Regierung führt nach Berichten Verhandlungen mit großen Anbietern über ein freiwilliges Rahmenwerk. Ziel sind Benchmarks, Freigabetermine und Zugriffsregeln für besonders leistungsfähige KI‑Modelle; eine Ankündigung könnte bereits in Kürze erfolgen.
Die Kooperation soll die Integration von OpenAI-Modellen in geschützte Betriebsumgebungen beschleunigen. Booz Allen erhält Zugang zu Roadmap-Informationen und Trainingsressourcen, OpenAI profitiert von Praxiserkenntnissen aus Einsätzen.
HP will die OpenAI-Plattform Frontier in Kundensysteme, interne Abläufe und auf Geräteebene integrieren. Geplant sind Einsätze von Telemetrieanalyse bis Always-On-Inference sowie die Nutzung in der Workforce Experience Platform.