Zurück zur Übersicht
Bei den Gesprächen in Peking ging es laut Reuters um Sicherheitsprotokolle und den Umgang mit Missbrauchsrisiken. Ein gemeinsamer Rahmen könnte Signalwirkung weit über die beiden Länder hinaus haben.
Vertreter der USA und Chinas haben in Peking über Sicherheitsleitplanken für die leistungsstärksten KI-Modelle gesprochen. Laut Reuters standen dabei auch Best-Practice-Protokolle für den Umgang mit solchen Systemen auf der Agenda.
US-Finanzminister Scott Bessent verwies dem Bericht zufolge auf das Risiko, dass nichtstaatliche Akteure die stärksten Modelle missbrauchen könnten. Die Gespräche fallen in eine Phase, in der beide Länder beim Thema Frontier-KI weiter im Wettbewerb stehen.
Sollte aus den Gesprächen ein gemeinsamer Rahmen entstehen, hätte das potenziell Signalwirkung über die USA und China hinaus.
Weiterlesen
Anthropic kündigte am 30. Juni 2026 an, gemeinsam mit großen Cloud‑Anbietern und Partnern einen konsensbasierten Rahmen zur objektiven Bewertung von KI‑Jailbreaks zu entwickeln. Ziel ist, Funde schneller zu priorisieren und Reaktionen zu standardisieren.
Die Integration gibt Sicherheits- und KI‑Plattformteams zentrale Erkennung, manipulationssichere Beobachtbarkeit und Echtzeit-Schutzmechanismen für Copilot-Agenten. Relevanz: Unternehmen können Shadow Agents, Prompt‑Injection und schädliche Agentenaktivität gezielter erkennen und stoppen.
Die Cloud Security Alliance beschreibt eine Angriffsform, bei der manipulierte Sentry-Events über MCP-Integrationen an Coding-Agenten geliefert werden. Unternehmen sollten öffentliche DSNs prüfen, Integrationen absichern und automatische Codeausführung deaktivieren.
Anthropic hat US-Behörden informiert, dass zwischen dem 22. April und 5. Juni 2026 Tausende gefälschter Konten Millionen von Interaktionen mit dem Modell Claude durchgeführt hätten, um dessen Fähigkeiten zu extrahieren. Die Vorwürfe betreffen gezielte Tests von Software‑Engineering‑ und agentischen Reasoning‑Fähigkeiten und verschärfen die Debatte um Schutz von KI‑Know‑how.
Hitachi will OpenAI Agenten wie Codex zur Analyse von Quellcode in kritischen Altsystemen einsetzen und beginnt mit Projekten bei Finanzinstituten. Zugleich plant das Unternehmen, OpenAI Modelle für defensive Sicherheitszwecke über Trusted Access for Cyber zu nutzen und die Erkenntnisse in HMAX und Lumada zu integrieren.