Zurück zur Übersicht
Production-Benchmarks auf einem neun-Knoten-OCI-Bare-Metal-Cluster mit 72 H100-GPUs zeigen, dass WEKAs NeuralMesh mit Augmented Memory Grid gegenüber DRAM-only-Konfigurationen rund 10× mehr gleichzeitige Nutzer und 10× höheren Token-Durchsatz erreicht.
WEKA und Oracle Cloud Infrastructure veröffentlichten Production-Benchmarks, die auf einem neun-Knoten-Bare-Metal-H100-Cluster mit insgesamt 72 GPUs und Tests mit 100.000-Token-Kontextfenstern durchgeführt wurden. Im Vergleich zu DRAM-only-Konfigurationen berichten die Partner von etwa 10× mehr gleichzeitigen Nutzern, 10× höherem Token-Durchsatz und rund 7× mehr generierten Tokens pro GPU.
Laut den Angaben erreicht WEKAs NeuralMesh mit Augmented Memory Grid diese Verbesserungen, indem NVMe-gestützte Persistenz den nutzbaren Arbeitsspeicher der GPUs effektiv erweitert und damit die bisherige Speicherengstelle bei langen Kontexten entschärft. NeuralMesh mit Augmented Memory Grid ist über den Oracle Marketplace verfügbar.
Die Validierung verändert die Kosten- und Skalierungsbetrachtung für Anwendungen mit sehr langen Kontextfenstern wie multi-turn Agents und persistentem Memory. Ob sich die Benchmarkergebnisse in produktiven SLA-Umgebungen und unter unterschiedlichen Workloads reproduzieren lassen, bleibt anwendungsseitig zu prüfen.
Weiterlesen
Die AI XPV Platform startet mit einer von Apollo angeführten 35 Milliarden US Dollar Kapitallösung. Ziel ist nach Angaben der Unternehmen, bis 2028 mehr als 20 Gigawatt KI Rechenkapazität bereitzustellen.
Auf der Konferenz INSPIRE 2026 in Shanghai präsentierte Huawei ein Paket für 'Agentic Infra' mit Cluster-, Speicher- und Runtime-Komponenten. Die Firma nennt konkrete Leistungswerte und kündigt ein Open-Source-Projekt für Enterprise-Agenten an.
Die Google-Mutter will über ein Paket aus unterzeichneten Angeboten, einem At-the-Market-Programm und einer Privatplatzierung mit Berkshire Hathaway insgesamt 80 Milliarden US-Dollar aufnehmen. Zweck: Ausbau von KI-Infrastruktur und globaler Rechenkapazität.
Die erste Ausbaustufe soll in der zweiten Hälfte 2026 auf der Vera-Rubin-Plattform starten. NVIDIA will zudem schrittweise bis zu 100 Milliarden Dollar in OpenAI investieren, jeweils parallel zum Ausbau der Kapazitäten.
Die Vereinbarung läuft über fünf Jahre und soll die Zusammenarbeit bei Agenten-KI für Unternehmenskunden beschleunigen. Der Deal zeigt, wie teuer produktive KI im Enterprise-Umfeld bleibt und wie eng Plattformanbieter an Hyperscaler gebunden sind.