AWS Graviton5 jpg (Bild © Amazon)
Graviton5 im Detail
Das Hauptmerkmal von Graviton5 ist die hohe Dichte: 192 CPU-Kerne in einem einzigen Package, die höchste Anzahl, die es bisher auf EC2 gab. Das Design verkürzt den Abstand zwischen den Kernen, reduziert die Latenz zwischen den Kernen um ~33 % und erhöht die Bandbreite, was direkt latenzempfindlichen, parallelen Workloads wie Echtzeit-Gaming, Hochleistungsdatenbanken, Big-Data-Analysen, Anwendungsservern und EDA zugute kommt.
Bei der E/A meldet AWS bis zu 15 % höhere Netzwerkbandbreite und 20 % höhere EBS-Bandbreite im Durchschnitt über alle Größen hinweg, mit bis zu 2-mal höherer Netzwerkbandbreite bei den größten Instanzen. Das bedeutet schnellere Datenübertragungen, schnellere Backups und eine konsistentere Leistung für verteilte Dienste.
Speicher und Cache deutlich verbessert
Ein 5-mal größerer L3-Cache versorgt die Kerne, und jeder Kern verfügt über 2,6-mal mehr L3 als Graviton4, was Verzögerungen reduziert und die Reaktionszeiten verbessert. Schnellere Speichergeschwindigkeiten helfen dabei, größere In-Memory-Datensätze zu verarbeiten, ohne den Durchsatz zu beeinträchtigen. Graviton5 wird in einem 3-nm-Prozess hergestellt und bietet Optimierungen auf Systemebene, darunter Bare-Die-Kühlung, um eine höhere Leistung bei geringem Stromverbrauch zu erzielen und damit sowohl Kosten- als auch Nachhaltigkeitsziele zu erreichen.
Sicherheitsarchitektur
Graviton5-Instanzen basieren auf dem AWS Nitro System mit Nitro-Karten der sechsten Generation, die Virtualisierung, Speicher und Netzwerk in dedizierte Hardware auslagern. Aufbauend auf dem Zero-Operator-Access-Modell von Nitro führt AWS die Nitro Isolation Engine ein, die formale Verifizierung – mathematische Korrektheitsnachweise – nutzt, um die Isolation der Mandanten zu gewährleisten. Die minimale, formal verifizierte Codebasis soll nachweisbare Grenzen zwischen Workloads und AWS-Betreibern schaffen und damit neue Maßstäbe für die Isolierung in der Cloud setzen.
Erste Leistungsdaten
Frühe Anwender aus den Bereichen Medienstreaming, Gaming, Motorsportanalyse, soziale Plattformen, SaaS, EDA und Unternehmensdatenbanken berichten von deutlichen Leistungssteigerungen und geringerer Tail-Latenz bei repräsentativen Produktions-Workloads. Von Partnern zitierte Benchmarks zeigen Zuwächse zwischen hohen Zehnern und über 30 % sowie erhebliche Kostensenkungen in rechenintensiven Szenarien.
