HighPoints Rocket 7638D  Bild © HighPointHighPoints Rocket 7638D (Bild © HighPoint)

Das Herzstück des Adapters ist ein 48-Lane-PCIe-Gen5-Switch, der dedizierte x16-Bandbreite für eine externe Grafikkarte und dedizierte x16-Bandbreite für NVMe-Speicher bereitstellt – alles über einen einzigen Erweiterungssteckplatz. Durch die Eliminierung der CPU aus dem kritischsten Teil des Datenpfads reduziert das Design die E/A-Latenz und den CPU-Overhead, was wiederum die nachhaltige GPU-Auslastung während des Trainings, der Inferenz und der umfangreichen Datenvorverarbeitung erhöht.

Für Scale-Out-Speicher verfügt der Rocket 7638D über zwei MCIO 8i-Ports, die bis zu 16 NVMe-Laufwerke und eine Kapazität von bis zu 2 Petabyte unterstützen – genug Spielraum für Multi-Terabyte-Batches, große wissenschaftliche Datensätze und große Sprachmodellkorpora.

HighPoints Rocket 7638D AnbindungHighPoints Rocket 7638D Anbindung (Bild © HighPoint)

Konnektivität und Bereitstellung

Die Karte integriert CDFP-CopprLink für zuverlässige GPU-zu-Host-Verbindungen mit großer Bandbreite und Unterstützung für externes Gehäuse. Laut HighPoint wird der Adapter nativ von allen gängigen Betriebssystemen ohne zusätzliche Treiber unterstützt, was die Bereitstellung in AI/ML-, HPC- und wissenschaftlichen Bildgebungsstacks vereinfacht. Ein mitgeliefertes MPT-Dienstprogramm zeigt Firmware-Details, PCIe-Verbindungsgeschwindigkeiten und den Zustand des Switches für eine schnelle Diagnose an. Um den Vor-Ort-Service zu vereinfachen, speichert jeder Adapter FRU/VPD-Daten, sodass Ersatzteile mit der richtigen Firmware- und Hardwarekombination bereitgestellt werden können.

Herkömmliche Speicher-zu-GPU-Pfade leiten Daten über die CPU und den Host-Speicher weiter, was Zyklen verbraucht und die Latenz erhöht. Durch die Schaffung eines Grafikkarten-NVMe-Peer-Pfads über PCIe Gen5 bietet der Rocket 7638D die Hardware-Grundlage für NVIDIA GPU Direct Storage-Workflows – verkürzte Epochen, kürzere Trainingszeiten und höherer Inferenzdurchsatz in Kombination mit einem kompatiblen GDS-Software-Stack. Das Ergebnis sind weniger GPU-Leerlaufzyklen und eine höhere Gesamteffizienz des Systems.