Radeon AI PRO R9600D (Bild © AMD )
ROCm 7.2 bietet nun offiziell Unterstützung für zwei RDNA 4-Karten: die Radeon AI PRO R9600D ist eine professionelle Variante mit geringerem Stromverbrauch, 3072 Stream-Prozessoren, 32 GB GDDR6 und einer Board-Leistung von etwa 150 W und die Radeon RX 9060 XT LP, als kompaktes, auf Effizienz ausgelegtes Modell mit 32 Recheneinheiten / 32 Ray-Beschleunigern, 64 KI-Beschleuniger, 16 GB GDDR6 und einer Obergrenze von ~140 W. AMD bringt auch die Arbeit an RDNA 3 zum Abschluss, indem es die richtige ROCm-Aktivierung für die Radeon RX 7700-Serie hinzufügt und damit einer langjährigen Forderung von Desktop-Entwicklern nachkommt.
SLES-Unterstützung und Optimierung auf Modellebene
Auf der Beschleunigerseite bekommen Instinct MI350X und MI355X offizielle Unterstützung für SUSE Linux Enterprise Server 15 SP7, während Modelloptimierungen für MI300X und MI350 kommen. Die Veröffentlichung soll den tatsächlichen Durchsatz bei LLM-Inferenz und HPC-Codes verbessern, wo Speicherbandbreite und Kernel-Scheduling eine große Rolle spielen.
Multi-GPU-Steuerung und HIP-Laufzeitvorteile
Cluster-Betreiber erhalten eine Knoten-Energieverwaltung für Multi-GPU-Knoten, die eine feinere Steuerung der Energiestatus ermöglicht und den Leerlauf- und Teillastverbrauch in gemeinsam genutzten Umgebungen potenziell senkt. Entwickler profitieren von Verbesserungen der HIP-Laufzeitleistung und neuen HIP-APIs, wodurch sich die Ausdrucksmöglichkeiten erweitern, ohne auf herstellerspezifische Erweiterungen zurückgreifen zu müssen.
Für template-lastigen GPU-Code fügt ROCm 7.2 SPIR-V-Unterstützung zu hipCUB und rocThrust hinzu, was die Portabilität zwischen verschiedenen Ökosystemen erleichtert und konsistentere Kernel ermöglicht, wenn verschiedene Backends angesteuert werden.
Verfügbarkeit
ROCm 7.2.0 ist ab sofort verfügbar. Downloads und detaillierte Versionshinweise finden Sie unter rocm.docs.amd.com.
