AMD ROCm 7  Bild © AMDAMD ROCm 7 (Bild © AMD)

ROCm 7 bietet einen erheblichen Leistungssprung gegenüber seinem Vorgänger und liefert mehr als 3,5-mal so viel Inferenzdurchsatz und 3-mal so viel Trainingseffizienz. Diese Verbesserungen werden durch die Unterstützung von Formaten mit geringer Genauigkeit wie FP4 und FP6, Verbesserungen der Kommunikationsstacks und eine optimierte GPU-Auslastung ermöglicht. Das Update führt außerdem robuste verteilte Inferenzfunktionen durch die direkte Integration mit wichtigen Frameworks wie vLLM, llm-d und SGLang ein.

AMD ROCm 7 Beshcleunigung von TrainingAMD ROCm 7 Beshcleunigung von Training (Bild © AMD)

Für Unternehmensanwendungen stellt AMD ROCm Enterprise AI vor. Es ist ein MLOps-fähiges Toolkit, das den Betrieb strukturierter und unstrukturierter Daten-Workflows vereinfachen soll. Es wurde für reale Anwendungen entwickelt und unterstützt Feinabstimmung, sichere Skalierung und native Integration mit Tools wie Red Hat OpenShift AI.

AMD ROCm 7 Beschleunigung InferenzAMD ROCm 7 Beschleunigung Inferenz (Bild © AMD)

ROCm unter Windows mit Radeon Grafikkarten

Außerdem wird ROCm 7 auch auf Radeon-GPUs und Windows-Umgebungen ausgeweitet, wobei die allgemeine Verfügbarkeit für die zweite Hälfte des Jahres 2025 erwartet wird. Dadurch können KI-Entwickler die Konsistenz ihrer Tools von Cloud-Servern bis hin zu persönlichen Workstations und Laptops gewährleisten.

Ergänzend zum ROCm-Update baut AMD seine Developer Cloud zu einer weltweit verfügbaren, reibungslosen Entwicklungsumgebung aus. Die Cloud-Plattform bietet Entwicklern sofortigen Zugriff auf MI300X-GPUs ohne Hardware-Investitionen. Benutzer können Jupyter-Notebooks direkt im Browser starten, wobei Docker-Container mit gängigen KI-Tools für eine schnelle Bereitstellung und Anpassung vorinstalliert sind. Mit Rechenoptionen, die von Einzel-GPU-Instanzen (192 GB) bis zu Multi-GPU-Konfigurationen (bis zu 1,536 TB) reichen, unterstützt die Plattform eine Vielzahl von Workloads.

AMD Instinct MI350AMD Instinct MI350 (Bild © AMD)

Developer Cloud

Die Developer Cloud umfasst außerdem einen frühen Zugriff auf MI350-Systeme und vollständige Unterstützung für die Frameworks PyTorch und Triton CL. Neue Entwickler können kostenlose Nutzungsgutschriften beantragen, darunter 25 Stunden im Voraus und zusätzliche Ressourcen über die Zertifizierungsprogramme von AMD.

Das ROCm-Ökosystem wird durch strategische Partnerschaften weiter ausgebaut. Unternehmen wie Meta, Microsoft, Cohere, Hugging Face und Berkeley Sky Computing Lab setzen AMD Instinct-GPUs aktiv für groß angelegte Inferenz, Ranking-Modelle und optimierte KI-Infrastrukturen ein. Insbesondere Red Hat OpenShift AI unterstützt das Kubernetes-native KI-Lebenszyklusmanagement auf AMD-Hardware.