Dell Deskside Agentic AI  Bild © DellDell Deskside Agentic AI (Bild © Dell)

Übergang von der Cloud zur lokalen KI-Infrastruktur

Der Trend hin zu agentischen KI-Architekturen hat zu einem Anstieg der Token-Nutzung geführt, was cloudbasierte Strategien für viele Unternehmen finanziell untragbar machen kann. Durch die Verlagerung der Inferenz auf lokale Hardware können Unternehmen ihre Kosten besser vorhersehbar halten und mehr Kontrolle über sensibles geistiges Eigentum behalten. Dell schätzt, dass Unternehmen ihre Ausgaben im Vergleich zur Nutzung von Cloud-APIs über zwei Jahre hinweg um bis zu 87 % senken können, wobei einige Konfigurationen bereits innerhalb von drei Monaten die Gewinnschwelle erreichen.

Zur Verwaltung dieser lokalen Bereitstellungen nutzt das System NVIDIA OpenShell. Dies bietet eine einheitliche Ebene für Sicherheit und Richtliniendurchsetzung, die über den gesamten Hardware-Stack hinweg funktioniert – von einzelnen Desktop-Workstations bis hin zu Dell PowerEdge XE-Servern.

  • Dell Pro Max mit GB10: Kompaktes und energieeffizientes System für die Prototypenentwicklung kleinerer, einzelner Agenten, geeignet für Modelle mit 30 bis 200 Milliarden Parametern.
  • Dell Pro Precision 9: Enterprise-Workstation-Tower mit Intel Xeon 600-Prozessoren für Workstations und bis zu fünf NVIDIA RTX PRO Blackwell Workstation Edition-GPU-Konfigurationen, die skalierbare Leistung für anspruchsvolle GPU-Workloads bieten und Modelle mit 30 bis 500 Milliarden Parametern unterstützen.
  • Dell Pro Max mit GB300: Angetrieben vom NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip und Dells exklusiver MaxCool-Technologie für maximale Effizienz wurde diese Plattform speziell für die Inferenz von hochmodernen KI-Modellen mit 120 Milliarden bis zu 1 Billion Parametern entwickelt.
  • NVIDIA NemoClaw-Referenzstack: Eine Open-Source-Grundlage für die sichere Verwaltung von ständig aktiven KI-Agenten, basierend auf OpenClaw – dem agentenbasierten Framework, das dauerhafte, autonome, mehrstufige KI-Workflows auf lokaler Hardware ermöglicht. Der Stack kombiniert leistungsstarke NVIDIA Nemotron-Open-Modelle für Schlussfolgerungen und Codierung mit der sicheren Laufzeitumgebung von OpenShell – alles Teil des NVIDIA Agent Toolkits zum Erstellen und Koordinieren von langlaufenden Agenten.
  • Dell Services: Umfassende Begleitung durch den gesamten Lebenszyklus agentischer KI – von der anfänglichen Strategie und Hardwarebereitstellung bis hin zur Workflow-Anpassung, Agentenpriorisierung und laufenden Optimierung – um die Zeit bis zur Produktionsreife zu verkürzen und interne KI-Kompetenzlücken zu schließen.

Spezialisierte Hardware für vielfältige Workloads

Die Lösung ist darauf ausgelegt, Open-Weight-Modelle mit 30 Milliarden bis 1 Billion Parametern zu unterstützen, verteilt auf drei primäre Hardware-Ebenen:

Der Dell Pro Max mit GB10 ist ein kompaktes, energieeffizientes System, das für Prototypen in kleinem Maßstab entwickelt wurde und Modelle mit 30 bis 200 Milliarden Parametern unterstützt. Für intensivere Arbeitslasten verfügt der Dell Pro Precision 9 über Intel Xeon 600-Prozessoren und unterstützt bis zu fünf NVIDIA RTX PRO Blackwell-GPUs, wodurch die Modellkapazität auf bis zu 500 Milliarden Parameter erweitert wird.

Für KI-Modelle auf Spitzenniveau nutzt der Dell Pro Max mit GB300 den NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip. Diese Plattform verfügt über die MaxCool-Technologie, um die thermischen und effizienzbezogenen Anforderungen von Modellen mit 120 Milliarden bis 1 Billion Parametern zu bewältigen.

Dell Pro Max with GB300Dell Pro Max with GB300 (Bild © Dell)

Dell Pro Max GB300 technische Daten

  • Prozessor: NVIDIA® Grace™ 72 Core Neoverse™ V2
  • Betriebssystem: Ubuntu® 24.04 LTS mit NVIDIA® AI Developer Tools
  • Grafikkarte: Diskrete Grafikkarte: NVIDIA® DGX B300, 252 GB HBM3e (integriert), NVIDIA® RTX™ PRO 2000-Blackwell, 16 GB GDDR7 (PCIe-Karte)
  • Arbeitsspeicher: 496 GB, LPDDR5X, 6400 MT/s, SOCAMM
  • Speicher: 16 TB: (4 x 4 TB), SSD, Gen4, SED-fähig
  • Microsoft Office: Keine
  • Sicherheitslösungen für Privatanwender und kleine Unternehmen: Keine

Die Infrastruktur wird durch den NVIDIA NemoClaw-Referenzstack unterstützt, eine Open-Source-Grundlage, die dauerhafte, autonome und mehrstufige KI-Workflows ermöglicht. Dieser Stack integriert Nemotron-Open-Modelle für Schlussfolgerungen und Codierung mit der sicheren OpenShell-Laufzeitumgebung.

Für stark regulierte Branchen haben Dell und NVIDIA die AI-Q 2.0-Referenzarchitektur veröffentlicht. Dieses Framework basiert auf der Dell AI Data Platform und bietet eine erprobte Grundlage für die Bereitstellung von Multi-Agenten-Workflows zur Entscheidungsunterstützung und für komplexe Forschungsaufgaben.

Um den Übergang vom Pilotprojekt zur Produktion zu erleichtern, bietet Dell Services umfassende Beratung zu Hardware-Bereitstellung, Workflow-Abstimmung und Priorisierung von Agenten.

Verfügbarkeit

Dell Deskside Agentic AI, die Dell-NVIDIA AI-Q 2.0-Referenzarchitektur und NVIDIA OpenShell stehen ab sofort zur Bereitstellung bereit.