Die Analyse, die vom Ersteller Kurnal auf YouTube und BiliBili veröffentlicht wurde, zeigt ein umfangreiches Paket mit einer Größe von etwa 77,5 mm × 58,0 mm und einem internen Layout, das TSMC 5 nm Rechensilizium mit einer von SMIC hergestellten I/O-Kachel kombiniert, die vermutlich auf einem ~14 nm-Prozess basiert.

Huawei KunPeng 930 CPU FotoHuawei KunPeng 930 CPU Foto (Bild © Kurnal)

Monolithisches Design durch gekachelte Rechenleistung

Das Herzstück des KunPeng 930 sind von Arm abgeleitete Taishan-Kerne, die als zwei 40-Kern-Rechenkacheln organisiert sind und 80 Kerne in Dual-Die-Konfigurationen ermöglichen. Durch die Platzierung der Rechenleistung auf einem 5-nm-Knoten können Huawei SRAM-Dichte- und Frequenzziele verfolgen, während die I/O-Kachel zu SMIC migriert, um das Volumen zu absorbieren und den Versorgungsdruck zu mindern, ohne die führende Kapazität bei Schnittstellen und PHYs zu beanspruchen.

Huawei KunPeng 930 DieHuawei KunPeng 930 Die (Bild © Kurnal)

Cache und Speicher

Die Architektur legt den Schwerpunkt auf den Cache: Jeder Kern ist mit einem privaten 2 MB L2 gekoppelt, während ein gemeinsamer 91 MB L3 auf dem Die sitzt, um den 40-Kern-Komplex zu versorgen. DDR5-Controller befinden sich auf den Die und die Diagramme von Huawei zeigen 12 Speicherkanäle pro Chiplet, die bis zu 24 Kanäle pro Prozessor in Dual-Die-Form bieten. Die im Teardown abgebildete Platine verfügt über 16 DIMM-Slots, was daran erinnert, dass nicht jeder theoretische Kanal auf Produktionsplattformen geroutet wird.

Huawei KunPeng 930 Die ShotHuawei KunPeng 930 Die Shot (Bild © Kurnal)

I/O-Budget vs. reales Routing

Die Plattform erfordert bis zu 96 PCIe-Lanes, doch die untersuchte Platine weist nur etwa 80 Lanes auf. Diese Lücke spiegelt wahrscheinlich Kompromisse auf Platinenebene wider – Komplexität der Leiterbahnverlegung, Stromversorgung und Kosten – und nicht eine harte Siliziumgrenze. Der von SMIC gebaute I/O-Die konzentriert diese Konnektivitätsblöcke, eine Lösung, die die Fertigung vereinfachen dürfte, aber eine Optimierung der Firmware und Treiber erfordert, um die volle Leistung freizusetzen.

Huawei KunPeng 930 MotherboardHuawei KunPeng 930 Motherboard (Bild © Kurnal)

Die Design-Lösungen des KunPeng 930 passen zu den modernen Hyperscale-Prioritäten: viele effiziente Arm-Kerne, tiefer Cache, breite DDR5-Kanalanzahl und reichlich PCIe, um Beschleuniger und Speicher zu versorgen. Der hybride TSMC/SMIC-Ansatz zeigt auch eine lieferkettenbewusste Roadmap. Die nächste Unbekannte ist die Software – Scheduler-Verhalten, Speichertraining und I/O-Tuning – und wie sich diese Ebenen in Server-Klasse-Benchmarks umsetzen lassen, sobald die Systeme in den Testlabors landen.