Google DeepMind bringt das Gemma 4 12B-Modell und quantisierungsfähige Gewichte für Notebooks

08.06.2026, 11:16 Uhr , von News-Redaktion

Google DeepMind hat die Gemma 4-Familie um ein Modell mit 12 Milliarden Parametern und eine Reihe von quantisierungsfähigen Trainingsgewichten erweitert, die den lokalen Einsatz von KI verbessern sollen. Das 12B-Modell ist für den Betrieb auf handelsüblicher Consumer-Hardware ausgelegt und benötigt nur 16 GB Arbeitsspeicher, um lokale Agenten auf einem Laptop zu betreiben.

Google DeepMind Gemma4 Bild © Google Google DeepMind Gemma4 (Bild © Google)

Das 12B-Modell bietet einen deutlichen Effizienzsprung, wobei die Benchmark-Leistung fast an die des größeren 26B-Modells heranreicht. Dies ermöglicht es dir, komplexe mehrstufige Schlussfolgerungen und agentische Workflows lokal auszuführen, ohne umfangreiche Cloud-Computing-Ressourcen zu benötigen.

Google DeepMind Gemma4 Benchmark (Bild © Google)

Um die Zugänglichkeit und Geschwindigkeit weiter zu verbessern, hat Google DeepMind quantisierungsbewusste Trainingsgewichte für die gesamte Gemma-4-Produktpalette veröffentlicht. Während herkömmliche Quantisierung oft zu einem Verlust an Modellgenauigkeit führt, bindet QAT den Quantisierungs-Prozess direkt in die Trainingsphase ein. Dieser Ansatz minimiert den Speicherbedarf und beschleunigt die Token-Generierung, während die Ausgabequalität im Vergleich zu den ursprünglichen Gewichten erhalten bleibt.

Google DeepMind Models (Bild © Google)

Diese Optimierungen sorgen für eine breitere Hardwarekompatibilität, wobei Leistungssteigerungen bei Chips von NVIDIA, AMD, Intel, Qualcomm und Apple zu beobachten sind. Die QAT-Gewichte sind derzeit für eine breite Palette von Modellgrößen verfügbar, darunter die Versionen E2B, E4B, 12B, 26B und 31B.

Die Integration des neuen Modells und der Gewichte wurde über Ollama optimiert. Nutzer können das 12B-Modell in verschiedenen Entwicklertools und Anwendungen wie Claude Code, Codex App, Hermes Agent und OpenClaw sowie für allgemeine Chat-Zwecke einsetzen.

News-Redaktion

Die Newsredaktion liefert News zu allen Themen der IT-Branche...

3216 Artikel E-Mail

Google DeepMind bringt das Gemma 4 12B-Modell und quantisierungsfähige Gewichte für Notebooks

Unterstütze PCMasters

Google DeepMind bringt das Gemma 4 12B-Modell und quantisierungsfähige Gewichte für Notebooks weitere Downloads:

Andere Artikel aus dieser Kategorie

Unterstütze PCMasters

Google DeepMind bringt das Gemma 4 12B-Modell und quantisierungsfähige Gewichte für Notebooks weitere Downloads:

Andere Artikel aus dieser Kategorie

Mesa 26.1 veröffentlicht: Updates für Grafiktreiber und API-Unterstützung

AMD X970E Chipsätze setzen auf verbesserte DDR5-Speicherunterstützung

UniFi Dream Machine Beast Cloud Gateway mit ARM Neoverse N2-Architektur für 1.618 € vorgestellt

AMD Adrenalin 26.5.1 WHQL-Treiber-Download: Unterstützung für fünf neue Spiele und behebt Fehler der RX 9000-Serie

12V-2x6 PCIe-5.1-Kabelbrand: Unsere GeForce RTX 5090 hat es erwischt