Claude Opus 4 steht an der Spitze der Reihe und wird als das bisher stärkste Programmiermodell bezeichnet. Es wurde für langwierige Aufgaben und das Verhalten von Agenten in mehreren Schritten entwickelt und zeichnet sich durch komplexe Programmierherausforderungen und gleichbleibende Leistung über Stunden hinweg aus. Mit 72,5 % im SWE-Bench und 43,2 % im Terminal-Bench ist das Modell führend in den Benchmarks der Branche und gilt als entwickelt sich zum Goldstandard in der KI-gestützten Entwicklung.

Claude Opus 4 und Sonnet 4 BenchmarkClaude Opus 4 und Sonnet 4 Benchmark (Bild © Anthropic)

Claude Sonnet 4 ist zwar effizienter und leichter, erreicht aber 72,7 % im SWE-Bench und übertrifft damit seinen Vorgänger Sonnet 3.7 in den Bereichen Programmierung, Aufgabenplanung und Einhaltung von Anweisungen. Die Verbesserungen in den Bereichen Codequalität, Problemlösung und Multi-Feature-Implementierung werden bereits in die neue Generation der Code-Agenten von GitHub Copilot integriert.

Eines der Merkmale der neuen Claude-Modelle ist das erweiterte Denken bei der Verwendung von Werkzeugen. Diese Beta-Fähigkeit ermöglicht es den Modellen, externe Tools wie die Websuche in den Denkprozess einzubeziehen. Außerdem können die Modelle jetzt Tools parallel ausführen und den lokalen Dateispeicher nutzen, was ihre Fähigkeit verbessert, die Projektkontinuität aufrechtzuerhalten und sich über längere Sitzungen hinweg an veränderte Eingaben anzupassen.

Claude Opus 4 und Sonnet 4 Vergleich zu anderenClaude Opus 4 und Sonnet 4 Vergleich zu anderen (Bild © Anthropic)

Die Einführung von Claude Code als allgemein verfügbares Tool ist ein weiterer wichtiger Meilenstein. Es ist direkt in Entwicklerumgebungen wie VS Code und JetBrain-Produkten integriert und ermöglicht Inline-Code-Edits und die Bearbeitung von Aufgaben im Hintergrund über GitHub Actions. Ein begleitendes SDK ermöglicht jetzt die Entwicklung von benutzerdefinierten KI-gestützten Agenten und bietet damit einen breiteren Einsatzbereich.

Anthropic hat außerdem mehrere neue Entwickler-Tools für die Claude API eingeführt:

  • Code Execution Tool
  • MCP-Anschluss
  • Dateien-API
  • Prompt Caching (1-stündige Speicherung)

Diese Funktionen ermöglichen es Entwicklern, intelligentere, autonomere Agenten zu erstellen und die Bandbreite der Anwendungen zu erweitern, die Claude unterstützen kann - von der Codegenerierung bis hin zur Unterstützung komplexer Infrastrukturen.

Claude Opus 4 und Sonnet 4 veröffentlichtClaude Opus 4 und Sonnet 4 veröffentlicht (Bild © Anthropic)

Besonders hervorzuheben ist, dass Claude Opus 4 eine verbesserte Verwaltung des Langzeitspeichers einführt, wenn es Zugriff auf Dateien gewährt. Dadurch können persistente Speicherdateien erstellt werden, was die Konsistenz in ausgedehnten Arbeitsabläufen verbessert - wie z. B. bei der Spielenavigation oder der mehrstufigen Projektverfolgung.

Für Entwicklerinnen und Entwickler, die vollständige Transparenz bei der Entscheidungsfindung von Claude benötigen, gibt es jetzt einen Entwicklermodus, der die vollständigen Gedankenketten während des Prompt-Engineerings und des Agenten-Debugging bewahrt.

Sowohl Opus 4 als auch Sonnet 4 sind ab sofort über die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI zugänglich. Opus 4 ist im Rahmen von Anthropics Pro-, Max-, Team- und Enterprise-Tarifen erhältlich, während Sonnet 4 auch weiterhin für Nutzer der kostenlosen Version verfügbar ist. Die Preise bleiben gegenüber den vorherigen Generationen unverändert.