Claude Opus 4 und Sonnet 4 legen Messlatte für KI-Codierung und Reasoning-Leistung höher

27.05.2025, 17:09 Uhr , von News-Redaktion

Anthropic hat mit Claude Opus 4 und Claude Sonnet 4 die vierte Generation seiner Claude-KI-Modelle vorgestellt und damit die Fähigkeiten in den Bereichen Software-Engineering, Deep Reasoning und agentenbasierte Aufgabenbearbeitung verbessert. Die neuen Modelle eignen sich für eine Vielzahl von KI-Anwendungen, von der Wartung komplexer Codebasen bis hin zu hocheffizienten Entwicklungsworkflows.

Artikel Video

Claude Opus 4 steht an der Spitze der Reihe und wird als das bisher stärkste Programmiermodell bezeichnet. Es wurde für langwierige Aufgaben und das Verhalten von Agenten in mehreren Schritten entwickelt und zeichnet sich durch komplexe Programmierherausforderungen und gleichbleibende Leistung über Stunden hinweg aus. Mit 72,5 % im SWE-Bench und 43,2 % im Terminal-Bench ist das Modell führend in den Benchmarks der Branche und gilt als entwickelt sich zum Goldstandard in der KI-gestützten Entwicklung.

Claude Opus 4 und Sonnet 4 Benchmark (Bild © Anthropic)

Claude Sonnet 4 ist zwar effizienter und leichter, erreicht aber 72,7 % im SWE-Bench und übertrifft damit seinen Vorgänger Sonnet 3.7 in den Bereichen Programmierung, Aufgabenplanung und Einhaltung von Anweisungen. Die Verbesserungen in den Bereichen Codequalität, Problemlösung und Multi-Feature-Implementierung werden bereits in die neue Generation der Code-Agenten von GitHub Copilot integriert.

Eines der Merkmale der neuen Claude-Modelle ist das erweiterte Denken bei der Verwendung von Werkzeugen. Diese Beta-Fähigkeit ermöglicht es den Modellen, externe Tools wie die Websuche in den Denkprozess einzubeziehen. Außerdem können die Modelle jetzt Tools parallel ausführen und den lokalen Dateispeicher nutzen, was ihre Fähigkeit verbessert, die Projektkontinuität aufrechtzuerhalten und sich über längere Sitzungen hinweg an veränderte Eingaben anzupassen.

Claude Opus 4 und Sonnet 4 Vergleich zu anderen (Bild © Anthropic)

Die Einführung von Claude Code als allgemein verfügbares Tool ist ein weiterer wichtiger Meilenstein. Es ist direkt in Entwicklerumgebungen wie VS Code und JetBrain-Produkten integriert und ermöglicht Inline-Code-Edits und die Bearbeitung von Aufgaben im Hintergrund über GitHub Actions. Ein begleitendes SDK ermöglicht jetzt die Entwicklung von benutzerdefinierten KI-gestützten Agenten und bietet damit einen breiteren Einsatzbereich.

Anthropic hat außerdem mehrere neue Entwickler-Tools für die Claude API eingeführt:

Code Execution Tool
MCP-Anschluss
Dateien-API
Prompt Caching (1-stündige Speicherung)

Diese Funktionen ermöglichen es Entwicklern, intelligentere, autonomere Agenten zu erstellen und die Bandbreite der Anwendungen zu erweitern, die Claude unterstützen kann - von der Codegenerierung bis hin zur Unterstützung komplexer Infrastrukturen.

Claude Opus 4 und Sonnet 4 veröffentlicht (Bild © Anthropic)

Besonders hervorzuheben ist, dass Claude Opus 4 eine verbesserte Verwaltung des Langzeitspeichers einführt, wenn es Zugriff auf Dateien gewährt. Dadurch können persistente Speicherdateien erstellt werden, was die Konsistenz in ausgedehnten Arbeitsabläufen verbessert - wie z. B. bei der Spielenavigation oder der mehrstufigen Projektverfolgung.

Für Entwicklerinnen und Entwickler, die vollständige Transparenz bei der Entscheidungsfindung von Claude benötigen, gibt es jetzt einen Entwicklermodus, der die vollständigen Gedankenketten während des Prompt-Engineerings und des Agenten-Debugging bewahrt.

Sowohl Opus 4 als auch Sonnet 4 sind ab sofort über die Anthropic API, Amazon Bedrock und Google Cloud Vertex AI zugänglich. Opus 4 ist im Rahmen von Anthropics Pro-, Max-, Team- und Enterprise-Tarifen erhältlich, während Sonnet 4 auch weiterhin für Nutzer der kostenlosen Version verfügbar ist. Die Preise bleiben gegenüber den vorherigen Generationen unverändert.

Quelle: Anthropic

TIPP DES TAGES

News-Redaktion

Die Newsredaktion liefert News zu allen Themen der IT-Branche...

2725 Artikel E-Mail

Claude Opus 4 und Sonnet 4 legen Messlatte für KI-Codierung und Reasoning-Leistung höher

TIPP DES TAGES

Unterstütze PCMasters

Claude Opus 4 und Sonnet 4 legen Messlatte für KI-Codierung und Reasoning-Leistung höher weitere Downloads:

Andere Artikel aus dieser Kategorie

TIPP DES TAGES

Unterstütze PCMasters

Claude Opus 4 und Sonnet 4 legen Messlatte für KI-Codierung und Reasoning-Leistung höher weitere Downloads:

Andere Artikel aus dieser Kategorie

CORSAIR RMx-Netzteileserie ab sofort auch mit ATX 3.1 und ATX 12V-2x6-Anschluss

Core Ultra 200K CPU-Preise geleakt durch vorzeitige Shop-Listung mit Release am 24. Oktober

DSGVO-konform durch Consent Manager: Was Webseitenbetreiber wissen müssen

Age Of Mythology: Retold Systemanforderungen

AMD X870 und X870E Motherboards: Preise und Release am 30. September