Claude Opus 4 8 (Bild © Anthropic)
Was ist neu in Claude Opus 4.8?
Opus 4.8 zeigt eine messbare Steigerung der Ehrlichkeit und Präzision bei agentenbasierten Aufgaben. Technische Auswertungen zeigen, dass das Modell deutlich seltener unbegründete Behauptungen aufstellt oder Fehler im geschriebenen Code übersieht – konkret ist die Wahrscheinlichkeit, dass Codefehler unbemerkt bleiben, viermal geringer als bei seinem Vorgänger Opus 4.7.
Ausrichtungsbewertungen zeigen eine Verringerung von Fehlverhalten, wie Täuschung oder Mitwirkung bei Missbrauch. Das Modell zeigt zudem eine höhere Neigung, die Autonomie des Nutzers zu unterstützen und im Interesse des Nutzers zu handeln.
Ein neuer Mechanismus zur Aufwandssteuerung wurde in die Weboberfläche und Cowork integriert. Nutzer können nun manuell den Verarbeitungsaufwand anpassen, den das Modell für eine bestimmte Eingabe anwendet. Während das System standardmäßig einen hohen Aufwand wählt, um Qualität und Benutzererfahrung auszugleichen, können Nutzer niedrigere Einstellungen für schnellere Antworten und einen geringeren Verbrauch der Ratenbegrenzung wählen – oder höhere Einstellungen für komplexe, asynchrone Workflows.
Für Entwickler, die Claude Code nutzen, ermöglicht die Einführung dynamischer Workflows dem System, groß angelegte technische Probleme zu bewältigen. In dieser Forschungsvorschau kann das Modell Hunderte von parallelen Subagenten koordinieren, um umfangreiche Aufgaben auszuführen, wie z. B. umfassende Codebase-Migrationen, bei denen die Ergebnisse vor der endgültigen Zusammenführung überprüft werden.
API-Updates und Entwicklertools
Die Messages-API wurde aktualisiert und akzeptiert nun Systemeinträge direkt im Messages-Array. Diese Änderung ermöglicht die Änderung von Systemanweisungen während der Ausführung einer Aufgabe. Entwickler können nun Token-Budgets, Berechtigungen oder Umgebungskontexte aktualisieren, ohne den Prompt-Cache zu unterbrechen oder einen neuen Benutzerzugriff zu erfordern. Für diejenigen, die eine höhere Leistung benötigen, steht ein Schnellmodus für Opus 4.8 zur Verfügung, der die Verarbeitungsgeschwindigkeit um das 2,5-Fache erhöht.
Roadmap und zukünftige Releases
Die zukünftige Entwicklung konzentriert sich auf zwei Hauptschwerpunkte. Erstens ist es das Ziel, die Funktionen der Opus-Serie zu geringeren Betriebskosten bereitzustellen. Zweitens wird im Rahmen des Projekts Glasswing eine neue Klasse hochintelligenter Modelle entwickelt – derzeit in der Mythos-Vorschau zu sehen. Diese Modelle sind derzeit auf eine kleine Anzahl von Cybersicherheitsorganisationen beschränkt, während zusätzliche Sicherheitsvorkehrungen für eine breitere Veröffentlichung fertiggestellt werden.

