Chat .GPT 5.2  Bild © OpenAIChat .GPT 5.2 (Bild © OpenAI)

Neuerungen für Profis

GPT-5.2 wechselt von generischen Chats zur Erledigung von Aufgaben in 44 Berufen und legt den Schwerpunkt auf die Erstellung von Artefakten: Arbeitsmappen, Folien, Dokumente, Diagramme und Code. In internen und externen Bewertungen verbessert die Stufe „Thinking“ durchweg das mehrstufige Denken, die Tabellengenauigkeit, die Zellformeln und die Layoutqualität.

  • Leistung bei Wissensarbeit (GDPval): GPT-5.2 Thinking ist das erste OpenAI-Modell, das bei einem breiten Benchmark mit realen Aufgaben auf Expertenniveau arbeitet. Menschliche Prüfer haben es bei den schwierigsten Aufgaben als gleichwertig oder besser als die Qualität von Top-Praktikern bewertet, während es Ergebnisse schneller und zu einem Bruchteil der Kosten von Experten liefert.
  • Finanz-Workflows: In den internen Investmentbanking-Tests von OpenAI – Drei-Statements- und LBO-Modelle mit korrekter Formatierung und Quellenangabe – liegt GPT-5.2 Thinking vor früheren Versionen, was praktische Vorteile für Analysten und FP&A-Teams bedeutet.

ChatGPT 5.2 PorgrammierungChatGPT 5.2 Porgrammierung (Bild © OpenAI)

Programmieraufgaben

Auf SWE-Bench Pro, einem Repository-Level-Benchmark, der mehrere Sprachen umfasst, erreicht GPT-5.2 Thinking 55,6 % und auf SWE-bench Verified 80,0 %. In der Praxis bedeutet das zuverlässigeres Debugging, Feature-Implementierung, Refactoring in großen Codebasen und End-to-End-Korrekturen mit weniger manuellen Eingriffen. Frühe Tester berichten auch von einer stärkeren Front-End-Arbeit, einschließlich komplexer UI- und 3D-Elemente – nützlich für Full-Stack-Teams, die schnell liefern müssen.

Entwickler können Kosten, Latenz und Qualität über fünf Argumentationsmodi anpassen – keine, niedrig, mittel, hoch, sehr hoch – und das Modell kann mehrere Tools parallel aufrufen, ohne den Status zu verlieren, was lang laufende Automatisierungen verbessert.

ChatGPT 5.2 TabelllenkalkulationChatGPT 5.2 Tabelllenkalkulation (Bild © OpenAI)

Langes Kontext- und Dokumentverständnis

GPT-5.2 Thinking verbessert das Langzeitkontext-Reasoning auf OpenAI MRCRv2 auf bis zu 256k Tokens und verbessert so die Übereinstimmungsraten für dichte Dokumentenaufgaben mit mehreren Quellen (Verträge, Berichte, Literaturrecherchen). Für Workflows, die sogar diese Fenster überschreiten, unterstützt es einen neuen Responses /compact Endpunkt, der den Kontext effektiv erweitert und so toolintensive, mehrstündige Prozesse (Erfassen → Analysieren → Synthetisieren → Entwerfen) ermöglicht.

ChatGPT 5.2 VisionChatGPT 5.2 Vision (Bild © OpenAI)

Vision, die echte Arbeit unterstützt

In visuellen Benchmarks, die mit alltäglichen Aufgaben verbunden sind, erhöht GPT-5.2 Thinking die Genauigkeit für wissenschaftliche Abbildungen (CharXiv) und Produkt-/GUI-Screenshots (ScreenSpot Pro). Finanz-Dashboards, technische Diagramme und Betriebsansichten werden zuverlässiger analysiert, sodass funktionsübergreifende Teams, Produkt, Design, Support, visuelles Material direkt an das Modell zur Analyse oder Bearbeitung weiterleiten können.

ChatGPT 5.2 AnfragenChatGPT 5.2 Anfragen (Bild © OpenAI)

Einsatz des Tools im Produktionsmaßstab

GPT-5.2 Thinking erreicht 98,7 % bei τ2-bench Telecom, einer Multi-Turn-Kundensupport-Suite, die die Tool-Orchestrierung über Schritte, Systeme und Richtlinien hinweg misst. Für Unternehmen bedeutet das weniger anfällige Übergaben: Ein einziger Mitarbeiter kann Daten abrufen, Geschäftsregeln anwenden, Eskalationen koordinieren und endgültige Lösungen entwerfen – während Entwickler die Kontrolle über Tools, Schutzvorrichtungen und Protokolle behalten.

Wissenschaft und Mathematik

Für fortgeschrittenes Denken bringen GPT-5.2 Pro und Thinking GPQA Diamond auf 93,2 % und 92,4 % und FrontierMath (T1–3) auf 40,3 % (Thinking). Diese Verbesserungen sind nicht nur in den Ranglisten wichtig: Sie hängen mit einer höheren quantitativen Genauigkeit bei Simulationen, Modellierungen und Versuchsdesigns zusammen – also in Bereichen, in denen es auf Präzision ankommt.

Weniger Fehler, stärkere Sicherheitsvorkehrungen

Gemessen an anonymisierten ChatGPT-Eingaben sinken die Fehlerquoten auf Antwortebene im Vergleich zu 5.1, was den Nachbearbeitungsaufwand bei Forschung, Schreiben und Analyse reduziert. Die Sicherheitsarbeit wird mit einer verbesserten Handhabung sensibler Kontexte und einer Altersvorhersage-Sperre fortgesetzt, die strengere Inhaltsschutzmaßnahmen für Nutzer unter 18 Jahren vorsieht. OpenAI hält daran fest, dass eine Überprüfung durch Experten für Anwendungen mit hohem Risiko weiterhin unerlässlich ist.

ChatGPT 5.2 Verfügbarkeit, Preise und Modellnamen

ChatGPT: Wird heute für Plus, Pro, Business und Enterprise eingeführt. GPT-5.1 bleibt drei Monate lang in ChatGPT unter „Legacy” und wird danach in der API weitergeführt.

API:

  • gpt-5.2 (Thinking) und gpt-5.2-chat-latest (Instant): 1,75 $/M Eingabetoken, 14 $/M Ausgabe, 90 % Rabatt auf zwischengespeicherte Eingaben.
  • gpt-5.2-pro: 21 $/M Eingabe, 168 $/M Ausgabe.
  • GPT-5.1 und frühere Modelle bleiben verfügbar; eine Codex-optimierte 5.2-Variante ist geplant.