KI

OpenAI stellt GPT-5.5 vor – das kann die neueste Version

Veröffentlicht:

von Max Strumberger

:newstime

Unheimlich: So eigennützig ist KI

Videoclip • 01:25 Min • Ab 12


- Anzeige -
- Anzeige -

OpenAI zündet die nächste KI-Stufe: Mit GPT-5.5 will der Konzern eine "neue Klasse von Intelligenz" für echte Arbeit liefern. Das Modell soll komplexe Ziele verstehen, eigenständig handeln – und in Benchmarks große Teile der Konkurrenz hinter sich lassen.

Das Wichtigste in Kürze

  • OpenAI stellt mit GPT-5.5 ein KI-System vor.

  • Es recherchiert, programmiert, erstellt Tabellen und durchforstet riesige Dokumente nahezu eigenständig.

  • Zugleich wächst der Druck, Sicherheit und Kontrolle solcher Systeme zu gewährleisten.

OpenAI hat mit GPT-5.5 ein neues KI-Modell vorgestellt, das der Konzern als "intelligentestes und intuitivstes Modell" und als "neue Klasse von Intelligenz für echte Arbeit" bewirbt. Die Anwendung soll komplexe Ziele besser verstehen, Aufgaben eigenständig planen und bis zum Abschluss durchführen – von Programmierung über Büro-Routine bis hin zu früher wissenschaftlicher Forschung. GPT-5.5 ist zunächst für zahlende Kundschaft in ChatGPT und Codex verfügbar; der Zugang über die Programmierschnittstelle (API) soll in Kürze folgen.

Kernversprechen des Modells ist sogenanntes agentisches Arbeiten: GPT-5.5 soll eigenständig zwischen Tools wechseln, seine Ergebnisse überprüfen und mehrstufige Aufgaben ohne detaillierte Schritt-für-Schritt-Anweisungen erledigen. Besonders stark sei das System beim Schreiben und Debuggen von Code, bei Online-Recherche, Datenanalyse, dem Erstellen von Dokumenten und Tabellen sowie bei der Bedienung von Software. In Programmier-Tests für komplexe Softwarearbeit, inklusive Kommandozeilen-Aufgaben und realen GitHub-Issues, übertrifft GPT-5.5 das Vorgängermodell GPT-5.4 deutlich.


- Anzeige -
- Anzeige -

GPT-5.5 setzt sich von der Konkurrenz ab

In Benchmarks setzt sich GPT-5.5 in vielen Bereichen an die Spitze der Konkurrenz – jedoch nicht durchgehend. Im Terminal-Bench 2.0 erreicht das Modell 82,7 Prozent und liegt damit vor GPT-5.4 (75,1 Prozent), Anthropics Claude Opus 4.7 (69,4 Prozent) und Googles Gemini 3.1 Pro (68,5 Prozent. Besonders groß ist der Vorsprung in anspruchsvoller Mathematik: Im FrontierMath Tier 4 erzielt GPT-5.5 35,4 Prozent, die Pro-Variante sogar 39,6 Prozent. Bei anderen Tests, etwa dem SWE-Bench Pro für reale GitHub-Issues oder Tool-Use- und Webrecherche-Benchmarks, liegt allerdings teils weiterhin Claude Opus 4.7 oder Gemini 3.1 Pro vorn.

Auch bei langen Kontexten meldet OpenAI deutliche Fortschritte: Im MRCR-v2-Benchmark steigt die Trefferquote bei Kontextlängen von 512.000 bis 1 Million Tokens von 36,6 Prozent (GPT-5.4) auf 74 Prozent. Im Graphwalks-BFS-Test mit einer Million Tokens verbessert sich GPT-5.5 von 9,4 auf 45,4 Prozent. Entwickelt und optimiert wurde das Modell nach Unternehmensangaben auf NVIDIA-GB200- und GB300-NVL72-Systemen. GPT-5.5 und Codex hätten zudem bei der Optimierung der eigenen Infrastruktur geholfen und die Token-Generierungsgeschwindigkeit um mehr als 20 Prozent gesteigert.

Auch in den News:

Cybersecurity wird deutlich verstärkt

Vor dem Hintergrund wachsender Sorgen um die Sicherheit immer leistungsfähigerer KI-Systeme betont OpenAI die "bisher stärksten Sicherheitsvorkehrungen" in GPT-5.5. Im Preparedness Framework werden biologische, chemische und Cybersecurity-Fähigkeiten wie bei den Vorgängern als "High", aber nicht als "Critical" eingestuft; bei Cybertests verzeichnet das Modell dennoch Leistungszuwächse. Zugleich führt OpenAI strengere Risiko-Classifier ein und bietet über das Programm Trusted Access for Cyber verifizierten Sicherheitsforschenden erweiterten Zugang. Die Einführung von GPT-5.5 fällt in ein anhaltendes Wettrennen der Tech-Konzerne, in dem Wettbewerber wie Anthropic mit Claude Mythos und Claude Opus sowie Google mit Gemini eigene leistungsstarke KI-Agenten positionieren – teils mit dem Hinweis, einige Modelle seien für eine breite Freigabe noch zu gefährlich.


Verwendete Quellen:

Openai.com: Introducing GPT‑5.5

Heise.de: OpenAI stellt GPT-5.5 vor: Mehr Agent, weniger Chatbot

- Anzeige -
- Anzeige -

Mehr entdecken