Teilen Sie dies:

OpenAI stellt mit dem neuen ChatGPT Agent einen entscheidenden Entwicklungsschritt in der Welt der generativen KI vor: ein System, das nicht nur kommuniziert, sondern eigenständig handelt. Der Agent kombiniert Recherchefähigkeiten mit aktiver Web-Interaktion und Dateiverwaltung – etwa bei Buchungen, Präsentationen oder komplexer Datenanalyse. Wie NUME.ch unter Berufung auf den offiziellen OpenAI-Pressebericht mitteilt, ist der Agent ab sofort für Pro- und Plus-Nutzer außerhalb der EU verfügbar.

Was kann der ChatGPT-Agent konkret

Der ChatGPT-Agent ist in der Lage, sich eigenständig durch Websites zu navigieren, APIs anzusprechen, Dateien zu analysieren und sogar Tabellenkalkulationen oder Präsentationen zu erstellen.
Hier einige reale Anwendungsbeispiele aus OpenAIs Demonstration:

  • Terminplanung: Der Agent durchsucht einen Google-Kalender, findet freie Zeitfenster und schlägt passende Restaurants (z. B. italienisch, koreanisch, Sushi) mit Bewertungen über 4.3 vor.
  • Konkurrenzanalyse: Auf Anfrage analysiert er drei Wettbewerber, erstellt eine vergleichende Auswertung und bereitet daraus eine bearbeitbare Präsentation vor.
  • Dateiverwaltung: Der Agent liest Excel-Tabellen, aktualisiert Zahlen, formatiert Inhalte konsistent und exportiert diese erneut.

Der KI-Agent interagiert über einen grafischen oder textbasierten Browser mit dem Web und wechselt dynamisch zwischen Recherche, Interpretation und konkreter Aktion.

Leistung im Benchmark: Besser als Mensch

In verschiedenen KI-Benchmarks übertraf der ChatGPT-Agent nicht nur bisherige Modelle wie GPT‑4o, sondern auch menschliche Analysten in bestimmten Aufgabenbereichen:

BenchmarkChatGPT-AgentGPT‑4o / CopilotMensch
DSBench – Datenanalyse89,9 %64,1 %87,9 %
DSBench – Datenmodellierung85,5 %65,0 %77,1 %
SpreadsheetBench – Tabellenbearbeitung45,5 %20,0 %71,3 %
Investmentbanking-Modellierung71,3 %48,6 %
WebArena – Webinteraktion78,2 %62,9 %65,4 %
BrowseComp – Webrecherche68,9 %51,5 %

In Aufgaben wie Finanzanalyse, LBO-Modellierung und Tabellensynthese setzt der Agent neue Maßstäbe.

Sicherheit und Kontrolle: Wer entscheidet

Mit größerer Autonomie steigen auch die Risiken. OpenAI räumt ein:

„Dieses Modell bringt mehr Risiken mit sich als vorherige Versionen.“

Deshalb wurde ein Sicherheitsrahmen implementiert:

  • Aktive Zustimmung: Vor jeder sensiblen Aktion (z. B. Datenübertragung, Buchung) wird die explizite Zustimmung des Nutzers eingeholt.
  • Überwachungsmodus: Bei kritischen Vorgängen wie E-Mails ist Schritt-für-Schritt-Kontrolle notwendig.
  • Prompt-Filterung: Der Agent erkennt sogenannte Prompt Injection-Angriffe (manipulierte Anfragen) und verweigert Ausführung riskanter Befehle.
  • Datenschutz: Browserdaten werden nicht gespeichert; Cookies bleiben lokal, sämtliche Eingaben sind rückverfolgbar und manuell löschbar.

Kommerzielle Interessen? OpenAI reagiert

Während Analysten wie Niamh Burns von Enders Analysis mögliche kommerzielle Verflechtungen ansprechen – etwa Marken, die sich bevorzugt listen lassen –, stellt OpenAI klar:

„Der Agent enthält keine gesponserten Empfehlungen.“

Allerdings prüft das Unternehmen laut früheren Aussagen von CEO Sam Altman ein mögliches Gebührenmodell, etwa durch Provisionen bei E-Commerce-Transaktionen.

Verfügbarkeit und nächste Schritte

Der ChatGPT-Agent ist zunächst für Abonnent:innen der Pro-, Plus- und Team-Versionen freigeschaltet.
Enterprise- und Bildungslizenzen folgen im Laufe des Monats Juli.

Das Vorgängermodell Operator wird in 30 Tagen eingestellt. Die Forschungsfunktionen von Deep Research sind vollständig integriert. Künftig soll der Agent Präsentationen mit mehr Tiefe generieren, Aufgaben wiederholt ausführen und enger mit Kalendern, E-Mail-Systemen und CRM-Plattformen verknüpft werden.

Bleiben Sie informiert – Relevantes. Jeden Tag. Lesen Sie, worum es heute wirklich geht: VPN aus der Schweiz: Warum Zürich zum Zentrum für digitale Privatsphäre wird

Bild von OpenAI

Teilen Sie dies: