Verbessertes Sprachverständnis und mehr – Die neuen Funktionen von ChatGPT-4o

Es ist noch immer nicht der große neue Versionssprung vom mittlerweile über einem Jahr alten ChatGPT-4 auf ein GPT-5. Die Feature-Liste des neuen KI-Modells hat es aber dennoch in sich. Vor allem bei der Sprachsteuerung machen die neuen Funktionen von ChatGPT-4o einen riesigen Schritt nach vorn. Das „o“ steht dabei für „omni“ also „alles“ und wurde insbesondere trainiert um nahtloser Text, Bild und Audio in Ein- und Ausgabe zu verwenden. 

Noch besser wird ChatGPT aber für Nutzer der kostenlosen Version. Diese bekommt jetzt GPT-4 und die neuen 4o-Neuerungen direkt obendrauf. Wir stellen euch die wichtigsten Neuerungen vor und welche Vorzüge ChatGPT plus noch hat.

Hier übrigens die komplette Vorstellung von GPT-4o:

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

ChatGPT-4o ist deutlich effizienter

Neben den neuen Funktionen von ChatGPT-4o ist das neue KI-Modell vor allem eines: deutlich effizienter. Laut OpenAI ist GPT-4o zweimal so schnell zum halben Preis und mit fünfmal so hohen rate limits im Vergleich mit GPT-4 Turbo.

Diese höhere Effizienz ist vermutlich auch ein Grund, weshalb das neue Modell auch für kostenlose Nutzer zugänglich ist. Nur die Plus-Nutzer dürfen allerdings fünfmal so viele Anfragen stellen, was das Abo für Heavy User noch immer interessant macht. Außerdem haben kostenlose GPT-4o-Nutzer nur eingeschränkten Zugriff so weit die Serverkapazitäten es erlauben. 

Neben der schnelleren Performance ist das neue Modell außerdem auch noch besser in der Verbindung verschiedener In- und Outputs in Form von Text, Bild und Audio. Chat-GPT liefert nun bessere Ergebnisse in nicht-englischen Sprachen und auch das Verständnis für Bild und Audio ist deutlich verbessert. Das wurde unter anderem an der Livelösung einer mathematischen Aufgabe gezeigt, bei der die KI dem Präsentierenden geholfen hat eine Gleichung selbstständig zu lösen.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Bessere und schnellere Sprachsteuerung

Die signifikantesten Änderungen gibt es in der Sprachnutzung von ChatGPT. Die verbesserte Performance ist hier besonders spürbar: Mit einer durchschnittlichen Reaktionszeit von 320 Millisekunden (zuvor mehrere Sekunden) erreicht die KI eine nahezu menschliche Reaktionszeit. Dazu kommen noch einige der besten neuen Funktionen von ChatGPT-4o.

Die KI hat ein gutes Verständnis für Emotionen bekommen und kann etwa Aufregung oder Traurigkeit aus der Stimme lesen. Im Video mit der mathematischen Aufgabe zeigt sich das etwa auch als sie beginnt ebenfalls im Gespräch zu lachen, als sie ein Lachen in der Eingabe wahrnimmt. (Timestamp: 3:26)

Was ebenfalls für ein natürlicheres Gesprächserlebnis sorgt: Wir können die KI im Gespräch unterbrechen. Das war zuvor zwar auch möglich, aber nur auf Knopfdruck. Wenn die KI uns jetzt etwa etwas auflistet und uns ein Punkt besonders interessiert, können wir sprachlich dazwischengehen und ihr etwa sagen, dass sie mehr zu genau diesem Punkt erzählen soll.

Im Sprachchat mit ChatGPT-4o können wir zudem viel natürlicher Bildelemente und auch das Livebild der Smartphone-Kamera einbinden, auf der die KI ebenfalls unsere Emotionen herauslesen kann. Diese neue Immersion ist ein großer Schritt in der Sprachnutzung, könnte aber die emotionale Bindung etwa bei Flirts mittels ChatGPT-DAN schon für manche Nutzer gefährlich machen.

Oh und singen kann ChatGPT-4o ebenfalls:

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Desktop App – vorerst aber nur für Mac.

Ganz neu ist auch die ChatGPT Desktop App. Diese lässt ChatGPT auch ohne Drittanbieter im Hintergrund laufen und per Shortcut aufrufen. Es öffnet für die Zukunft aber auch neue Wege der KI-Nutzung von Desktop-Geräten.

Verfügbar ist die App zum Start allerdings nur auf macOS, eine Windows Version soll aber im Verlauf des Jahres noch folgen. Außerdem wird die macOS-App zunächst nur für ChatGPT Plus-Abonnenten ausgerollt. In den nächsten Wochen möchte OpenAI die App weiter öffnen.

Änderungen gibt es aber auch für die Webapp. Mit einem neuen Home Screen und Message Layout soll die Nutzung noch ein bisschen Nutzerfreundlich werden.

Kostenlose Nutzung von GPT-4o

Wie erwähnt macht OpenAI das neue Modell inklusive der neuen Funktionen von ChatGPT-4o für sämtliche Nutzer zugänglich. Zuvor war die kostenlose Nutzung auf das GPT-3.5 Modell reduziert. Damit erhalten nichtzahlende Nutzer auch Zugriff auf einige GPT-4-Funktionen und natürlich die neuen Features aus 4o. DALL-E 3 scheint mit Blick auf die aktuellen Pricing-Angaben allerdings nicht inbegriffen zu sein.

Gerade zu Beginn müsst ihr aber noch mit Einschränkungen rechnen. Viele neue Features starten nämlich erst für die Plus-Nutzer und werden dann nach und nach für alle zugänglich. Außerdem ist die GPT-4o-Nutzung abhängig von der Auslastung der Server. Sind diese zu stark beansprucht, werden kostenlose Nutzer automatisch auf GPT-3.5 runtergestuft, um die Nutzung durch Pro-Abonnenten zu gewährleisten. Gerade mit dem Release der neuen Version ist damit zu rechnen, dass die Server deutlich mehr Anfragen bewältigen müssen.

Auch andere Funktionen wie Datenanalyse sind in der kostenlosen GPT-4o-Nutzung eingeschränkter und Pro-Nutzer können fünfmal so viele Anfragen absenden. Trotzdem ist die kostenlose Variante deutlich verlockender geworden bei einem Preis von 20$ pro Monat (+MwSt) für Plus.


Image from Video by OpenAI

Das Internet ist sein Zuhause, die Gaming-Welt sein Wohnzimmer. Der Multifunktions-Nerd machte eine Ausbildung zum Programmierer, schreibt nun aber lieber Artikel als Code.


Artikel per E-Mail verschicken