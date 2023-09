Sprachassistenten wie Apples Siri oder Amazons Alexa spielen im Alltag vieler Menschen eine nicht unbedeutende Rolle. Nun hat der Entwickler von ChatGPT, OpenAI, seiner Software ebenfalls eine Stimme gegeben, mit der sie mit dem Nutzer kommunizieren kann. Und auch über andere Sinne verfügt die Software.





Fünf Stimmen für ChatGPT

Insgesamt kann der Nutzer aus fünf Stimmen wählen. Diese hören auf den Namen Juniper, Sky, Cove, Ember und Breeze. ChatGPT gibt dann in einem Voice-Chat Antworten auf dem Programm gestellte Fragen in Echtzeit. Die Stimmen hat OpenAI in Zusammenarbeit mit echten Synchronsprecher:innen erschaffen, gibt das Unternehmen an.





Vergleicht man die Stimmen von ChatGPT mit denen von Siri oder Alexa, so fällt auf, dass sie ein bisschen weniger künstlich klingen. Auf dem Entwicklerblog wurden Textbeispiele veröffentlicht, die dies verdeutlichen sollen. In dem Beitrag warnt OpenAI aber auch davor, dass eine solche Funktion missbraucht werden könnte. Erschaffen wurde sie, um barrierefreie und kreative Anwendungen zu ermöglichen. Aber sie könnte theoretisch auch von Kriminellen benutzt werden, die zum Zwecke des Betrugs vorgeben wollen, eine andere Person zu sein. Um dem vorzubeugen, kann die Funktion nur im Voice-Chat verwendet werden.

Bilderkennung soll bei Problemlösungen helfen

Das neue Softwareupdate bringt ChatGPT auch quasi das Sehen bei. Genauer gesagt kann die Software nun Bildinhalte erkennen und sozusagen durch das Sehen lernen. So kann der Nutzer etwa auf einer Reise ein Foto von einer Sehenswürdigkeit machen. Einmal in der ChatGPT-App hochgeladen, kann die KI diese erkennen und dann etwas zur Entstehungsgeschichte mitteilen.

Aber auch für Problemlösungen sei die Funktion nützlich, so OpenAI. Man könne etwa auf Basis eines Bildes vom Grill fragen, warum dieser nicht funktioniert und sich dann von der KI bei der Fehlersuche unterstützen lassen.

Die neuen Funktionen sollen in den nächsten zwei Wochen für alle zahlenden Kunden zur Verfügung stehen. Dabei wird die Sprachfunktion nur in der App unter Android und iOS funktionieren, während die Bilderkennung auf allen Plattformen verfügbar sein wird.

via ChatGPT