Solo un paio di giorni fa OpenAI ha reso disponibile, anche se solo per un piccolo numero di abbonati a ChatGPT Plus, la sua nuova modalità vocale avanzata.

Da quel momento in poi, come ampiamente prevedibile, online hanno cominciato a circolare diversi filmati che mostrano la nuova funzione in azione. In molti casi, i video delineano uno strumento dalle capacità sorprendenti. Nei vari filmati è possibile notare come la “nuova voce” di ChatGPT sia in grado di cantare, imitare vari accenti e correggere la pronuncia di un utente.

Uno degli esempi più fulgidi della modalità vocale avanzata è il seguente filmato proposto su X dall’utente @nickfloats. Lo stesso chiede a ChatGPT di raccontare una storia come se fosse un pilota di linea che sta comunicando con i passeggere di un volo.

Dopo qualche secondo per elaborare i dati, ChatGPT entra in azione, arrivando persino a creare una sorta di “effetto citofono” per rendere l’audio più realistico. Anche se la voce ha avuto difficoltà a ricreare i suoni di sottofondo, come il motore, il risultato è comunque più che positivo.

Guys im never talking to any of you ever again once gpt voice is released. I won’t need friends anymore. AI will tell me whatever I need to hear in any voice I want & it wont talk back or get mad when I interrupt it. Might even fuck around & fall in lovepic.twitter.com/GIRyhZYj9j — Nick St. Pierre (@nickfloats) July 31, 2024

Le prime dimostrazioni della modalità vocale avanzata di ChatGPT sono impressionanti

ChatGPT afferma di poter interagire con input di decine di lingue, con un risultato che può variare a seconda di dialetti e varianti regionali. E la sua capacità con linguaggi e pronuncia è dimostrato da un video apparso su YouTube.

Nella clip qui riportata, l’Intelligenza Artificiale va a correggere la pronuncia delle parole francesi dell’utente, fornendo suggerimenti specifici sulla regolazione dell’inflessione.

Sebbene l’IA abbia dimostrato alcune incertezze con alcuni accenti (come con il turco), con l’inglese è in grado di imitare ogni tipo di parlata, variando anche tra le varie zone come New York, Boston e il Wisconsin. Altri video mostrano anche la funzione vocale avanzata di ChatGPT che canta adottando diversi stili oppure cercando di imitare in modo simpatico il verso di animali come rane e gatti. Da quanto emerge, le voci sono sia maschili che femminili e, come ampliamente preventivabile, non è presente la voce di Sky, ritenuta troppo simile a quella di Scarlett Johansson.

Anche chi non ha ancora a disposizione la nuova voce di ChatGPT potrà presto testare con mano le sue potenzialità. Secondo Taya Christianson, portavoce di OpenAI, questa sarà disponibile per tutti gli utenti ChatGPT Plus a partire dal prossimo autunno.