Meta presenta Voicebox: è il primo modello di AI generativa per il parlato

Voicebox di Meta può dare una voce naturale agli assistenti virtuali ma è anche un strumento di supporto per ipovedenti e creators.

Nuovo giorno, nuovo aggiornamento sull’intelligenza artificiale generativa. In queste ore Meta ha infatti annunciato il suo ultimo modello AI: si chiama Voicebox ed è stato pensato per la creazione di clip sonore, uno strumento di supporto per persone ipovedenti e – perché no – per i creatori di contenuti.

Meta annuncia Voicebox: a cosa serve il modello di AI generativa

Pur essendo ancora in fase sperimentale, l’azienda guidata da Mark Zuckerberg (che di recente ha anche presentato la nuova generazione del Meta Quest) ha diffuso un comunicato stampa utile per comprendere il funzionamento e la potenziale utilità di Voicebox.

Meta spiega che il suo modello di AI generativa può produrre clip audio di alta qualità e modificare l’audio pre-registrato. Può rimuovere i disturbi dalle registrazioni, come ad esempio il clacson di un’auto oppure l’abbaiare di un cane in sottofondo. Sempre però preservando il contenuto e la qualità dello stesso.

Meta Voicebox

Secondo il colosso statunitense, i modelli di intelligenza artificiale multiuso come Voicebox potrebbero fornire una voce “naturale” agli assistenti virtuali oppure darne una ai NPC (personaggi non giocanti) nel metaverso. Potrebbero inoltre consentire agli ipovedenti di ascoltare messaggi scritti da amici, parenti e colleghi di lavoro letti dall’AI con una voce molto simile alla loro. Per quanto riguarda i creator, invece, Meta afferma che Voicebox potrebbe fornire loro degli strumenti per creare e modificare le tracce audio per i video, ad esempio.

Un uso responsabile: parla Meta

A detta di Zuckerberg e soci, Voicebox può inaugurare una nuova era per l’AI generativa relativa al parlato. Tuttavia, al pari di altre importanti innovazioni nel campo dell’intelligenza artificiale, anche questo modello potrebbe essere utilizzato impropriamente e creare qualche difficoltà. Riconoscendo questo pericolo, Meta ha redatto un documento completo di tutti i dettagli riguardanti un classificatore realizzato ad-hoc che è in grado di notare la differenza tra un parlato autentico e un audio generato invece con Voicebox.

L’uso dell’intelligenza artificiale, conclude Meta, dovrebbe essere sempre responsabile. Ecco perché, nonostante Voicebox sia ancora in una fase sperimentale, l’azienda ha voluto già condividere i suoi primi risultati nell’ambito dell’AI generativa.

Ti consigliamo anche

Link copiato negli appunti