Imitare la voce di qualunque persona alla perfezione: ecco Lyrebird

Lyrebird, servizio lanciato dall'omonima società canadese, dimostra che è oggi possibile imitare - con un grado di accuratezza stupefacente - la voce di qualunque persona. Molteplici le implicazioni legali.

Imitare qualunque voce umana in maniera perfetta da oggi è possibile. Lo sostengono i tecnici di Lyrebird, una startup canadese che sembra aver ottenuto risultati mai raggiunti finora.

Registrando un campione vocale della lunghezza di un minuto, l’intelligenza artificiale di Lyrebird è capace di elaborare tale traccia sonora e produrre un modello vocale utilizzabile per generare qualunque frase usando una voce sintetizzata equiparabile con quella originale.


Grazie a un’architettura distribuita sul cloud, Lyrebird può appoggiarsi a una configurazione multi-GPU in grado di produrre ben 1.000 frasi in meno di mezzo secondo.

L’abilità di Lyrebird non è solamente quella di creare file audio contenenti registrazioni generate ad arte indistinguibili dalla voce originale ma anche di variare l’intonazione del parlato così da denotare stress, ansia, tristezza, allegria, timidezza e così via.
Lyrebird, che prende il nome dall’uccello lira (o menura), pennuto di grosse dimensioni capace di riprodurre i suoni con un elevato grado di accuratezza, crea una sorta di “DNA vocale“, una firma che raccoglie tutte le informazioni sul timbro di qualunque persona e che viene poi sfruttata per generare i file audio.

Alcuni esempi sono pubblicati a questo indirizzo.

Le implicazioni sono evidenti e come spiegano gli ideatori di Lyrebird, l’obiettivo era in primis quello di dimostrare come le registrazioni audio possano essere falsificate: è possibile, insomma, mettere in bocca di qualcuno parole che questi non ha mai pronunciato.

E se anche in Italia è assolutamente legale registrare le chiamate telefoniche (a patto che si partecipi alla conversazione; vedere È legale registrare telefonate con un programma apposito?), da oggi si avrà uno strumento in più per confutare le registrazioni e contestarne il valore probatorio.

Le API di Lyrebird, che permetteranno a qualunque sviluppatore di generare frasi sintetizzate partendo da una voce registrata e inserendo il testo da far pronunciare (text-to-speech), saranno disponibili a questo indirizzo nel corso delle prossime settimane.

Ti consigliamo anche

Link copiato negli appunti