Che canzone è questa: come funziona il nuovo riconoscimento di Google

Google lancia il nuovo meccanismo di riconoscimento delle canzoni basato sull'intelligenza artificiale: da oggi basta canticchiarle o fischettarle per saperne il titolo.

Google ha presentato oggi un nuovo meccanismo basato sull’utilizzo dell’intelligenza artificiale che permette di riconoscere i brani musicali automaticamente. Già in precedenza, toccando l’icona del microfono nella casella di ricerca di Google su Android, era possibile accedere a una funzionalità che permetteva di conoscere il titolo di una canzone riprodotta alla radio, in TV, in negozio o comunque da un qualsiasi speaker. Tale funzionalità era richiamabile toccando l’icona raffigurante una nota musicale.

La nuova funziona “Che canzone è questa” consente di riconoscere le canzoni in pochi istanti, comprese quelle canticchiate, fischiettate o semplicemente accennate.

La novità è stata chiamata “Hum to search” a sottolineare il fatto che quando si ha in testa una canzone della quale non si ricorda né il titolo né l’autore, si può abbozzarne il motivo per conoscere i brani simili.

È sufficiente pronunciare “OK Google, che canzone è questa” per avviare l’assistente digitale e provare a canticchiare la canzone da riconoscere. Facendolo per 10-15 secondi, si potrà scoprire il titolo della canzone in pochi secondi. Per ciascun pezzo indicato, Google indicherà una percentuale di affinità.
In alternativa si può toccare l’icona raffigurante il microfono nella casella di ricerca Google e scegliere Cerca un brano.

A questo punto si potrà canticchiare la canzone della quale si vuole sapere il titolo: l’intelligenza artificiale di Google ne avvierà immediatamente il riconoscimento.

In ultima battuta, Google mostrerà la lista delle canzoni che risultano più simili a quella canticchiata.

Come funziona il meccanismo per cercare una canzone e risalire al titolo?

La melodia di ciascuna canzone ha una sua “impronta digitale” che è unica.
Gli sviluppatori di Google hanno costruito modelli basati sul machine learning in grado di abbinare semplici fischi e ronzii a quelle stesse impronte digitali.

Quando l’utente canticchia una canzone, i modelli di machine learning trasformano l’audio in una sequenza numerica che rappresenta la melodia della canzone. I modelli sono addestrati per identificare le canzoni sulla base di una varietà di fonti, tra cui il canto, il fischio, i ronzii così come le registrazioni in studio. Gli algoritmi eliminano dettagli come gli strumenti di accompagnamento, il timbro e il tono della voce: ciò che rimane è la sequenza numerica della canzone o sua impronta digitale.

Il meccanismo di Google confronta le sequenze con centinaia di migliaia di brani per poi identificare in tempo reale le possibili corrispondenze.

Ti consigliamo anche

Link copiato negli appunti