IBM, riconoscimento vocale preciso quasi come quello umano

IBM comunica di aver messo a punto un sistema capace di riconoscere e trascrivere il parlato umano con un tasso di errore non superiore al 5,5%.

I portavoce di IBM hanno comunicato di aver messo a punto un sistema per il riconoscimento automatico del parlato umano con un livello di precisione mai raggiunto prima.
Secondo Big Blue la piattaforma appena realizzata avrebbe evidenziato un tasso di errore del 5,5%, percentuale che IBM considera ormai molto vicina alle abilità umane. Stando alle valutazioni dei tecnici di IBM, infatti, come conferma George Saon, uno dei principali responsabili del settore ricerca, nel caso di una trascrizione effettuata da una persona in carne e ossa non si sarebbe mai andati oltre il 5,1%.


Il risultato ottenuto da IBM supera anche quello annunciato dai tecnici dei laboratori Microsoft ad ottobre (Microsoft, riconoscimento vocale preciso come quello umano) e il traguardo è adesso quello di arrivare ancora più vicini al tasso di errore del 5,1%.

IBM ha spiegato di aver combinato l’utilizzo di reti neurali artificiali, la cosiddetta Long short-term memory e WaveNet, intelligenza artificiale capace di riconoscere il linguaggio umano ed estrarre le informazioni semantiche “ascoltando” le varie frasi. WaveNet è stato a sua volta abbinato a tre solidi modelli acustici.

Strumenti come quello presentato da IBM consentiranno anche di migliorare le performance degli assistenti digitali come Siri e Alexa.

Ti consigliamo anche

Link copiato negli appunti