MuZero, intelligenza artificiale di DeepMind in grado di padroneggiare qualunque gioco senza conoscerne le regole

Cos'è e come funziona MuZero, la più recente, più aggiornata, versatile e performante intelligenza artificiale realizzata dal team di ricercatori di DeepMind (Google-Alphabet).
MuZero, intelligenza artificiale di DeepMind in grado di padroneggiare qualunque gioco senza conoscerne le regole

DeepMind, società di proprietà di Google che si occupa di progettare e sviluppare soluzioni basate sull’intelligenza artificiale, ha da poco tolto il velo da MuZero, evoluzione di quell’AlphaZero che ha dato tante soddisfazioni in passato: AlphaZero, l’intelligenza artificiale di Google DeepMind che impara da sola.

Nel 2016 gli ingegneri di DeepMind presentarono l’intelligenza artificiale AlphaGo che fu in grado di battere sempre i giocatori più esperti di Go.
A distanza di un anno fu presentata AlphaGo Zero che “imparò” tutti i segreti e le migliori tattiche per vincere a Go semplicemente giocando contro se stessa.
È stata poi la volta della già citata AlphaZero capace di giocare non soltanto a Go ma anche a scacchi e shogi poggiando su un unico algoritmo.

Ciò che legava tutte queste intelligenze artificiali è che esse conoscevano le regole dei vari giochi ed erano state preventivamente addestrate per ottenere sempre il migliore risultato possibile. La prerogativa della nuova MuZero è che non ha bisogno di conoscere le regole di un gioco per padroneggiarlo: l’intelligenza artificiale è capace di impararle da sola sviluppando le migliori strategie per vincere.

Piuttosto che far leva su un modello unico e omnicomprensivo, MuZero cerca di considerare quei fattori che sono importanti per assumere una decisione. Un comportamento che, come si sottolinea da DeepMind, è qualcosa di simile a ciò che fa ogni giorno un essere umano.
Quando si guarda fuori dalla finestra e si scorgono nubi scure che si formano all’orizzonte la maggior parte delle persone non pensa a fenomeni fisici e meteorologici come la condensazione e la pressione atmosferica. Se si deve uscire il pensiero correrà invece a come ci si dovrebbe vestire in maniera adeguata. MuZero fa qualcosa di simile.

Per prendere una decisione la nuova intelligenza artificiale di DeepMind tiene conto di tre fattori: prende in considerazione l’esito della sua precedente decisione, la posizione attuale in cui si trova e la migliore linea d’azione da adottare successivamente.
Questo approccio apparentemente semplice fa di MuZero la soluzione di intelligenza artificiale che sia mai stata finora realizzata.

Durante i suoi test si è potuto verificare che <i<MuZero ha evidenziato prestazioni comparabili con quelle di AlphaZero a scacchi, Go e shogi dimostrandosi invece nettamente migliore di tutti i suoi predecessori quando alle prese con i giochi Atari. Più tempo è stato concesso a MuZero per esaminare la migliore azione da porre in campo, meglio si è comportata l’intelligenza artificiale.

Finora si è sempre parlato di giochi e videogiochi. Ma quali possono essere le applicazioni pratiche di MuZero?
Gli esperti di DeepMind assicurano di essere già al lavoro per sviluppare un algoritmo maggiormente “general-purpose” capace di migliorare le abilità di apprendimento di MuZero nella gestione di problemi complessi in campi come la robotica dove non ci sono regole chiare stabilite a priori.

Ti consigliamo anche

Link copiato negli appunti