Nel 2016 DeepMind introdusse AlphaGo, il primo modello di intelligenza artificiale creato appositamente per battere gli umani all’antico gioco del Go. In un articolo sulla rivista Nature ora l’azienda ha presentato MuZero, un significativo passo avanti nella ricerca di algoritmi generalisti. MuZero è in grado di giocare a Go, a scacchi, a shogi e a diversi giochi Atari senza che sia necessario spiegargli le regole. Questo grazie alla sua capacità di studiare strategie vincenti anche in ambienti sconosciuti.
Per anni i ricercatori hanno cercato metodi in grado sia di apprendere un modello che spiegasse l’ambiente, sia di utilizzare tale modello per pianificare le migliori decisioni da prendere. MuZero risolve questo problema grazie a un modello che si concentra solo sugli aspetti più importanti dell’ambiente per pianificare le sue mosse. Combinando tale modello con la ricerca di AlphaZero, MuZero ha fissato un nuovo record sul benchmark dell’Atari (lo ricorderete, ne abbiamo parlato qui), eguagliando allo stesso tempo le eccellenti prestazioni di AlphaZero su Go, scacchi e shogi.
Per approfondire: MuZero: Mastering Go, chess, shogi and Atari without rules