MuZero eccelle in diversi giochi imparando le regole autonomamente

Nel 2016 DeepMind introdusse AlphaGo, il primo modello di intelligenza artificiale creato appositamente per battere gli umani all’antico gioco del Go. In un articolo sulla rivista Nature ora l’azienda ha presentato MuZero, un significativo passo avanti nella ricerca di algoritmi generalisti. MuZero è in grado di giocare a Go, a scacchi, a shogi e a diversi giochi Atari senza che sia necessario spiegargli le regole. Questo grazie alla sua capacità di studiare strategie vincenti anche in ambienti sconosciuti.

Per anni i ricercatori hanno cercato metodi in grado sia di apprendere un modello che spiegasse l’ambiente, sia di utilizzare tale modello per pianificare le migliori decisioni da prendere. MuZero risolve questo problema grazie a un modello che si concentra solo sugli aspetti più importanti dell’ambiente per pianificare le sue mosse. Combinando tale modello con la ricerca di AlphaZero, MuZero ha fissato un nuovo record sul benchmark dell’Atari (lo ricorderete, ne abbiamo parlato qui), eguagliando allo stesso tempo le eccellenti prestazioni di AlphaZero su Go, scacchi e shogi.

Per approfondire: MuZero: Mastering Go, chess, shogi and Atari without rules

Mi occupo da molti anni di intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Ho trascorso la maggior parte della carriera – trent'anni - nel settore della cybersecurity, dove fra le altre cose sono stato consigliere del Ministro delle Comunicazioni e consulente di Telespazio (gruppo Leonardo). Oggi mi occupo prevalentemente di intelligenza artificiale, con consulenze sull'AI presso aziende private e per la Commissione Europea, dove collaboro con la European Defence Agency e il Joint Research Centre. Questo blog è personale e le opinioni espresse appartengono ai singoli autori.