DeepMind migliora la generalizzazione dell’AI con Agent57

Atari2600a
Un Atari2600a (ora che ci penso, mi chiedo che fine abbia fatto il mio...) - Foto di joho345

I giochi sono da sempre uno dei domini preferiti per testare e sviluppare l’intelligenza artificiale, poiché offrono sfide costruite appositamente per mettere in difficoltà l’essere umano, stimolandolo a trovare una o più soluzioni intelligenti. Un gioco non chiede a un concorrente di contare tutti i numeri primi da 2 a 99991, attività impossibile per una persona ma relativamente facile per un computer, bensì costringe il giocatore a muovere una figura per evitare un ostacolo, a lanciare un oggetto per colpire un avversario, a compiere una serie di azioni per raggiungere un risultato effettivo e misurabile.

Per risolvere le sfide i giocatori devono saper sperimentare e usare le risorse disponibili in tutti i modi consentiti, anche se non evidenti, cosa che noi chiamiamo creatività. Devono imparare a individuare pattern spesso impercettibili o infrequenti, cosa che chiamiamo intuito. Devono saper risolvere problemi complessi a volte anche con strategie innovative, imparando dai propri errori, cosa che chiamiamo intelligenza.

Non stupisce quindi che diverse pietre miliari dello sviluppo AI siano state scolpite su un campo da gioco, come fu per Deep Blue con gli scacchi, per Watson con Jeopardy, per Alpha Go e Alphago Zero con Go e molti altri. Spesso sono i giochi il benchmark che usiamo per capire con quale velocità stia avanzando lo sviluppo dell’intelligenza artificiale.

Prendiamo ad esempio l’Arcade Learning Environment (ALE), dal quale è derivato l’Atari57, un metodo per valutare lo sviluppo di un sistema di intelligenza artificiale in base ai risultati ottenuti su 57 videogiochi originariamente creati per la console di gioco Atari 2600 (con la quale nei primissimi anni ottanta mi divertivo anch’io). Il test set è ideale per saggiare la versatilità di un sistema AI poiché ogni gioco richiede azioni e strategie diverse, utile per comprendere quanto un singolo sistema autonomo sia in grado di generalizzare.

DeepMind ha pubblicato in questi giorni i risultati dei suoi test sul sistema Agent57, un’AI in grado di giocare a tutti i videogame del set Atari57 riuscendo a superare in ogni singolo caso i punteggi ottenuti dagli umani. È la prima volta che un sistema di intelligenza artificiale raggiunge questo risultato. Sistemi precedenti infatti sono stati in grado di eccellere ad alcuni giochi, perdendo però rovinosamente ad altri. È per certi versi una delle grandi barriere dell’intelligenza artificiale attuale: superare di gran lunga gli esseri umani in un task specifico, non riuscendo però a fare niente di diverso da quello. La generalizzazione è una delle grandi sfide AI dei nostri tempi, per questo motivo ogni piccolo passo avanti è degno di nota.

Agent57 ha bisogno di training separati per ogni gioco, ma il sistema che vince ad Asteroids, a Solaris, a Space Invaders è sempre lo stesso (qui potete vedere una serie di video che mostrano l’AI che gioca a ognuno dei videogame). Questo significa che l’intelligenza artificiale è in grado di affrontare 57 problemi profondamente diversi, imparando e adottando una strategia separata per ognuno di essi e arrivando in ogni singolo caso a risultati che superano le performance umane. Con Agent57 la generalizzazione dell’AI oggi è un po’ più vicina.

Sul blog di DeepMind si possono avere maggiori informazioni sul software usato, incluse le tecnologie adottate e i tutti passi che il team di ricercatori ha compiuto per arrivare al sistema di oggi (i primi tentativi risalgono al 2012): Agent57: Outperforming the human Atari benchmark

Mi occupo da molti anni di intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Ho trascorso la maggior parte della carriera – trent'anni - nel settore della cybersecurity, dove fra le altre cose sono stato consigliere del Ministro delle Comunicazioni e consulente di Telespazio (gruppo Leonardo). Oggi mi occupo prevalentemente di intelligenza artificiale, lavorando con un'azienda leader del settore e partecipando a iniziative della Commissione Europea. Questo blog è personale e le opinioni espresse appartengono ai singoli autori.