Microsoft ha costruito un supercomputer per OpenAI

Data center

Microsoft ha costruito per OpenAI (con cui l’anno scorso ha stretto un’alleanza del valore di 1 miliardo di dollari) uno dei cinque supercomputer più potenti al mondo, rendendo disponibili in Azure nuove infrastrutture per la formazione di modelli di intelligenza artificiale estremamente vasti e complessi.

Il supercomputer sviluppato per OpenAI (che lo userà in esclusiva) è un sistema con più di 285.000 core CPU, 10.000 GPU e 400 gigabit al secondo di connettività per ogni GPU. La macchina è disponibile su Azure, il servizio Cloud di Microsoft, e nonostante non siano stati rilasciati molti dettagli tecnici, si pensa che le sue diecimila GPU siano Nvidia V100, che con 7,8 teraflop a doppia precisione per ogni scheda gli farebbero effettivamente raggiungere l’olimpo dei primi 5 supercomputer al mondo.

OpenAI ha fra i suoi scopi quello di sviluppare l’intelligenza artificiale generale, ovvero l’AI “forte”, che generalizza, che comprende causa ed effetto, che si avvicini il più possibile all’intelligenza umana (per poi magari un giorno superarla). Un “moonshot” che a volte ha il sapore di una trovata di marketing, ma che non impedisce all’organizzazione di creare modelli molto avanzati come il Generative Pretrained Transformer 2 (GPT-2) e, più recentemente, il suo successore GPT-3.

Secondo Kevin Scott, Chief Technical Officer di Microsoft, “la cosa entusiasmante di questi modelli è l’ampiezza delle cose che permetteranno”, alludendo al fatto che i potenziali benefici andranno ben oltre i progressi limitati di un singolo modello AI. Scott ha quindi spiegato: “Si tratta di essere in grado di fare contemporaneamente centinaia di cose entusiasmanti nell’elaborazione del linguaggio naturale e centinaia di cose entusiasmanti nella computer vision, e quando inizi a vedere le combinazioni fra questi domini percettivi avrai nuove applicazioni che oggi sono difficili da immaginare”.

Per approfondire: Microsoft announces new supercomputer, lays out vision for future AI work

Mi sono appassionato all'intelligenza artificiale da quando ho potuto vedere all'opera i primi sistemi esperti negli anni '80. Già dal 1989 mi occupavo di cybersecurity (analizzando i primi virus informatici) ma non ho mai smesso di seguire gli sviluppi dell'AI. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.