Deep learning: molti ostacoli prima di trovare il modello giusto

Stoffa

Una delle domande che dovreste porre a un fornitore che vi propone una data soluzione di machine learning è perché abbia scelto di offrirvi proprio quel modello, incalzandolo magari con ulteriori domande sul perché altri modelli siano stati scartati.

Idealmente quella che dovreste ricevere è una spiegazione particolareggiata dei vari tentativi effettuati nel creare un modello che raggiungesse i requisiti del progetto, con una descrizione fatta di test andati a vuoto, di scarsa accuratezza, di overfitting. Fino all’epilogo dove si è finalmente trovato il modello perfetto per le vostre esigenze.

Qualcosa di simile si può leggere in un resoconto che uno studente di ingegneria ha scritto per documentare i suoi tentativi di creare un classificatore di tessuti basato sulle reti neurali convoluzionali. Il classificatore, analizzando un’immagine, doveva riconoscere se la stoffa fosse stata lavorata a maglia oppure tessuta. Partendo da TensorFlow e Keras, lo studente inizia dalla scelta del dataset fino alla produzione della rete neurale funzionante, passando ovviamente attraverso diversi illuminanti errori.

Una lettura utile sia per chi inizia ora a creare modelli in deep learning, sia per chi vuole capire cosa si nasconde dietro una rete neurale funzionante: AI for Textiles — Convolutional Neural Network Based Fabric Structure Classifier

Mi sono appassionato all'intelligenza artificiale da quando ho potuto vedere all'opera i primi sistemi esperti negli anni '80. Già dal 1989 mi occupavo di cybersecurity (analizzando i primi virus informatici) ma non ho mai smesso di seguire gli sviluppi dell'AI. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.