L’intelligenza artificiale studia le proteine associate al Coronavirus

Rendering di una struttura proteica associata al SARS-CoV-2 come prevista da AlphaFold
Rendering di una struttura proteica associata al SARS-CoV-2 come prevista da AlphaFold

AlphaFold è un modello di intelligenza artificiale creato da DeepMind, l’azienda di Google che ha realizzato sistemi come AlphaGo (che nel 2016 sconfisse il campione del mondo di Go), AlphaZero e AlphaStar.

Il sistema è stato progettato appositamente per predire il ripiegamento proteico partendo semplicemente dalla squenza di aminoacidi, uno dei problemi più difficili (e dispendiosi) da risolvere nella ricerca medica. Comprendere quale struttura tridimensionale prenderà una proteina – conoscendo solo la lunga lista di aminoacidi – richiede risorse computazionali enormi, ma è essenziale per i ricercatori. La struttura 3D consente infatti di capire come si comporterà la proteina in presenza di altre molecole, aprendo le porte a una serie di test e simulazioni per comprendere quali farmaci saranno efficaci e quali inutili.

Esperimenti per predire la struttura 3D di una proteina possono impiegare mesi per concretizzarsi, e non sempre ci possiamo permettere il lusso di aspettare così tanto. Ecco perché la strategia di AlphaFold non è cercare un risultato che sia esatto al 100%, bensì una previsione che si avvicini il più possibile a quel 100% senza che sia necessario raggiungerlo. Così facendo si può indirizzare la ricerca su determinate strutture proteiche piuttosto che su altre, riducendo notevolmente i tempi.

A seguito dell’attuale emergenza sanitaria causata dal Coronavirus SARS-CoV-2 DeepMind ha individuato alcune proteine associate al virus ma non ancora adeguatamente studiate dalla comunità scientifica. Mettendo al lavoro i suoi algoritmi di deep learning l’azienda inglese ha elaborato “previsioni strutturali” di queste proteine, mettendole quindi a disposizione di tutti con un semplice link ai risultati. DeepMind tiene a sottolineare che queste strutture non sono state verificate con test sperimentali (quelli che richiederebbero i mesi di tempo) né sottoposte a una peer review, ma le probabilità che esse si avvicinino a quelle reali è elevata. Del resto AlphaFold ha vinto l’ultimo CASP (Critical Assessment of protein Structure Prediction) staccando nettamente gli altri concorrenti in una competizione che mirava a trovare modelli in grado di avvicinarsi il più possibile all’effettivo ripiegamento delle proteine.

L’intelligenza artificiale, in particolare il deep learning, è ideale per trovare pattern e sequenze invisibili all’uomo o irraggiungibili per i modelli tradizionali. Prevedere il ripiegamento è uno dei compiti più lunghi e difficili nello studio di una proteina, ma con l’aiuto dell’AI saremo in grado di reagire più velocemente alle minacce rappresentate da patogeni nuovi e ancora sconosciuti.

Mi sono appassionato all'intelligenza artificiale da quando ho potuto vedere all'opera i primi sistemi esperti negli anni '80. Già dal 1989 mi occupavo di cybersecurity (analizzando i primi virus informatici) ma non ho mai smesso di seguire gli sviluppi dell'AI. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton e una certificazione Artificial Intelligence Professional da IBM. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Partecipo ai lavori della European AI Alliance della Commissione Europea e del Consultation Forum for Sustainable Energy in the Defence and Security Sector della European Defence Agency. Questo blog è personale.