
Spesso è l’intelligenza artificiale a prendere spunto dal cervello biologico per le sue architetture, ora però è la ricerca AI ad avere aiutato le neuroscienze a dimostrare un meccanismo usato dal cervello.
Parliamo nuovamente di DeepMind, l’azienda di Google famosa per aver creato software di intelligenza artificiale in grado di battere i migliori giocatori umani a scacchi, go e shogi. In uno studio pubblicato recentemente su Nature, l’azienda di Londra ha dimostrato che il cervello prevede le ricompense come farebbe l’intelligenza artificiale.
La dopamina è un neurotrasmettitore associato alle gratificazioni modulate dalle aspettative, aumentando o diminuendo il rilascio in base alla differenza fra risultato e aspettativa. Per fare un esempio, se otteniamo una ricompensa migliore rispetto a quella che ci aspettavamo i neuroni rilasciano una dose maggiore di dopamina, mentre se la ricompensa è minore rispetto alle aspettative il rilascio diminuisce o potrebbe essere addirittura soppresso.
Essa funziona quindi come un meccanismo di reinforecement learning per il nostro cervello, correggendo le aspettative e spingendoci a migliorare le previsioni delle ricompense. Quello che hanno scoperto i ricercatori di DeepMind però è che la distribuzione dei neuroni di dopamina nel cervello segue un modello chiamato distributional reinforcement learning, che è lo stesso adottato da algoritmi AI.
Nel distributional reinforcement learning i neuroni non stabiliscono una media delle aspettative, adottando un unico valore calcolato come media di tutti quelli previsti, bensì assumono valori diversi e si distribuiscono a seconda delle probabilità che questi si verifichino. Semplificando al massimo, se ci aspettiamo che per noi vi sia una possibilità su dieci di ricevere una certa gratificazione, il cervello non stabilirà una media di 0,1 spalmata su tutti i neuroni dopaminergici, bensì assegnerà al 90% dei neuroni una previsione di risultato negativo, e al 10% dei neuroni una previsione di risultato positivo.
In alcuni test effettuati sui topi, grazie alla collaborazione di un team di Harvard, DeepMind ha avuto la prova che il cervello biologico adotta il distributional reinforcement learning già usato da tempo nelle reti neurali artificiali. Questa è una scoperta che conferma la validità del metodo, come ha lasciato intendere Matt Botvinick, direttore della ricerca sulle neuroscienze presso DeepMind, affermando che “se il cervello lo usa, probabilmente è una buona idea”.
Per approfondire: The Brain Predicts Reward Like an AI, Says New DeepMind Research