Il federated learning potrebbe non tutelare completamente la privacy

Chip

Il federated learning è una tecnica che consente di addestrare modelli AI su dataset distribuiti, ovvero divisi e presenti su sistemi separati, come se fossero un unico grande dataset. Questo avviene quando le parti non vogliono condividere i loro dati le une con le altre (pensiamo ad esempio a un ambiente ospedaliero, dove i dataset contengono dati sensibili che non è possibile condividere con altri reparti o con altri ospedali).

Con il federated learning è possibile mantenere i vari dataset sui rispettivi server, senza che vi sia scambio o trasferimento di dati, ma godere comunque di un algoritmo addestrato usando i dati di tutte le parti che collaborano al training.

La tecnologia è interessante anche per il settore finanziario, dove le società coinvolte hanno necessità di addestrare algoritmi – ad esempio per il rilevamento delle frodi – usando i dati di tutte le aziende partecipanti, ma nessuna ha intenzione di condividere i propri dati con le altre.

Ricercatori dell’Università di Stavanger, in Norvegia, della Rheinisch-Westfälische Technische Hochschule Aachen e dell’Università di Colonia, entrambe in Germania, hanno tuttavia dimostrato che è possibile effettuare un reverse engineering delle tecniche di federated learning per recuperare i dati sottostanti, che si intendeva mantenere privati, a condizione che l’attaccante abbia accesso agli aggiornamenti dell’algoritmo condiviso.

Questo problema, se non risolto, potrebbe ora rendere la tecnica meno appetibile in tutti quei casi di addestramento collaborativo dove è necessaria una maggiore privacy dei dati.

Per approfondire: Towards General Deep Leakage in Federated Learning

Sono Head of Artificial Intelligence di SNGLR Holding AG, un gruppo svizzero specializzato in tecnologie esponenziali con sedi in Europa, USA e UAE, dove curo i programmi inerenti all'intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Ho trascorso la maggior parte della carriera – trent'anni - nel settore della cybersecurity, dove fra le altre cose sono stato consigliere del Ministro delle Comunicazioni e consulente di Telespazio (gruppo Leonardo). Oggi mi occupo prevalentemente di intelligenza artificiale, con consulenze sull'AI presso aziende private e per la Commissione Europea, dove collaboro con la European Defence Agency e il Joint Research Centre. Questo blog è personale.