Il federated learning potrebbe non tutelare completamente la privacy

Chip

Il federated learning è una tecnica che consente di addestrare modelli AI su dataset distribuiti, ovvero divisi e presenti su sistemi separati, come se fossero un unico grande dataset. Questo avviene quando le parti non vogliono condividere i loro dati le une con le altre (pensiamo ad esempio a un ambiente ospedaliero, dove i dataset contengono dati sensibili che non è possibile condividere con altri reparti o con altri ospedali).

Con il federated learning è possibile mantenere i vari dataset sui rispettivi server, senza che vi sia scambio o trasferimento di dati, ma godere comunque di un algoritmo addestrato usando i dati di tutte le parti che collaborano al training.

La tecnologia è interessante anche per il settore finanziario, dove le società coinvolte hanno necessità di addestrare algoritmi – ad esempio per il rilevamento delle frodi – usando i dati di tutte le aziende partecipanti, ma nessuna ha intenzione di condividere i propri dati con le altre.

Ricercatori dell’Università di Stavanger, in Norvegia, della Rheinisch-Westfälische Technische Hochschule Aachen e dell’Università di Colonia, entrambe in Germania, hanno tuttavia dimostrato che è possibile effettuare un reverse engineering delle tecniche di federated learning per recuperare i dati sottostanti, che si intendeva mantenere privati, a condizione che l’attaccante abbia accesso agli aggiornamenti dell’algoritmo condiviso.

Questo problema, se non risolto, potrebbe ora rendere la tecnica meno appetibile in tutti quei casi di addestramento collaborativo dove è necessaria una maggiore privacy dei dati.

Per approfondire: Towards General Deep Leakage in Federated Learning

Sono partner e fondatore di SNGLR Holding AG, un gruppo svizzero specializzato in tecnologie esponenziali con sedi in Europa, USA e UAE, dove curo i programmi inerenti l'intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI), della Association for Computing Machinery (ACM) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.