Google rilascia Dataset Search: un accesso a 25 milioni di dataset

Data center

Dopo un anno di beta-test, Google ha rilasciato il nuovo servizio Dataset Search, uno strumento che consente di trovare i dataset necessari per condurre le proprie ricerche sul machine learning.

Finora quello che faceva chiunque avesse bisogno di acquisire un dataset (nell’impossibilità di crearne uno proprio) era usare comunque il proprio motore di ricerca preferito e cercare i dataset necessari ai propri progetti. Basta provare a cercare ad esempio “dataset chairs” nella tradizionale maschera di ricerca di Google per ottenere svariati risultati pronti all’uso. Da lì in poi era compito del ricercatore capire se il dataset fosse in un formato utile, quali diritti avesse per utilizzarlo, ecc.

Con Dataset Search, che indicizza quasi 25 milioni di dataset, invece è possibile filtrare i risultati in base ai formati desiderati (ad es. tabelle, immagini, testo), a quanto siano attuali i dati e ai diritti di utilizzo (ad es. commerciale o non commerciale), dando la possibilità a chi rilascia i dataset di renderli rivelabili utilizzando lo standard aperto schema.org.

Ovviamente questa nuova funzione di ricerca offre a Google informazioni sulle principali discipline per le quali si cercano dataset, che sono le geoscienze, la biologia e l’agricoltura, e ovviamente quali sono i termini di ricerca utilizzati più spesso.

Per approfondire: Discovering millions of datasets on the web

Sono partner e fondatore di SNGLR Holding AG, un gruppo svizzero specializzato in tecnologie esponenziali con sedi in Europa, USA e UAE, dove curo i programmi inerenti l'intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI), della Association for Computing Machinery (ACM) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.