
L’idea in sé non è nuova: monitorare in forma aggregata le richieste di natura medica sui motori di ricerca per capire se in una data zona si stia diffondendo una determinata malattia. Faccio un esempio banale, se fate clic qui vedrete i trend di ricerca della parola “punture” su Google. Come vedete sale in primavera, raggiunge il picco in estate e scende in autunno, perché probabilmente le punture di insetto si concentrano in quei mesi. Controllando la cartina dell’Italia in basso si potrà vedere come il termine sia cercato più nelle regioni meridionali che in quelle settentrionali.
In maniera simile, ma con dati più completi e dettagliati, è possibile controllare il numero di ricerche online basate su sintomi o altri dettagli medici, che può suggerire l’insorgenza di una situazione medica in una data area geografica prima ancora che i casi arrivino alle guardie mediche o ai pronto soccorso.
Sulla scia di questa possibilità a Microsoft hanno realizzato il Bing Coronavirus Query Set, un dataset ottenuto dalle ricerche su Bing (solo desktop) dal 1 Gennaio fino a questi giorni. Il dataset, che sarà aggiornato mensilmente, contiene tutte le ricerche degli utenti esplicitamente o implicitamente collegate al Covid-19.
Analizzare i dati contenuti nel Bing Coronavirus Query Set potrebbe aiutare a capire dove si sta spostando il virus, o se questo stia tornando in zone che aveva già colpito.
Il dataset è disponibile su Github: Bing Coronavirus Query Set