
L’International Institute of Information Technology a Hyderabad, in India, e l’Università Autonoma di Barcellona hanno pubblicato RoadText-1K, un dataset contenente 1000 video di pochi secondi presi dal cruscotto di un’auto. Ogni video evidenzia i testi presenti sui vari cartelli stradali, sull’asfalto, sulle insegne dei negozi e sugli autoveicoli (ad es. targhe, numeri degli autobus), tutti correttamente annotati.
La pubblicazione di questo tipo di database è di grande aiuto per la ricerca, soprattutto quella effettuata con poche risorse (magari nelle università), perché semplifica il lavoro dei ricercatori e li aiuta a concentrarsi sui loro studi senza fargli perdere troppo tempo a cercare i dataset adatti. Nell’ambito della guida autonoma in particolare i migliori dataset sono generalmente in mano alle grandi aziende, che tranne qualche caso tendono a non volerli condividere con i loro potenziali concorrenti.
Ma poiché la ricerca al di fuori di queste aziende è comunque di fondamentale importanza, la presenza di dataset di qualità rilasciati gratuitamente e senza particolari copyright è molto utile per condurre studi o indagini. Questo progetto in particolare è il primo a concentrarsi sui testi catturati durante la guida. Esso viene presentato brevemente in questo video, più approfonditamente in questo paper ed è scaricabile dal link presente in fondo a questa pagina.