
In un recente studio, Google ha presentato GoEmotions, un dataset annotato di emozioni composto da 58.000 commenti presi da Reddit, in particolare dai principali subreddit in lingua inglese, con una classificazione di 27 categorie di emozioni.
Di queste, 12 sono state classificate come emozioni positive, 11 negative e 4 come emozioni ambigue. Alle ventisette emozioni ne è stata aggiunta una ventottesima, definita “neutra”.
Scopo del dataset è il suo utilizzo per compiti di interpretazione della conversazione che richiedono una delicata discriminazione tra le emozioni individuate. Google, inoltre, offre un tutorial che illustra come utilizzare GoEmotions per addestrare una rete neurale al fine di raccomandare gli emoji corretti in base alla conversazione.
Per approfondire: GoEmotions: A Dataset for Fine-Grained Emotion Classification