
Proprio quello che mi ci voleva: un tool AI che riassume i paper tecnici sull’AI!
Semantic Scholar fa esattamente questo, riassume i paper scientifici (per ora solo nelle discipline informatiche) in una singola frase, con quella che gli autori hanno chiamato TLDR generation. “TLDR”, per chi non butta via le proprie giornate su Reddit, è un acronimo che sta per “too long; didn’t read”, ovvero quello che la gente risponde quando qualcuno scrive un post troppo prolisso, oppure rimanda a un documento che i destinatari considerano troppo lungo da leggere. Mi mandi un documento di venti pagine? Ti rispondo con un TL;DR.

La “TLDR generation” di questo nuovo tool creato dall’Allen Institute for AI, che come tutti i moderni modelli di Natural Language Processing si basa su un’architettura di tipo Transformer, riassume un intero paper in una frase estraendo dal documento sei categorie: disciplina, problema che si intende discutere, il contributo che si offre, dettagli o descrizione, risultati ottenuti e infine il valore o il significato di questi risultati.
Le frasi riassuntive quindi includeranno da due a quattro categorie (mai tutte e sei) per cercare di offrire una panoramica sufficientemente esaustiva di quello che contiene il paper.

Certo, non sarà da una frase che si acquisiscono le nozioni di un intero paper, ma almeno potremo vedere se il documento ci interessa ancora prima di leggere l’abstract.
Per provarlo: Semantic Scholar.
La ricerca si trova qui. Ho provato a riassumerla in una singola frase con Semantic Scholar e ho ottenuto questo: “We introduce TLDR generation for scientific papers, a new automatic summarization task with high source compression, requiring expert background knowledge and complex language understanding.” Abbastanza accurato, no?