Semantic Scholar riassume qualsiasi paper tecnico in una singola frase

Conoscenza dai libri

Proprio quello che mi ci voleva: un tool AI che riassume i paper tecnici sull’AI!

Semantic Scholar fa esattamente questo, riassume i paper scientifici (per ora solo nelle discipline informatiche) in una singola frase, con quella che gli autori hanno chiamato TLDR generation. “TLDR”, per chi non butta via le proprie giornate su Reddit, è un acronimo che sta per “too long; didn’t read”, ovvero quello che la gente risponde quando qualcuno scrive un post troppo prolisso, oppure rimanda a un documento che i destinatari considerano troppo lungo da leggere. Mi mandi un documento di venti pagine? Ti rispondo con un TL;DR.

Semantic Scholar - Ashish Vaswani
Semantic Scholar – ricerca su Ashish Vaswani

La “TLDR generation” di questo nuovo tool creato dall’Allen Institute for AI, che come tutti i moderni modelli di Natural Language Processing si basa su un’architettura di tipo Transformer, riassume un intero paper in una frase estraendo dal documento sei categorie: disciplina, problema che si intende discutere, il contributo che si offre, dettagli o descrizione, risultati ottenuti e infine il valore o il significato di questi risultati.

Le frasi riassuntive quindi includeranno da due a quattro categorie (mai tutte e sei) per cercare di offrire una panoramica sufficientemente esaustiva di quello che contiene il paper.

Semantic Scholar - Judea Pearl
Semantic Scholar – ricerca su Judea Pearl. Notare come il suo paper informatico ha il riassunto TLDR, mentre il paper filosofico non lo ha.

Certo, non sarà da una frase che si acquisiscono le nozioni di un intero paper, ma almeno potremo vedere se il documento ci interessa ancora prima di leggere l’abstract.

Per provarlo: Semantic Scholar.

La ricerca si trova qui. Ho provato a riassumerla in una singola frase con Semantic Scholar e ho ottenuto questo: “We introduce TLDR generation for scientific papers, a new automatic summarization task with high source compression, requiring expert background knowledge and complex language understanding.” Abbastanza accurato, no?

Mi occupo da molti anni di intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Ho trascorso la maggior parte della carriera – trent'anni - nel settore della cybersecurity, dove fra le altre cose sono stato consigliere del Ministro delle Comunicazioni e consulente di Telespazio (gruppo Leonardo). Oggi mi occupo prevalentemente di intelligenza artificiale, lavorando con un'azienda leader del settore e partecipando a iniziative della Commissione Europea. Questo blog è personale e le opinioni espresse appartengono ai singoli autori.