Semantic Scholar riassume qualsiasi paper tecnico in una singola frase

Conoscenza dai libri

Proprio quello che mi ci voleva: un tool AI che riassume i paper tecnici sull’AI!

Semantic Scholar fa esattamente questo, riassume i paper scientifici (per ora solo nelle discipline informatiche) in una singola frase, con quella che gli autori hanno chiamato TLDR generation. “TLDR”, per chi non butta via le proprie giornate su Reddit, è un acronimo che sta per “too long; didn’t read”, ovvero quello che la gente risponde quando qualcuno scrive un post troppo prolisso, oppure rimanda a un documento che i destinatari considerano troppo lungo da leggere. Mi mandi un documento di venti pagine? Ti rispondo con un TL;DR.

Semantic Scholar - Ashish Vaswani
Semantic Scholar – ricerca su Ashish Vaswani

La “TLDR generation” di questo nuovo tool creato dall’Allen Institute for AI, che come tutti i moderni modelli di Natural Language Processing si basa su un’architettura di tipo Transformer, riassume un intero paper in una frase estraendo dal documento sei categorie: disciplina, problema che si intende discutere, il contributo che si offre, dettagli o descrizione, risultati ottenuti e infine il valore o il significato di questi risultati.

Le frasi riassuntive quindi includeranno da due a quattro categorie (mai tutte e sei) per cercare di offrire una panoramica sufficientemente esaustiva di quello che contiene il paper.

Semantic Scholar - Judea Pearl
Semantic Scholar – ricerca su Judea Pearl. Notare come il suo paper informatico ha il riassunto TLDR, mentre il paper filosofico non lo ha.

Certo, non sarà da una frase che si acquisiscono le nozioni di un intero paper, ma almeno potremo vedere se il documento ci interessa ancora prima di leggere l’abstract.

Per provarlo: Semantic Scholar.

La ricerca si trova qui. Ho provato a riassumerla in una singola frase con Semantic Scholar e ho ottenuto questo: “We introduce TLDR generation for scientific papers, a new automatic summarization task with high source compression, requiring expert background knowledge and complex language understanding.” Abbastanza accurato, no?

Mi sono appassionato all'intelligenza artificiale da quando ho potuto vedere all'opera i primi sistemi esperti negli anni '80. Già dal 1989 mi occupavo di cybersecurity (analizzando i primi virus informatici) ma non ho mai smesso di seguire gli sviluppi dell'AI. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.