Nvidia presenta gli Omniverse Avatar, assistenti virtuali multifunzione

Avatar 3D di Jensen Huang, fondatore e CEO di NVIDIA

Nvidia ha annunciato Omniverse Avatar, una piattaforma generativa per creare avatar interattivi, che sfruttano modelli di intelligenza artificiale, e che un giorno potrebbero andare a popolare il “metaverso” (qualsiasi definizione si voglia dare oggi a questo termine).

In pratica si tratta di personaggi che possono fare riferimento a noi – come gli avatar nei videogiochi – ma che agiscono autonomamente a seconda del task che gli viene assegnato. Possono essere, ad esempio, assistenti virtuali che lavorano in un’azienda, prendendo ordini al ristorante, operando transazioni bancarie, oppure gestendo per conto nostro appuntamenti personali e prenotazioni.

Il software incorpora ovviamente sistemi come la comprensione del linguaggio naturale, l’interazione vocale, la visione artificiale, motori di raccomandazione e tecnologie di simulazione. Gli avatar creati nella piattaforma sono personaggi interattivi con grafica 3D che possono vedere, parlare, conversare su una vasta gamma di argomenti e comprendere l’intento naturale della controparte. Non si tratta quindi di “semplici” chatbot, ma di sistemi multimodali che possono essere utilizzati per applicazioni diverse in molteplici settori industriali.

Quello in basso, ad esempio, è l’Avatar di Jensen Huang, fondatore e CEO di Nvidia, che a questo proposito ha dichiarato: “L’alba degli assistenti virtuali intelligenti è arrivata. Omniverse Avatar combina tecnologie di grafica, simulazione e AI di Nvidia per realizzare alcune delle applicazioni in tempo reale più complesse mai create. I casi d’uso dei robot collaborativi e degli assistenti virtuali sono incredibili e di vasta portata“.

Avatar 3D di Jensen Huang, fondatore e CEO di NVIDIA

C’è da dire che Huang non è nuovo a farsi digitalizzare. Solo pochi mesi fa, durante il GTC Spring 2021, ha presentato le novità dell’azienda in diretta dalla sua cucina di casa, stupendo tutti quando a metà della presentazione si è capito che quella non era la cucina di casa e il presentatore non era davvero lui, bensì una versione digitale iper-realistica (qui potete vedere il momento in cui si scopre l’avatar digitale, e qui potete vedere come è stato realizzato).

Ma gli avatar non devono per forza assomigliare a qualcuno, anche se Nvidia ha puntato molto sull’effetto “caricatura” per far comprendere che l’opzione è comunque percorribile. L’azienda ha mostrato un caso d’uso dove gli schermi per le ordinazioni a cui ci siamo abituati in questi ultimi anni possono essere potenziati da un assistente virtuale che ci guarda, ci ascolta e ci parla, raccomandandoci quello che secondo lui preferiremmo mangiare.

Come spiegato dall’azienda, gli Omniverse Avatar usano molteplici tecnologie:

  • Il riconoscimento vocale è basato su NVIDIA Riva, un kit di sviluppo software che riconosce il parlato in più lingue. Riva è anche usato per generare risposte vocali simili a quelle umane usando capacità di text-to-speech.
  • La comprensione del linguaggio naturale si basa sul modello di linguaggio Megatron 530B che può riconoscere, comprendere e generare il linguaggio umano. Megatron 530B è un modello pre-addestrato che può, con poco o nessun training aggiuntivo, completare frasi, rispondere a domande su un ampio ventaglio di argomenti, riassumere storie lunghe e complesse, tradurre in altre lingue e gestire molti ambiti per i quali non è addestrato specificamente.
  • Il motore di raccomandazione è fornito da NVIDIA Merlin™, un framework che permette alle aziende di costruire sistemi di raccomandazione in deep learning in grado di gestire grandi quantità di dati per fornire suggerimenti più intelligenti.
  • Le capacità di percezione sono abilitate da NVIDIA Metropolis, un framework di computer vision per l’analisi video.
  • L’animazione degli avatar è affidata a NVIDIA Video2Face e Audio2Face™, tecnologie di animazione facciale e rendering 2D e 3D basate sull’AI.

Queste tecnologie sono poi composte in un’applicazione ed elaborate in tempo reale usando il NVIDIA Unified Compute Framework.

L’azienda continua dunque la sua avanzata nel segmento dell’AI generativa e dei media sintetici, sfornando innovazioni praticamente ogni anno. L’uso degli avatar che operano “in nome e per conto” di qualcuno già sappiamo che aprono le porte a questioni di natura legale non sempre di facile risoluzione; gli avatar “autonomi” con le fattezze di persone realmente esistenti potrebbero creare problemi di interazione sociale oggi difficilmente immaginabili.

Sono partner e fondatore di SNGLR Holding AG, un gruppo svizzero specializzato in tecnologie esponenziali con sedi in Europa, USA e UAE, dove curo i programmi inerenti l'intelligenza artificiale. Dopo la laurea in Management ho conseguito una specializzazione in Business Analytics a Wharton, una certificazione Artificial Intelligence Professional da IBM e una sul machine learning da Google Cloud. Sono socio fondatore del chapter italiano di Internet Society, membro dell’Associazione Italiana esperti in Infrastrutture Critiche (AIIC), della Association for the Advancement of Artificial Intelligence (AAAI), della Association for Computing Machinery (ACM) e dell’Associazione Italiana per l’Intelligenza Artificiale (AIxIA). Dal 2002 al 2005 ho servito il Governo Italiano come advisor del Ministro delle Comunicazioni sui temi di cyber security. Oggi partecipo ai lavori della European AI Alliance della Commissione Europea e a workshop tematici della European Defence Agency e del Joint Research Centre. Questo blog è personale.