Come funzionano le reti neurali profonde?

20

Studio teorico coordinato dall’Università di Parma indaga i fondamenti dell’intelligenza artificiale. La Fisica statistica di Parma incontra il deep learning in un lavoro pubblicato su “Nature Machine Intelligence”

PARMA – Dagli assistenti vocali agli smartphone, dai chatbot di ultima generazione (come ChatGPT) fino agli elettrodomestici, l’intelligenza artificiale ormai pervade la quotidianità.

Come spesso è accaduto nella storia recente, lo sviluppo di molte di queste tecnologie, tra cui quelle basate sulle reti neurali profonde, non è ancora fondato su solide basi teoriche. La comprensione del funzionamento di questi modelli di apprendimento automatico è ancora lontana, nonostante lo sforzo collettivo della comunità scientifica.

Facendo leva sulla grande tradizione italiana di Fisica statistica, un team di giovani ricercatori coordinati da Pietro Rotondo del Dipartimento di Scienze Matematiche, Fisiche e Informatiche dell’Università di Parma ha proposto una innovativa teoria effettiva in grado di predire con grande accuratezza le performance raggiunte da una classe di reti neurali profonde (“fully-connected”). Lo studio è stato pubblicato su “Nature Machine Intelligence” (link: https://www.nature.com/articles/s42256-023-00767-6).

In particolare, la teoria proposta è in grado di determinare la capacità di astrazione della rete partendo soltanto dai parametri fondamentali che descrivono la rete stessa (ad esempio, larghezza dei “layer nascosti” e funzione di attivazione) e dai dati usati per allenarla.

Questa scoperta contribuisce a colmare il gap tra teoria e applicazioni pratiche dell’intelligenza artificiale, aprendo la strada all’esplorazione di sistemi sempre più complessi e sempre più vicini a quelli che utilizziamo ogni giorno.

Il lavoro si inserisce nell’ambito del progetto PNRR MNESYS, cui partecipa il gruppo di Fisica statistica e dei sistemi complessi guidato dalla docente dell’Università di Parma Raffaella Burioni. La collaborazione ha coinvolto ricercatrici e ricercatori di diverse istituzioni italiane ed estere, e include il contributo fondamentale di Rosalba Pacelli (Politecnico di Torino e Università Bocconi) e Sebastiano Ariosto (Università dell’Insubria).