ChatMinerva, l’AI italiana della Sapienza

Giulia Conti

Un modello pubblico in italiano

Quasi tutta l’intelligenza artificiale oggi utilizzata su larga scala nasce da un numero ristretto di aziende private, soprattutto americane e cinesi.

Queste società raramente rendono pubblici i dati usati per addestrare i loro modelli o i dettagli tecnici con cui vengono costruiti. In questo scenario, l’Europa resta ancora indietro, ma dall’Italia arriva un segnale significativo.

La Sapienza presenta ChatMinerva

Il gruppo di ricerca Sapienza NLP dell’Università La Sapienza di Roma ha presentato ChatMinerva, un assistente AI multimodale addestrato da zero in italiano.

Si tratta dell’unico sistema di questo tipo sviluppato da un ateneo pubblico italiano con pieno controllo sull’intero processo, dall’addestramento iniziale alla moderazione dei contenuti.

Dalle prime versioni al nuovo assistente

Il progetto è iniziato nell’aprile 2024 con Minerva 3B, un primo modello linguistico da 3 miliardi di parametri.

A novembre dello stesso anno è arrivata Minerva 7B, addestrata su 1,5 trilioni di parole grazie al supercomputer Leonardo del CINECA di Bologna, nell’ambito del progetto FAIR, Future Artificial Intelligence Research.

Otto mesi di sviluppo aggiuntivo

ChatMinerva è il risultato di altri otto mesi di lavoro.

Il progetto è stato sviluppato in collaborazione con Babelscape, lo spin-off della Sapienza che quest’anno compie dieci anni e che lavora nel campo dell’elaborazione del linguaggio naturale.

Testo, immagini, documenti e voce

Rispetto alle versioni precedenti, ChatMinerva non si limita più alla comprensione del testo.

Il nuovo assistente è in grado di interpretare immagini e documenti, effettuare il riconoscimento ottico dei caratteri su pagine scannerizzate e conversare anche in forma vocale.

Risposte aggiornate dal web

Una delle novità più rilevanti è il collegamento in tempo reale con DuckDuckGo.

Grazie a questa integrazione, ChatMinerva può recuperare informazioni aggiornate dal web e utilizzarle per formulare risposte più attuali rispetto a quelle basate solo sui dati di addestramento.

Contesto più ampio per documenti lunghi

La finestra contestuale è stata estesa fino a 32.000 token.

Questo consente al modello di lavorare su documenti più lunghi, mantenendo coerenza e continuità nell’analisi senza perdere il filo del contenuto.

Attenzione alla sicurezza

La sicurezza è stata integrata fin dalle fasi precedenti del progetto.

Già Minerva 7B era stato addestrato su oltre 20.000 istruzioni dedicate alla gestione di contenuti sensibili, tra cui discriminazione, armi, autolesionismo e contenuti sessuali.

Il commento della rettrice

La rettrice della Sapienza, Antonella Polimeni, ha definito il lancio di ChatMinerva una nuova tappa nel percorso di innovazione dell’ateneo nel campo dell’intelligenza artificiale.

Secondo Polimeni, l’evoluzione del progetto Minerva verso assistenti AI multimodali e interattivi dimostra la capacità della Sapienza di trasformare la ricerca di frontiera in innovazione concreta al servizio della conoscenza e della società.

Ricerca, infrastrutture e territorio

La rettrice ha sottolineato che il risultato nasce dall’integrazione tra competenze scientifiche, infrastrutture avanzate e collaborazione con realtà innovative del territorio.

Per la Sapienza, ChatMinerva rafforza il ruolo dell’università come motore strategico della ricerca e dell’innovazione tecnologica in Italia.

Un modello cresciuto con gli utenti

ChatMinerva è migliorato anche grazie alle conversazioni raccolte durante il periodo di test delle versioni precedenti.

Roberto Navigli, docente della Sapienza e responsabile del progetto, ha spiegato che Minerva è cresciuta insieme ai suoi utenti, grazie a prompt, interazioni e feedback che hanno contribuito a renderla più utile e robusta.

Un’alternativa europea e indipendente

Navigli riconosce che, per ora, non ha senso fingere una parità di mezzi con i grandi modelli americani e cinesi.

Tuttavia, sostiene che ChatMinerva dimostri la possibilità di costruire anche in Europa e in Italia tecnologie AI avanzate, con un approccio aperto, scientificamente rigoroso e indipendente.

Più passione che budget

Il progetto è stato realizzato con risorse limitate rispetto ai colossi internazionali.

Navigli ha evidenziato che ChatMinerva è stata costruita con molta più passione che budget, grazie al lavoro continuo di ricercatori, dottorandi, studenti e collaboratori.

Verso un’AI più autonoma

Gli sviluppatori stanno già lavorando a una versione agentica di ChatMinerva.

Questa futura evoluzione dovrebbe permettere all’assistente di utilizzare strumenti in autonomia, ampliando le sue capacità operative e rendendolo più vicino agli agenti AI di nuova generazione.

In arrivo un modello da 20 miliardi di parametri

Il percorso di sviluppo non si ferma qui.

Un modello più grande, da 20 miliardi di parametri, è già in fase di addestramento presso l’infrastruttura HPC del CINECA, dove sta prendendo forma una delle prime AI Factory finanziate dall’Europa.

Un passo verso l’AI italiana

ChatMinerva rappresenta un primo passo concreto verso un’intelligenza artificiale sviluppata in Italia, controllata da istituzioni pubbliche e costruita con maggiore trasparenza.

In un settore dominato da pochi giganti privati, il progetto della Sapienza mostra che anche la ricerca pubblica europea può contribuire alla costruzione di modelli avanzati, indipendenti e pensati per le esigenze linguistiche, culturali e scientifiche del Paese.