Tag: Francesco Tucci

Minerva-7b e il futuro degli LLM per l’italiano

Paper presentato a CLiCit2025

C’è un paradosso che domina il mondo dell’intelligenza artificiale: i grandi modelli linguistici, osannati come strumenti universali di conoscenza, parlano fluentemente inglese ma balbettano in molte altre lingue. È la dittatura silenziosa della lingua dominante che trasforma la promessa di equità linguistica in una realtà monolingue. A mettere ordine in questo caos ci ha pensato un gruppo di ricercatori italiani, il Sapienza NLP Group insieme a Babelscape, che con il modello Minerva-7B hanno portato sul tavolo della ricerca internazionale un’analisi chirurgica su come addestrare un LLM che non si limiti a imitare l’inglese, ma sappia realmente pensare in italiano. Lo studio, intitolato con una punta di autoironia accademica “What we Learned from Continually Training Minerva: a Case Study on Italian”, ha acceso un faro su due nodi centrali: la potenza dell’addestramento continuo e l’estensione della finestra di contesto.

Minerva contro i giganti. perché Roberto Navigli è l’orgoglio che l’Italia non può permettersi di ignorare

In un Paese che considera ancora l’intelligenza artificiale un tema da talk show, l’idea che un professore romano possa guidare la conferenza più importante al mondo sul Natural Language Processing sembra quasi un cortocircuito culturale. Roberto Navigli, docente alla Sapienza e “papà” del Large Language Model italiano Minerva, sarà il Chair di ACL 2025, il summit globale che detta le regole del futuro digitale. Chiunque abbia compreso il significato profondo di questa notizia sa che non si tratta solo di un onore accademico. È un momento di rottura per il nostro Sistema Paese, l’ennesima dimostrazione che, quando si osa e si investe in cervelli veri, anche l’Italia può sedersi al tavolo dei giganti.

Disambiguazione bias nella traduzione automatica come i modelli MT e LLM affrontano l’ambiguità lessicale

DIBIMT: A Gold Evaluation Benchmark for Studying Lexical Ambiguity in Machine Translation

Questo lavoro tocca un nodo cruciale e ancora sorprendentemente trascurato nel campo della traduzione automatica: l’ambiguità lessicale e il pregiudizio sistemico nella disambiguazione da parte di modelli MT e LLM. È una questione che, sotto l’apparente patina di “high BLEU performance”, nasconde un limite strutturale nei modelli encoder-decoder contemporanei, soprattutto in ambienti multilingue e con lessico polisemico.

Alcune riflessioni rapide sui punti sollevati:

Il fatto che l’encoder non riesca a distinguere efficacemente i sensi lessicali se il contesto non è esplicito, è un chiaro segno che stiamo sovrastimando la “comprensione” semantica nei transformer. Aumentare la capacità del modello non sempre migliora la rappresentazione dei significati, spesso amplifica solo la fiducia in scelte sbagliate.

CC BY-NC-SA 4.0 DEED | Disclaimer Contenuti | Informativa Privacy | Informativa sui Cookie