DIBIMT: A Gold Evaluation Benchmark for Studying Lexical Ambiguity in Machine Translation
Questo lavoro tocca un nodo cruciale e ancora sorprendentemente trascurato nel campo della traduzione automatica: l’ambiguità lessicale e il pregiudizio sistemico nella disambiguazione da parte di modelli MT e LLM. È una questione che, sotto l’apparente patina di “high BLEU performance”, nasconde un limite strutturale nei modelli encoder-decoder contemporanei, soprattutto in ambienti multilingue e con lessico polisemico.
Alcune riflessioni rapide sui punti sollevati:
Il fatto che l’encoder non riesca a distinguere efficacemente i sensi lessicali se il contesto non è esplicito, è un chiaro segno che stiamo sovrastimando la “comprensione” semantica nei transformer. Aumentare la capacità del modello non sempre migliora la rappresentazione dei significati, spesso amplifica solo la fiducia in scelte sbagliate.