Intelligenza Artificiale, Innovazione e Trasformazione Digitale

Tag: Matematica

Quando il segnale è rumore: l’illusione del progresso nei Large Language Models

In un mondo dove l’intelligenza artificiale si vende come miracolo al grammo, il paper “Limitations of GPT-4 for formal mathematics” pubblicato da OpenAI e ambientato nei laboratori aridi della matematica formale, arriva come un’aspra doccia scozzese su chi crede che stiamo per sostituire i matematici con dei transformer addestrati a suon di GPU e caffeina. L’oggetto? L’analisi chirurgica delle performance di GPT-4 nel regno della matematica formale, usando Lean, il sistema di proof assistant sviluppato per togliere il sonno a filosofi e informatici da tastiera.

FrontierMath: Un Nuovo Benchmark per Mettere alla Prova l’Intelligenza Artificiale su Problemi Matematici di Livello Avanzato

La valutazione delle capacità di ragionamento dell’intelligenza artificiale sta vivendo una svolta decisiva con l’introduzione di FrontierMath, un benchmark composto da centinaia di problemi matematici complessi e originali, ideato per mettere alla prova i sistemi di IA. Realizzato in collaborazione con oltre 60 esperti e matematici di fama mondiale, FrontierMath si presenta come un banco di prova ineguagliabile per testare le abilità logiche e matematiche avanzate degli algoritmi, affrontando campi come la teoria dei numeri, l’analisi reale, l’algebra astratta e la geometria algebrica.

Harmonic e il suo Modello AI progettato per garantire accuratezza ed evitare allucinazioni

Secondo alcune fonti, Sequoia Capital è in trattative per finanziare Harmonic, una startup cofondata dal CEO di Robinhood, Vlad Tenev, e dall’imprenditore Tudor Achim, noto per il suo lavoro nel settore dei veicoli a guida autonoma. Harmonic si propone di sviluppare un’intelligenza artificiale (AI) capace di ragionare attraverso problemi complessi, in particolare in ambito matematico.

Introduzione a Qwen2-Math: la nuova frontiera nei Modelli di Linguaggio per la Matematica

Negli ultimi anni, l’intelligenza artificiale ha fatto passi da gigante, specialmente nel campo dei modelli di linguaggio. Oggi, siamo entusiasti di presentare Qwen2-Math, una nuova serie di modelli linguistici specializzati nella risoluzione di problemi matematici complessi. Questi modelli si basano sulla robusta architettura di Qwen2 e sono progettati per superare le capacità matematiche di modelli precedenti, come GPT-4o.

CC BY-NC-SA 4.0 DEED | Disclaimer Contenuti | Informativa Privacy | Informativa sui Cookie