Matematica Archivi - Rivista AI

In un mondo dove l’intelligenza artificiale si vende come miracolo al grammo, il paper “Limitations of GPT-4 for formal mathematics” pubblicato da OpenAI e ambientato nei laboratori aridi della matematica formale, arriva come un’aspra doccia scozzese su chi crede che stiamo per sostituire i matematici con dei transformer addestrati a suon di GPU e caffeina. L’oggetto? L’analisi chirurgica delle performance di GPT-4 nel regno della matematica formale, usando Lean, il sistema di proof assistant sviluppato per togliere il sonno a filosofi e informatici da tastiera.

FrontierMath: Un Nuovo Benchmark per Mettere alla Prova l’Intelligenza Artificiale su Problemi Matematici di Livello Avanzato

Di Pietro Raimondi

il 10 Novembre 2024

in News

La valutazione delle capacità di ragionamento dell’intelligenza artificiale sta vivendo una svolta decisiva con l’introduzione di FrontierMath, un benchmark composto da centinaia di problemi matematici complessi e originali, ideato per mettere alla prova i sistemi di IA. Realizzato in collaborazione con oltre 60 esperti e matematici di fama mondiale, FrontierMath si presenta come un banco di prova ineguagliabile per testare le abilità logiche e matematiche avanzate degli algoritmi, affrontando campi come la teoria dei numeri, l’analisi reale, l’algebra astratta e la geometria algebrica.

Harmonic e il suo Modello AI progettato per garantire accuratezza ed evitare allucinazioni

Di Dina

il 13 Agosto 2024

in AI

Secondo alcune fonti, Sequoia Capital è in trattative per finanziare Harmonic, una startup cofondata dal CEO di Robinhood, Vlad Tenev, e dall’imprenditore Tudor Achim, noto per il suo lavoro nel settore dei veicoli a guida autonoma. Harmonic si propone di sviluppare un’intelligenza artificiale (AI) capace di ragionare attraverso problemi complessi, in particolare in ambito matematico.

Announcing the formation of Harmonic, a commercial AI research lab building Mathematical Superintelligence (MSI). 1/
— Vlad Tenev (@vladtenev) June 10, 2024

Introduzione a Qwen2-Math: la nuova frontiera nei Modelli di Linguaggio per la Matematica

Di Alessandra Innocenti

il 12 Agosto 2024

in AI

Negli ultimi anni, l’intelligenza artificiale ha fatto passi da gigante, specialmente nel campo dei modelli di linguaggio. Oggi, siamo entusiasti di presentare Qwen2-Math, una nuova serie di modelli linguistici specializzati nella risoluzione di problemi matematici complessi. Questi modelli si basano sulla robusta architettura di Qwen2 e sono progettati per superare le capacità matematiche di modelli precedenti, come GPT-4o.

Tag: Matematica

Quando il segnale è rumore: l’illusione del progresso nei Large Language Models

FrontierMath: Un Nuovo Benchmark per Mettere alla Prova l’Intelligenza Artificiale su Problemi Matematici di Livello Avanzato

Harmonic e il suo Modello AI progettato per garantire accuratezza ed evitare allucinazioni

Introduzione a Qwen2-Math: la nuova frontiera nei Modelli di Linguaggio per la Matematica