Immaginate un’intelligenza artificiale che non solo scrive codice, ma lo fa con la stessa dedizione di un autore che compone un romanzo epico. Questo è ciò che Anthropic ha realizzato con il suo ultimo modello, claude sonnet 4.5. In un test interno, claude ha scritto autonomamente 11.000 linee di codice per costruire un’app di chat simile a Slack o Teams, operando ininterrottamente per 30 ore. Un’impresa che, se paragonata al predecessore claude opus 4, che riusciva a lavorare autonomamente per sole 7 ore, rappresenta un salto quantico nelle capacità delle AI.

Ma non è solo la durata dell’attività a impressionare. claude sonnet 4.5 ha raggiunto un punteggio del 61,4% nel benchmark osworld, che misura l’abilità dell’IA nell’eseguire compiti reali su un sistema operativo, superando il 42,2% del modello precedente. Questo significa che l’AI non solo scrive codice, ma lo integra e lo esegue in ambienti reali con una competenza sorprendente. Annuncio Anthropic

La vera sfida, però, è la capacità di mantenere la coerenza e la qualità del codice su periodi prolungati. claude sonnet 4.5 ha dimostrato di poter gestire compiti complessi e di lunga durata, come la scrittura di codice per un’app di chat, senza perdere in qualità o precisione. Questo è un passo fondamentale verso l’automazione avanzata nello sviluppo software.

Il modello è stato progettato per essere altamente allineato, riducendo comportamenti indesiderati come la tendenza a generare contenuti fuorvianti o a seguire istruzioni dannose. Anthropic ha implementato misure di sicurezza avanzate, tra cui un sistema di classificazione che rileva potenziali rischi legati a contenuti pericolosi, garantendo un utilizzo più sicuro e affidabile dell’AI.

La versatilità di claude sonnet 4.5 si estende anche ad altri ambiti. aziende come canva hanno riportato miglioramenti significativi nella gestione di compiti complessi e di lunga durata, dalla progettazione alla ricerca, grazie all’uso di questo modello. Anthropic

Claude sonnet 4.5 non è solo un’evoluzione tecnologica, ma un cambiamento paradigmatico nel modo in cui concepiamo l’automazione e l’intelligenza artificiale applicata. Con la sua capacità di scrivere codice autonomamente per ore, integrarsi in ambienti reali e mantenere elevati standard di qualità e sicurezza, rappresenta una pietra miliare nello sviluppo delle AI moderne.