Risultati della ricerca per: "deep learning" Pagina 1 di 9

Libri indispensabili per comprendere davvero l’intelligenza artificiale e il deep learning

Se credi che l’AI sia solo prompt da digitare e output da copiare, stai per fare un errore strategico. Prima di costruire modelli, costruisci comprensione. Il rischio maggiore non è fallire con un progetto di machine learning, ma partire senza capire i meccanismi che lo governano. Questa raccolta di libri selezionati a mano ti costringe […]

Le reti di Hopfield e l’origine del deep learning: memoria associativa e ottimizzazione energetica

Se si vuole comprendere la genesi del Deep Learning moderno, ignorare le Reti di Hopfield sarebbe un errore concettuale gravissimo. Introdotte da John J. Hopfield nel 1982, queste reti neurali ricorrenti non rappresentano soltanto un modello storico: sono il primo laboratorio teorico in cui fisica statistica, matematica e informatica si incontrano per dare forma a […]

The Little Book of Deep Learning François Fleuret

Rivista.AI Academy Deep Learning: come abbiamo insegnato alle macchine a riscrivere il mondo In principio c’era la statistica. Poi è arrivato il deep learning, e la festa è finita. Quella che era una nicchia accademica fatta di regressioni lineari, kernel gaussiani e loss quadratiche è stata travolta da un’onda lunga di matrici, GPU roventi e […]

Huawei sfida Nvidia: la nuova architettura AI che potrebbe riscrivere le regole del deep learning

Ogni epoca ha il suo Golia, e ogni Golia ha bisogno di un Davide con una fionda ben calibrata. Oggi il Golia si chiama Nvidia, l’onnipotente fornitore di GPU che domina l’intelligenza artificiale globale come un monarca assoluto. E il Davide? Beh, si chiama Huawei, che con una fionda chiamata Supernode 384 mira dritto alla […]

La Silicon War delle menti artificiali: la Cina senza GPU e il sogno spezzato del deep learning a stelle rosse

Il cuore dell’intelligenza artificiale batte in silicio. Non a Pechino, non a San Francisco, ma nei wafer da 7 nanometri che si agitano nei datacenter. E proprio lì, nei templi della computazione moderna, la Cina si ritrova ad arrancare. Non per mancanza di cervelli o ambizioni quelle abbondano ma per una cronica e crescente carenza […]

Yann LeCun presenta Dynamic Tanh (DyT), l’alternativa che rivoluziona l’efficienza nei modelli di deep learning

Yann LeCun, una delle figure di spicco nel campo dell’intelligenza artificiale, ha recentemente introdotto una proposta che potrebbe segnare una svolta nell’efficienza computazionale dei modelli di deep learning. La sua creazione, chiamata Dynamic Tanh (DyT), si presenta come una risposta alle inefficienze dei tradizionali strati di normalizzazione, ampiamente utilizzati nei modelli di reti neurali per […]

Corso: 𝗠𝗮𝘀𝘁𝗲𝗿𝗶𝗻𝗴 𝗔𝗜 𝗮𝗻𝗱 𝗗𝗲𝗲𝗽 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗔𝗡𝗗𝗥𝗘𝗪 𝗡G

Di seguito trovi la guida definitiva per il leggendario corso di Deep Learning di Andrew Ng su Coursera. Se sei seriamente intenzionato a entrare nel mondo dell’”AI all’avanguardia”, questa è una fonte di informazioni straordinaria.𝗖𝗼𝘀𝗮 𝗰𝗼𝗻𝘁𝗶𝗲𝗻𝗲?✅ Reti Neurali & Deep Learning✅ Ottimizzazione dei Parametri, Regolarizzazione & Ottimizzazione✅ Strutturare Progetti di Machine Learning✅ Reti Neurali Convoluzionali […]

VirtuDockDL: Una Rivoluzione nello Screening Virtuale con Deep Learning per la Scoperta di Farmaci

Un gruppo di ricercatori provenienti da varie istituzioni, tra cui l’Università di Lahore e l’Università di Shenzhen, ha creato VirtuDockDL, una piattaforma basata su Python che sta mostrando risultati promettenti nel prevedere quali composti potrebbero diventare farmaci efficaci. La pipeline VirtuDockDL (github) si presenta come un’innovativa piattaforma progettata per rivoluzionare il processo di screening virtuale […]

Podcast: Baidu Potenzia la Rivalità Globale con Innovazioni AI: ERNIE Bot, Xinghe Community e Avanzamenti nel Deep Learning

Benvenuti a questo episodio del nostro podcast dedicato alla tecnologia e all’innovazione. Oggi esploreremo come Baidu sta ridefinendo il panorama dell’intelligenza artificiale. Con un focus sui modelli linguistici e le applicazioni AI, Baidu sta facendo passi da gigante con strumenti come l’ERNIE Bot e la piattaforma di deep learning PaddlePaddle. Scopriremo anche l’importanza della Xinghe […]

Machine Learning e Deep Learning: un viaggio nel mondo dell’Intelligenza Artificiale

L’Intelligenza Artificiale (IA) è un mondo molto vasto e abbraccia vari campi dell’innovazione. Due dei suoi pilastri principali sono il Machine Learning (ML) e il Deep Learning (DL), concetti che sono spesso usati in modo intercambiabile, anche se si tratta di due approcci che differiscono nei metodi, scopi e applicazioni. In questo articolo, esploreremo le […]

Deep Learning: un viaggio nell’ingegneria dei sistemi di Intelligenza Artificiale

Il Deep Learning, una branca dell’Intelligenza Artificiale (IA), sta rivoluzionando il modo in cui le macchine apprendono e risolvono compiti complessi. In questo articolo, esploreremo in profondità il concetto di Deep Learning, spiegando cos’è, come funziona e le sue applicazioni trasformative. Cos’è il Deep Learning? Il Deep Learning è un approccio all’apprendimento automatico che utilizza […]

Deep-learning per biopsie istologiche prende il posto del bisturi mentale

La rivoluzione non suonerà domani: già oggi la patologia digitale è piena di tentativi a volte brillanti di trasformare il lento, preciso e umanissimo atto di diagnosticare un campione tissutale in un balletto algoritmico. Deep-learning per biopsie istologiche non è più fantascienza. Sta diventando realtà grazie a innovazioni come l’annotazione pixel-Wise e gli assistenti digitali […]

Bytedance sfida DeepMind e Alibaba: la nuova AI DAPO riscrive le regole del machine learning

ByteDance, il colosso dietro TikTok, sta alzando l’asticella nell’intelligenza artificiale con una nuova tecnologia che promette di superare DeepSeek e ridefinire l’addestramento dei modelli di ragionamento AI. Il sistema, battezzato DAPO (Decoupled Clip and Dynamic Sampling Policy Optimisation), è un algoritmo di reinforcement learning scalabile che punta a migliorare le capacità di ragionamento complesso dei […]

Stanford pubblica le cheatsheet ufficiali di intelligenza artificiale e machine learning

Stanford University ha appena reso pubbliche le sue cheatsheet ufficiali dei corsi di intelligenza artificiale e machine learning, un gesto che ha il sapore di una rivoluzione silenziosa nel mondo dell’educazione tecnologica. Anni di lezioni condensate in visualizzazioni sintetiche, chiare e brutalmente efficaci. È il genere di contenuto che trasforma chi “usa l’AI” in qualcuno […]

I pilastri del machine learning: la cassetta degli attrezzi dello scienziato dei dati

Il machine learning non è più il giocattolo per nerd delle università americane. È diventato il motore silenzioso che alimenta previsioni finanziarie, diagnosi mediche, strategie di marketing e persino le tue playlist su Spotify. Eppure, pochi ne comprendono davvero l’ossatura. Parlano di intelligenza artificiale come se fosse magia, dimenticando che dietro ogni modello predittivo c’è […]

Come l’intelligenza artificiale di Deepmind sta riscrivendo le leggi della fusione nucleare

on è più fantascienza, ma neppure ancora realtà. L’energia da fusione, quella promessa quasi mitologica di generare elettricità infinita e pulita a partire dall’acqua, sta uscendo dal laboratorio e cominciando a parlare il linguaggio dell’intelligenza artificiale. O, più precisamente, il linguaggio di DeepMind, la divisione di Google che negli ultimi anni sembra avere come hobby […]

Google Deepmind lancia Dreamer 4: l’agente che sogna estrarre diamanti con 100× meno dati

L’annuncio di Dreamer 4 da parte di Google DeepMind è la miccia che potrebbe accendere una nuova era per l’intelligenza artificiale agente. Un agente che non “impara giocando”, ma impara immaginando dentro il proprio modello del mondo senza mai interagire col mondo reale durante l’apprendimento e che ha già ottenuto il risultato simbolico di estrarre […]

Running deep research AI agents su Amazon Bedrock AgentCore

Amazon ha appena lanciato una guida completa per distribuire Deep Agent su Amazon Bedrock AgentCore Runtime, trasformando un prototipo locale in un agente di intelligenza artificiale multi-agente pronto per la produzione in meno di cinque minuti. Questo approccio consente di costruire flussi di lavoro complessi in modo semplice e scalabile, senza la necessità di gestire […]

Addio FP32: come DeepSeek AI risparmia il 90% di energia usando solo logaritmi

La notizia che DeepSeek AI v3.1 utilizzi il formato dati UE8M0 FP8, basato sul sistema numerico logaritmico (LNS), apre uno scenario affascinante e quasi provocatorio nel campo del deep learning. Tradizionalmente, il mondo dell’intelligenza artificiale si è affidato ai formati floating point convenzionali come FP32 o FP16, dove ogni numero ha una mantissa e un […]

Alibaba, Deepseek e la guerra dei Deep Research Agent: il nuovo terreno di scontro tra USA e CINA nell’intelligenza artificiale

Quando Alibaba annuncia un “leading open-source deep research agent” e lo mette in produzione dentro Amap e Tongyi FaRui, non sta semplicemente rilasciando un’altra feature carina. Sta gridando al mondo: possiamo fare quello che fa OpenAI, ma con meno parametri, meno costi e più efficienza. È la solita partita del soft power digitale, solo che […]

Learning Facts at Scale with Active Reading

META rivoluziona l’addestramento degli LLM con il metodo active reading Meta ha appena svelato un approccio rivoluzionario per addestrare i modelli di linguaggio di grandi dimensioni (LLM), noto come Active Reading. Invece di ingozzare i modelli con documenti passivamente, li spinge a studiare come farebbe un essere umano, con risultati stupefacenti sulla memorizzazione dei fatti […]

Learning Facts at Scale with Active Reading

Meta sta proponendo un cambio di paradigma nella formazione dei modelli linguistici. Tradizionalmente, i modelli LLM vengono addestrati con grandi quantità di dati in modo passivo: si ingeriscono documenti, articoli, libri, senza che il modello sviluppi strategie proprie di apprendimento. Il problema di fondo è che i modelli tendono a dimenticare informazioni di nicchia, generano […]

Deepseek e il formato UE8MO FP8: la mossa che può ribaltare il dominio di Nvidia

La notizia è arrivata in sordina, con una frase criptica su WeChat. DeepSeek, la start-up di intelligenza artificiale con base a Hangzhou, ha annunciato che il suo nuovo modello V3.1 è stato addestrato usando il formato dati UE8M0 FP8, “pensato per i chip domestici di prossima uscita”. Bastano nove parole a scatenare la speculazione di […]

Quantum machine learning e gaussian processes: la lezione di Los Alamos sulle reti neurali quantistiche

Quantum computing è come un ospite non invitato che arriva a una festa di intelligenza artificiale vestito in modo totalmente diverso, e a un certo punto tutti si rendono conto che ha capito meglio il tema della serata. Per anni gli scienziati hanno cercato di travestirlo con i vecchi abiti della machine learning classica, forzando […]

Google Deepmind rilascia Perch 2.0: l’intelligenza artificiale che non dorme mentre ascolta la vita

Google DeepMind ha liberato nell’open source un update potentissimo: Perch 2.0, la versione dell’intelligenza artificiale specializzata nella bioacustica, addestrata su un dataset multi-tassonomico che va ben oltre i soli uccelli. Il modello è ora in grado di estrarre embedding di qualità superiore, offrire classificazioni “off-the-shelf” per migliaia di specie vocali e stupire con risultati che […]

Deep Think in Gemini app

Google Deepmind e l’illusione della ragione artificiale: il caso Gemini 2.5 Deep Think Il nome è già un programma di marketing. “Gemini 2.5 Deep Think”. È difficile non percepire in quell’accoppiata un’eco vagamente orwelliana, come se pensare profondamente fosse ormai un brand, un pacchetto da 250 dollari al mese, disponibile solo per chi può permettersi […]

La Cina ruggisce a codice aperto: Kimi K2 è il nuovo predatore del machine learning globale

Non fatevi ingannare dal nome dolciastro. Kimi K2 non è un simpatico cartone animato giapponese né una mascotte da caricare su TikTok. È un colosso di 1 trilione di parametri che cammina silenziosamente tra le linee di codice, pronto a stravolgere le gerarchie globali dell’intelligenza artificiale con un approccio che, fino a ieri, sembrava il […]

Alibaba si prende tutto: DeepSWE e l’egemonia gentile del codice open-source

Le intelligenze artificiali non stanno solo imparando a scrivere codice: lo stanno riscrivendo. E tra le macerie dei modelli proprietari e delle API chiuse a pagamento, spunta una nuova aristocrazia algoritmica, fondata non su brevetti ma su repository GitHub. Il nuovo padrone del gioco si chiama Alibaba, e ha un nome tanto tenero quanto micidiale: […]

L’algoritmo di Deepseek comanda: la guerra intelligente ha già superato i generali

Quando un modello linguistico genera in 48 secondi ciò che un comandante impiega 48 ore a pianificare, non si parla più di innovazione. Si parla di mutazione genetica della guerra. Non è uno scenario futuristico né una trovata pubblicitaria da film di Hollywood. È quello che sta succedendo a Xian, nella provincia nord-occidentale della Cina, […]

Federated reinforcement learning, ovvero come far collaborare agenti paranoici senza farli parlare davvero

Benvenuti nell’era in cui anche gli algoritmi si parano le spalle. O, per dirla meglio: benvenuti nel regno del Federated Reinforcement Learning (FRL), quella zona grigia tra il controllo distribuito, l’apprendimento autonomo e la sacrosanta tutela della privacy. Sembra una di quelle buzzword uscite da una conferenza AI sponsorizzata da una banca cinese e una […]

Tradurre l’intelligenza: DeepSeek-R1 sfida GPT-4o sulle GPU MI300X di Seeweb

Siamo ormai nel pieno del barocco dell’intelligenza artificiale. Gli LLM (Large Language Models) sono diventati le nuove cattedrali digitali, costruite con miliardi di parametri e sorrette da GPU che sembrano più reattori nucleari che schede video. In questo panorama di potenze mostruose, dove i soliti noti (OpenAI, Google, Anthropic) dettano legge, si insinua un nome […]

Deepseek r2, l’ombra cinese che scuote le certezze della silicon valley

Quando una start-up cinese fa tremare i giganti della Silicon Valley non è mai un caso, è un segnale. DeepSeek, con la sua atmosfera da thriller tecnologico, sta scatenando una tempesta di speculazioni online, lasciando il mondo dell’AI con il fiato sospeso. In piena guerra tecnologica tra Stati Uniti e Cina, la loro prossima mossa, […]

Deepseek GRM e la via cinese all’intelligenza artificiale: meno hype, più silicio e autocritica algoritmica, Inference-Time Scaling for Generalist Reward Modeling

Nel teatro globale dell’intelligenza artificiale, dove l’Occidente gioca a fare il pavone tra press release e versioni beta a pagamento, la Cina si presenta in silenzio, con l’incedere glaciale di chi sa di avere tempo, denaro e uno Stato che tifa per te. DeepSeek, start-up fondata appena nel 2023 dal matematico-imprenditore Liang Wenfeng, è l’ultimo […]

L’ascesa di DeepSeek: una nuova frontiera nell’intelligenza artificiale cinese che sfida la supremazia americana

Se c’è una cosa che la geopolitica tecnologica ci ha insegnato negli ultimi anni, è che il futuro dell’intelligenza artificiale non si gioca solo nei laboratori della Silicon Valley. L’ingresso di DeepSeek, un’azienda cinese, con il suo modello R1, nel già affollato campo dei modelli di linguaggio di grandi dimensioni (LLM) ha messo in evidenza […]

i costi nascosti di DeepSeek

I costi nascosti di DeepSeek

DeepSeek ha affermato che il suo modello di intelligenza artificiale è stato sviluppato con soli 6 milioni di dollari. Ma è realmente così? Qual’è il vero costo umano di DeepSeek?

QWQ-32b: il nuovo paradigma del reinforcement learning nei modelli linguistici

L’evoluzione dell’intelligenza artificiale passa attraverso la capacità di potenziare il ragionamento dei modelli linguistici con tecniche sempre più avanzate. Il reinforcement learning (RL) sta emergendo come una delle soluzioni più promettenti, capace di superare i limiti del pretraining convenzionale e delle tecniche di fine-tuning. Il nuovo modello QwQ-32B dimostra il potenziale di questa metodologia, offrendo […]

DeepSeek e il Paradosso dell’Autofagia: Quando l’IA Mangia Sé Stessa

Benvenuti nell’era dell’IA che si allena su sé stessa, creando un paradosso degno di Escher: più si ripete, meno capisce. L’Università di Pisa assieme alla Scuola Siperiore di Pisa ISTI-CNR e Victoria University, Wellington, New Zealand, ha messo il dito nella piaga con uno studio (Characterizing Model Collapse in Large Language Models Using SemanticNetworks and […]

DeepSeek può mettere in crisi il modello di business di Scale AI?

Scale AI è un’azienda leader nella fornitura di dati annotati per l’addestramento di modelli di intelligenza artificiale. La sua piattaforma gestisce e automatizza il processo di etichettatura dei dati, combinando annotatori umani e modelli AI per garantire dataset di alta qualità. I suoi servizi sono utilizzati da aziende tecnologiche, istituzioni governative e startup che sviluppano […]

Microsoft ospita DeepSeek-R1 su Azure: test strategico o mossa legale contro OpenAI?

La presenza del modello DeepSeek-R1 all’interno di Microsoft Azure AI Foundry solleva diverse questioni strategiche e tecniche. Il modello, con i suoi 671 miliardi di parametri totali e 37 miliardi di parametri attivi, rappresenta un passo significativo nell’evoluzione delle AI focalizzate sul ragionamento, sfruttando sia il Chain-of-Thought (CoT) che il reinforcement learning (RL). Tuttavia, le […]

Huawei Ascend 910C: Il Gigante del Calcolo che Sfida i Limiti del Mercato e il Dominio dei Chip NVIDIA e aiuta Deepseek

La competizione nel mondo dell’intelligenza artificiale e delle soluzioni di calcolo avanzato è sempre più agguerrita, con aziende come NVIDIA che detengono una fetta importante del mercato grazie alle loro GPU e ai processori specializzati per il deep learning. Tuttavia, un attore emergente come Huawei, con la sua serie di chip Ascend, sta facendo rumore, […]

Pagina 1 di 9

CC BY-NC-SA 4.0 DEED | Disclaimer Contenuti | Informativa Privacy | Informativa sui Cookie