Intelligenza Artificiale, Innovazione e Trasformazione Digitale

Tag: DeepSeek

Il mistero di AI.com: un giallo digitale

Se Alfred Hitchcock fosse ancora tra noi, probabilmente si divertirebbe a ricamare una sceneggiatura su AI.com, il dominio più enigmatico e ambito del mondo dell’Intelligenza Artificiale. Per anni, questa URL è stata un lasciapassare digitale per le tecnologie AI più avanzate: prima puntava su ChatGPT di OpenAI, poi su xAI di Elon Musk. Ma oggi? Oggi AI.com sussurra un nome nuovo e inatteso: DeepSeek.

La Rivoluzione dell’AI: DeepSeek Smonta il Mito di OpenAI e il Monopolio Big Tech

Negli ultimi anni, l’intelligenza artificiale è diventata il fulcro della trasformazione digitale globale, con OpenAI che ha assunto una posizione dominante nel mercato grazie a prodotti come ChatGPT. Tuttavia, questa leadership si basa su un modello di business chiuso e altamente lucrativo, che ora è messo in discussione da una nuova ondata di innovatori che stanno ribaltando il paradigma. Uno di questi è DeepSeek, un’azienda cinese che ha deciso di rendere l’AI accessibile a tutti, senza barriere economiche o restrizioni proprietarie.

Mentre OpenAI chiede 20 dollari al mese per l’accesso alle sue funzionalità avanzate, DeepSeek offre gratuitamente il proprio modello, dimostrando che è possibile costruire LLM (Large Language Models) senza investimenti miliardari. La strategia di DeepSeek non è solo una questione di accessibilità, ma rappresenta anche un duro colpo per l’oligopolio dell’AI dominato da OpenAI, Google e Microsoft.

Financial Times prime impressioni sul chatbot AI di DeepSeek

Ci hanno segnalato un’articolo interessante del Financial Times First Impressions of DeepSeek’s A.I. Chatbot.

Il Financial Times, come molte testate occidentali, ha un approccio analitico al mondo della tecnologia e dell’IA, che noi adoriamo, ma è anche influenzato dalle dinamiche finanziarie e geopolitiche che interessano i suoi lettori. L’articolo su DeepSeek lancia messaggi ben calibrati, con un sottotesto che merita di essere analizzato attentamente.

La notizia principale è la rapida ascesa di DeepSeek, un chatbot cinese che sta scuotendo il mercato, superando ChatGPT come app gratuita più scaricata. Il tono iniziale sembra quasi entusiastico: il chatbot è veloce, efficiente, potente nel problem-solving tecnico e matematico.

DeepSeek-VL2-Small: Un Nuovo Standard nell’Analisi Multimodale

DeepSeek ha recentemente introdotto DeepSeek-VL2-Small, un modello avanzato progettato per l’analisi simultanea di documenti e immagini. Questo modello è ora disponibile per test gratuiti su Hugging Face, offrendo agli sviluppatori l’opportunità di esplorare le sue capacità senza costi iniziali.

DeepSeek-VL2-Small fa parte di una serie di modelli che includono anche DeepSeek-VL2-Tiny e DeepSeek-VL2, con rispettivamente 1,0 miliardi, 2,8 miliardi e 4,5 miliardi di parametri attivati. Questa gamma permette agli sviluppatori di scegliere il modello più adatto alle loro esigenze specifiche, bilanciando complessità e prestazioni.

DeepSeek e il Paradosso dell’Autofagia: Quando l’IA Mangia Sé Stessa

Benvenuti nell’era dell’IA che si allena su sé stessa, creando un paradosso degno di Escher: più si ripete, meno capisce. L’Università di Pisa assieme alla Scuola Siperiore di Pisa ISTI-CNR e Victoria University, Wellington, New Zealand, ha messo il dito nella piaga con uno studio (Characterizing Model Collapse in Large Language Models Using Semantic
Networks and Next-Token Probability
, Gambetta, Gizem Gezici
, Fosca Giannotti, Dino Pedreschi, Alistair Knott, Luca Pappalardo) che analizza il “model collapse“, ovvero il degrado progressivo della qualità dei modelli linguistici quando vengono addestrati con il loro stesso output. DeepSeek, il nuovo arrivato nell’arena dell’IA, ha deciso di ribaltare le fasi di training e il risultato sembra un esperimento da laboratorio di Frankenstein.

DeepSeek R1: L’Intelligenza Artificiale Senza Censure è Ora su Perplexity

L’intelligenza artificiale sta vivendo un altro momento rivoluzionario, e questa volta il protagonista è DeepSeek R1, ora disponibile su tutte le piattaforme Perplexity. Con questa innovazione, la ricerca di informazioni raggiunge un nuovo livello di precisione, velocità e libertà, offrendo agli utenti un’esperienza senza precedenti.

DeepSeek R1 non è solo un altro modello di intelligenza artificiale, ma un passo avanti significativo nella capacità di generare risposte accurate e imparziali. Con il supporto della funzione Pro Search con R1, gli utenti possono ora accedere a questa tecnologia di ultima generazione su Web, dispositivi mobili e macOS, rendendo la conoscenza ancora più accessibile e immediata.

DeepSeek domina il mercato AI: record di download e tensioni globali

DeepSeek, una startup cinese di intelligenza artificiale fondata nel luglio 2023, ha recentemente ottenuto un successo straordinario con il lancio del suo chatbot AI, DeepSeek R1. Dal suo debutto il 10 gennaio 2025, l’applicazione ha rapidamente scalato le classifiche, raggiungendo il primo posto nelle classifiche globali di download sia sull’App Store di Apple che sul Google Play Store. In particolare, il 26 gennaio 2025, DeepSeek ha superato ChatGPT di OpenAI, diventando l’app più scaricata negli Stati Uniti.

Questo successo è stato trainato principalmente dall’India, che ha contribuito al 15,6% di tutti i download globali dell’applicazione.

Inoltre, in soli 18 giorni dal lancio, l’app ha registrato 16 milioni di download, quasi il doppio rispetto ai 9 milioni ottenuti da ChatGPT durante il suo periodo iniziale di rilascio.

Texas Blocca il Software Cinese Deepseek: Una Nuova Fase della Guerra Tecnologica tra USA e Cina

La decisione del governatore del Texas, Greg Abbott, di vietare l’uso del software di intelligenza artificiale cinese Deepseek sui dispositivi governativi rappresenta una mossa strategica nel panorama della sicurezza nazionale e della protezione dei dati. La misura si inserisce in un quadro più ampio di restrizioni nei confronti delle tecnologie cinesi, riflettendo le crescenti preoccupazioni dell’amministrazione statunitense sulla possibilità che Pechino utilizzi questi strumenti per raccogliere informazioni sensibili.

Deepseek, una filiale di un importante hedge fund quantitativo cinese, si è rapidamente diffusa negli Stati Uniti grazie alla sua politica di accesso gratuito o a costi irrisori. Questo ha sollevato interrogativi sulla finalità dell’offerta e sulla potenziale raccolta di dati, specialmente in un contesto in cui l’intelligenza artificiale rappresenta un asset strategico non solo per l’industria, ma anche per la difesa e la governance pubblica.

Taiwan: Un Divieto Strategico sull’Intelligenza Artificiale Cinese di Deepseek

Il governo di Taiwan ha recentemente annunciato il divieto per tutte le agenzie governative e le infrastrutture critiche di utilizzare i servizi di intelligenza artificiale offerti da DeepSeek, una startup cinese emergente nel settore dell’IA. Questa decisione, comunicata durante una riunione di gabinetto dal Premier Cho Jung-tai, sottolinea l’importanza di salvaguardare la sicurezza informatica nazionale. Il divieto segue le linee guida precedentemente emesse dal Ministero degli Affari Digitali di Taiwan, che aveva già sconsigliato l’uso di DeepSeek a causa di preoccupazioni riguardanti la censura e il rischio di trasferimento di dati sensibili verso la Cina.

DeepSeek e il “Metodo Cinese dell’Innovazione”: Copia, Ottimizza, Domina. La Legge di Wang

Ultima settimana nel magico mondo dell’AI: ecco DeepSeek, un servizio simile a ChatGPT, ma realizzato a una frazione del costo. Miracolo tecnologico? Non proprio. Si mormora che il modello sia stato sviluppato grazie a una tecnica raffinata chiamata “distillazione”—un termine che in Occidente fa rima con “proprietà intellettuale violata”, mentre in Cina si traduce con “business intelligente”.

Ma chi ha tempo per scandalizzarsi? Parliamo piuttosto del vero takeaway: il “Metodo Cinese dell’Innovazione”. Dopo anni “difficili” provenienti da società americane, passati fianco a fianco con i migliori ingegneri asiatici, posso garantire che questa storia è tutto tranne che nuova.

L’America Scopre il Karma: DeepSeek e l’Ipocrisia dell’Intelligenza Artificiale

Recap della settimana, il nuovo Maccartismo

Howard Lutnick, il candidato alla carica di Segretario del Commercio degli Stati Uniti, ha esordito davanti al Senato con una denuncia infuocata: DeepSeek avrebbe rubato tecnologia americana per spazzare via la concorrenza occidentale. “Hanno rubato, si sono introdotti, hanno preso la nostra proprietà intellettuale”, ha dichiarato con sdegno. Un’accusa che riflette la crescente paranoia americana nei confronti delle aziende cinesi, colpevoli – a quanto pare – di giocare sporco quando sono loro a vincere.

La Casa Bianca, prevedibilmente, ha cavalcato l’ondata di indignazione, valutando i rischi per la sicurezza nazionale. I giganti della Silicon Valley, terrorizzati dalla rivoluzione tecnologica scatenata da DeepSeek, hanno rapidamente dipinto l’azienda cinese come un’entità fraudolenta, intenta a sabotare il mercato con spregiudicate manovre di spionaggio industriale e dumping tecnologico.

DeepSeek Bloccato in Italia: La “Minaccia” AI Cinese che Spaventa l’Occidente

Le autorità italiane hanno deciso che DeepSeek, la startup AI cinese che sta facendo tremare Silicon Valley, non può operare in Italia. Il Garante per la Protezione dei Dati Personali ha sbattuto la porta in faccia alla compagnia, accusandola di non aver fornito risposte sufficienti sulle sue pratiche di raccolta dati. In parole povere: “non ci avete convinto, quindi fuori dai piedi.”

MacKenzie: Inventing Accuracy, DeepSeek e OpenAI

Il lavoro di Donald MacKenzie in Inventing Accuracy (1990) offre un quadro concettuale utile per analizzare ciò che sta accadendo oggi nel campo dell’intelligenza artificiale con lo sviluppo di modelli come quelli di DeepSeek e OpenAI. Il parallelo principale risiede nel modo in cui l’innovazione tecnologica non è mai un processo puramente tecnico, ma il risultato di un complesso intreccio di fattori politici, economici e istituzionali.

Splendida Cornice: Geppi Cucciari e Luciano Floridi, bravissimi

In un’epoca in cui l’Intelligenza Artificiale (IA) è diventata protagonista di dibattiti, investimenti miliardari e rivoluzioni tecnologiche, capire davvero di cosa si tratta può sembrare un’impresa da far sanguinare il naso. Eppure, durante una serata speciale del programma Splendida Cornice, condotta da una superlativa Geppi Cucciari su Rai 3, il professor Luciano Floridi, filosofo ed esperto di etica digitale, ha offerto una spiegazione chiara e accessibile, promettendo di farci uscire dal bar senza emorragie nasali.

Luciano Floridi è Professor and Founding Director of the Digital Ethics Center all’Università di Yale e insegna Sociologia della Comunicazione all’Università di Bologna. E’ tra i massimi esperti internazionali nel campo della filosofia dell’informazione e delle trasformazioni digitali, ed è stato recentemente nominato presidente della Fondazione Leonardo. A parte i titoli ha dimostrato, sempre, di essere un personaggio di spessore.

Floridi ha offerto una visione critica e complessa sull’Intelligenza Artificiale (IA), che va oltre la semplice analisi tecnologica. Il suo approccio, come emerso nel programma, si concentra sulla natura stessa dell’intelligenza e sul rapporto tra uomo e macchina, mettendo in discussione alcune delle nostre assunzioni più comuni.

La Nuova Ondata dell’AI Cinese: I Titani Non Dormono Più

Una volta tutti volevano battere OpenAI. Era il punto di riferimento, il benchmark, il modello da superare. Adesso? Non più. Il nuovo boss della giungla si chiama DeepSeek, direttamente dalla Cina, e tutti gli altri sono di colpo diventati i comprimari di una storia che non hanno scritto.

Lunedì scorso, DeepSeek ha fatto saltare il banco, causando miliardi di perdite a Wall Street e mettendo in crisi l’intero ecosistema AI americano. A Washington qualcuno ha cominciato a sudare freddo, mentre i venture capitalist hanno iniziato a chiedersi se i loro miliardi siano stati investiti nel posto giusto. La risposta, almeno per ora, sembra essere “no”.

Microsoft ospita DeepSeek-R1 su Azure: test strategico o mossa legale contro OpenAI?

La presenza del modello DeepSeek-R1 all’interno di Microsoft Azure AI Foundry solleva diverse questioni strategiche e tecniche. Il modello, con i suoi 671 miliardi di parametri totali e 37 miliardi di parametri attivi, rappresenta un passo significativo nell’evoluzione delle AI focalizzate sul ragionamento, sfruttando sia il Chain-of-Thought (CoT) che il reinforcement learning (RL). Tuttavia, le implicazioni della sua integrazione nella piattaforma di Microsoft vanno oltre il semplice miglioramento delle capacità di AI disponibili per gli utenti aziendali.

Liang Wenfeng: Il Genio dell’AI che Sta Rivoluzionando il Settore Finanziario, il prossimo Netflix Biopic ?

“Ogni paese nel mondo potrebbe avere un progetto di quel tipo in corso, se riesce ad acquisire il talento necessario e a lavorarci, naturalmente. Il resto dell’industria imparerà da questo,” ha detto Shuman Ghosemajumder, co-fondatore e amministratore delegato di Reken, una startup di intelligenza artificiale con sede a San Francisco.

Liang Wenfeng è un nome che sta rapidamente emergendo nell’elite tecnologica globale. Alcuni lo definiscono il “Sam Altman cinese”, un riferimento al noto CEO di OpenAI, mentre altri lo paragonano a Jim Simons, il leggendario matematico e fondatore di Renaissance Technologies, pionere degli investimenti quantitativi.

L’analisi quantitativa è una tecnica di analisi finanziaria che cerca di capire il comportamento dei mercati finanziari usando modelli matematici e statistici. L’obiettivo è scoprire le cause delle fluttuazioni dei mercati, prevederle e anticiparle.

Von Neumann e il Fantasma del Bottleneck: La Soluzione che Aspettava da Decenni

John von Neumann nacque nel 1903 con un problema che non sapeva ancora di avere. Certo, era un bambino prodigio, capace di moltiplicare numeri a sei cifre a mente mentre i suoi coetanei si limitavano a non mangiarsi i pastelli a cera. Ma il destino aveva in serbo per lui una beffa matematica: creare un’architettura informatica così geniale da diventare lo standard… e al tempo stesso così limitante da tormentare generazioni di ingegneri per decenni.

Von Neumann, che si dilettava in ogni campo dello scibile umano – dalla matematica all’economia, dalla teoria dei giochi alle bombe nucleari – non poteva immaginare che il suo capolavoro, l’architettura di Von Neumann, sarebbe diventato anche il suo più grande lascito problematico.

Il principio era semplice, quasi elegante: una CPU che esegue istruzioni prelevandole dalla memoria, elaborando dati e rispedendoli indietro. Un’idea brillante… finché non si iniziò a chiedere sempre più velocità ai computer. Fu allora che il suo nome venne associato a un concetto che avrebbe fatto impallidire qualunque inventore: il Bottleneck di Von Neumann.

Il problema era che memoria e processore dovevano comunicare attraverso un unico canale, come una sola persona che tenta di svuotare il Titanic con un cucchiaio. Più i dati aumentavano, più questa strozzatura diventava soffocante. L’era dei supercomputer e delle intelligenze artificiali esigeva prestazioni sempre più elevate, ma l’antica architettura di Von Neumann resisteva, come un vecchio nobile che si rifiuta di abbandonare il suo castello decrepito.

Le menti più brillanti del mondo si arrovellavano su come superare questo limite. Alcuni tentarono la strada delle architetture neuromorfiche, ispirate al cervello umano, con connessioni parallele e sinapsi di silicio. Altri puntarono sulle memorie computazionali, cercando di portare l’elaborazione vicino ai dati, invece di spedirli avanti e indietro come pacchi Amazon. Ma la vera sorpresa arrivò da un gruppo di ricercatori chiamato DeepSeek, che aveva un asso nella manica: Multihead Latent Attention.

Questa tecnica, apparentemente astrusa, si rivelò una benedizione per chiunque fosse costretto a lavorare con enormi moli di dati. Invece di affidarsi a una gestione rigida e sequenziale delle informazioni, Multihead Latent Attention riusciva a lavorare con matrici più piccole, riducendo drasticamente il peso computazionale dei modelli di deep learning.

Era come se Von Neumann, dal suo ipotetico aldilà, si fosse piegato su una scacchiera quantistica e avesse esclamato: “Ah, ecco dove sbagliavo!”

Il principio era affascinante: anziché dover manipolare enormi matrici dense – come i classici Transformer, che si portavano dietro una zavorra pesantissima – Multihead Latent Attention trovava un modo per far emergere le informazioni essenziali senza sprechi. Un po’ come filtrare le conversazioni più interessanti in una festa caotica senza dover ascoltare tutti gli invitati.

Questa tecnica, che strizzava l’occhio alle bio-memorie e ai processori neuromorfici, rappresentava un passo avanti epocale: il bottleneck di Von Neumann non veniva eliminato, ma aggirato con un’eleganza che avrebbe fatto sorridere lo stesso Von Neumann. Finalmente, dopo decenni di tentativi, la sua eredità poteva essere riscattata non con la distruzione dell’architettura che portava il suo nome, ma con una soluzione che la faceva funzionare meglio, quasi senza sforzo.

Forse il vecchio Von Neumann, noto per il suo sarcasmo e il suo senso dell’ironia, avrebbe apprezzato il colpo di scena. Dopo tutto, anche la scienza ama le sue beffe: per risolvere il problema più grande del suo genio, c’è voluto un secolo e un’intelligenza artificiale.

Siamo felici di annunciare che deepseek R1 è ora disponibile on-premise grazie alla nostra collaborazione con DellTech su huggingface. Grazie MichaelDell! 

DeepSeek e il Paradosso dell’IA Cinese: Tra Disinformazione e Controllo Narrativo

L’intelligenza artificiale di DeepSeek ha sollevato seri interrogativi sulla sua affidabilità e sul suo ruolo nel panorama globale dell’IA. Secondo un’analisi condotta da NewsGuard, il chatbot cinese ha fornito risposte errate nell’83% dei casi, posizionandosi al decimo posto su undici concorrenti. Un risultato che mette in discussione non solo l’efficacia del modello, ma anche il suo potenziale utilizzo come strumento di disinformazione e veicolo delle posizioni governative di Pechino.

Il Confronto con i Principali Competitor

L’analisi di NewsGuard ha testato DeepSeek con gli stessi criteri applicati ai 10 principali chatbot attualmente in circolazione: ChatGPT-4o di OpenAI, Smart Assistant di You.com, Grok-2 di xAI, Pi di Inflection, le Chat di Mistral, Copilot di Microsoft, Meta AI, Claude di Anthropic, Gemini 2.0 di Google e il motore di risposta di Perplexity. Mentre il tasso medio di fallimento di questi modelli si attesta intorno al 62%, DeepSeek ha superato questa soglia in modo significativo, accumulando un fallimento complessivo dell’83%.

Analizzando nel dettaglio il comportamento dell’IA cinese, è emerso che il 30% delle volte ha ripetuto false affermazioni, mentre nel 53% dei casi ha evitato di rispondere. Questo dato suggerisce che DeepSeek non solo è meno efficace rispetto ai concorrenti, ma è anche potenzialmente più incline alla manipolazione informativa, rendendolo un candidato problematico in un contesto di lotta alla disinformazione.

DeepSeek R1 e sicurezza: innovazione AI Cinese tra potenzialità e vulnerabilità

DeepSeek R1, il più recente modello di intelligenza artificiale emerso dalla Cina, sta attirando l’attenzione globale per le sue avanzate capacità di ragionamento. Presentato come una svolta nella risoluzione di problemi complessi in matematica, programmazione e logica, DeepSeek R1 si propone come un concorrente diretto dei giganti dell’AI come OpenAI. Tuttavia, dietro l’entusiasmo iniziale, emergono preoccupazioni significative riguardo alle sue vulnerabilità in termini di sicurezza.

Nonostante le sue impressionanti capacità, DeepSeek R1 presenta vulnerabilità che non possono essere ignorate. ELA, un’organizzazione specializzata in sicurezza informatica, ha osservato che, sebbene DeepSeek R1 condivida somiglianze con modelli come ChatGPT, è significativamente più vulnerabile. Il team Red Team di KELA è riuscito a “jailbreakare” il modello in una vasta gamma di scenari, permettendogli di generare output dannosi, come lo sviluppo di ransomware, la fabbricazione di contenuti sensibili e istruzioni dettagliate per la creazione di tossine e dispositivi esplosivi.

Gli Stati Uniti valutano nuove restrizioni su Nvidia: possibile stop alle GPU H20 per la Cina

L’amministrazione Trump starebbe considerando ulteriori restrizioni sulle esportazioni di Nvidia verso la Cina, con particolare attenzione alle GPU H20. Secondo un rapporto di Bloomberg, queste nuove misure potrebbero espandere i divieti già esistenti, che dal 2022 includono chip avanzati come A100, H100, A800 e H800, ma non le H20. Le GPU H20 sono fondamentali per lo sviluppo di applicazioni di intelligenza artificiale e, secondo alcune fonti, sarebbero state utilizzate da DeepSeek per addestrare il suo ultimo modello linguistico avanzato.

Deepseek come strumento META di Adv?

Meta sta considerando di testare il modello di intelligenza artificiale cinese DeepSeek all’interno dei suoi strumenti generativi destinati agli inserzionisti. Questa decisione ha sollevato interrogativi, poiché DeepSeek è un concorrente diretto di Meta nel settore dell’IA.

Meta ha istituito “war rooms” interne per analizzare le innovazioni di DeepSeek, cercando di capire come il modello cinese sia riuscito a ottenere risultati così notevoli con risorse inferiori. Questo approccio suggerisce che Meta stia cercando non solo di competere, ma anche di apprendere dalle tecniche utilizzate da DeepSeek per migliorare la propria offerta.

Secondo un dipendente di Meta, Clara Shih, vicepresidente della divisione AI per il business, ha espresso interesse per DeepSeek per via delle sue elevate prestazioni. Un portavoce della società ha confermato che Meta sta esplorando tutte le opzioni disponibili nel panorama dell’AI, segnalando una potenziale apertura verso modelli esterni per migliorare le proprie offerte pubblicitarie.

La decisione di Meta nasce da una serie di lamentele da parte degli inserzionisti sulla precisione degli strumenti di generazione di testo e immagini basati sul modello Llama, sviluppato internamente dall’azienda. Alcuni clienti avrebbero infatti segnalato la necessità di modificare significativamente i contenuti generati dall’AI, sollevando dubbi sull’efficacia dell’attuale tecnologia proprietaria di Meta.

Tuttavia, la scelta di Meta di considerare DeepSeek come un partner potenziale potrebbe sollevare sospetti riguardo alle sue vere intenzioni. Alcuni esperti si chiedono se questa apertura verso un concorrente possa nascondere una strategia più ampia per affrontare la crescente competizione nel campo dell’IA.

Se Meta dovesse effettivamente adottare DeepSeek nei suoi strumenti pubblicitari, si aprirebbe un nuovo fronte nella competizione tecnologica tra Stati Uniti e Cina. L’adozione di un modello AI cinese da parte di un gigante occidentale non solo metterebbe in discussione la superiorità delle Big Tech statunitensi, ma solleverebbe anche questioni geopolitiche e regolamentari. Il rischio di dipendere da un’AI sviluppata in un Paese soggetto a restrizioni commerciali da parte del governo USA potrebbe diventare un tema di discussione tra politici e autorità di regolamentazione, aggiungendo ulteriore incertezza in un mercato già altamente volatile.

In questo scenario, l’industria dell’AI sta entrando in una fase di trasformazione imprevedibile, in cui il vantaggio competitivo non è più garantito dall’accesso ai capitali o ai talenti di una singola nazione. La corsa all’intelligenza artificiale si sta globalizzando rapidamente, e le aziende dovranno rivedere le proprie strategie per non restare indietro in un settore che si evolve a velocità senza precedenti.


Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla nostra newsletter gratuita e accedi ai contenuti esclusivi di Rivista.AI direttamente nella tua casella di posta!

DeepSeek: Italia, nuove preoccupazioni sulla privacy e censura, sparisce dall’App Store di Apple e di Google

DeepSeek, l’applicazione di intelligenza artificiale sviluppata dalla startup cinese DeepSeek, ha recentemente guadagnato una notevole popolarità a livello globale, raggiungendo la vetta delle classifiche di download sull’App Store di Apple negli Stati Uniti entro il 25 gennaio 2025.

Tuttavia, in Italia, l’app è stata rimossa sia dall’App Store di Apple che da Google Play, suscitando preoccupazioni riguardo alla sua disponibilità e alle implicazioni per gli utenti italiani.

DeepSeek e l’arte della magia: come trasformare OpenAI in OpenBar

Silicon Valley ha un nuovo incubo: DeepSeek, la startup cinese che è riuscita a sviluppare modelli AI avanzati con un budget da pizza e birra rispetto ai miliardi di dollari bruciati da OpenAI. Un miracolo? O forse un po’ di sana, vecchia ingegneria inversa con una spruzzata di “prendiamo in prestito e vediamo come va”?

Microsoft e OpenAI hanno lanciato un’indagine perché sospettano che DeepSeek abbia usato le API di OpenAI per addestrare i propri modelli. Secondo fonti interne, a fine 2024 sono stati individuati enormi flussi di dati in uscita dagli account sviluppatore di OpenAI, apparentemente collegati a DeepSeek. In altre parole, qualcuno ha trovato il rubinetto aperto e ha riempito la piscina.

Quando una Startup Cinese mette in ginocchio la Silicon Valley (e il MAGA Ride)

Ma chi lo avrebbe mai detto? Una piccola startup cinese ha mandato in tilt l’intero settore tecnologico americano, e non con qualche trucchetto sporco, ma semplicemente costruendo un’intelligenza artificiale più efficiente e meno costosa.

DeepSeek ha rilasciato il suo modello R1, capace di competere con i mostri sacri americani a una frazione del costo. Risultato? Un bagno di sangue in borsa: Nvidia ha bruciato 600 miliardi di dollari di valore in un colpo solo. Per un attimo, sembrava di essere tornati al 2008, ma senza i banchieri di Wall Street da incolpare. Questa volta, il colpevole è un manipolo di programmatori cinesi che, a quanto pare, sanno fare di meglio con meno.

Deepseek: il Garante della Privacy chiede informazioni su gestione dati personali

Il Garante per la protezione dei dati personali ha inviato una richiesta di informazioni a Hangzhou DeepSeek Artificial Intelligence e a Beijing DeepSeek Artificial Intelligence, le società che forniscono il servizio di chatbot DeepSeek, sia su piattaforma web che su App. Lo si apprende da una nota del Garante.

Falsi rumors su DeepSeek R1: scopriamo la verità dietro l’Hype

Il Costo dell’Addestramento: Un Investimento Molto Maggiore

Secondo Philipp Schmid Technical Lead & LLMs aHugging Face, DeepSeek R1 è emerso come un attore di rilievo nel panorama dell’intelligenza artificiale e del machine learning, suscitando molta attenzione sia nelle comunità tecnologiche che scientifiche.

Tuttavia, tra l’entusiasmo crescente, sono circolate numerose informazioni errate che hanno generato confusione, portando molti a credere a false affermazioni. Analizziamo i fatti e facciamo chiarezza su alcuni dei punti chiave errati che circolano riguardo a DeepSeek R1, le sue capacità e la sua storia.Una delle affermazioni più fuorvianti riguarda il presunto basso costo dell’addestramento del modello DeepSeek R1.

Alcuni rapporti hanno suggerito che l’addestramento sarebbe costato solo circa 6 milioni di dollari. Questa cifra è ben lontana dalla realtà.

In effetti, la potenza di calcolo necessaria per il modello base (senza reinforcement learning o altri aggiustamenti) ha avuto un costo di circa 5,5 milioni di dollari in ore GPU.

Questa cifra non comprende altre componenti cruciali, come le ablation, i piccoli esperimenti, la generazione dei dati e altre fasi dell’intero processo di addestramento di DeepSeek R1.

L’affermazione che l’addestramento sia costato solo 6 milioni è quindi una semplificazione eccessiva che non tiene conto della complessità e delle risorse coinvolte nella costruzione di un modello così avanzato.

DeepSeek-R1 DrillDown: un modello AI Open Source che ridefinisce il ragionamento complesso

DeepSeek AI ha presentato DeepSeek-R1, un modello open source che si pone come un diretto concorrente del noto OpenAI-o1 nei compiti di ragionamento complesso. Questo traguardo è stato raggiunto grazie all’introduzione di un algoritmo innovativo chiamato Group Relative Policy Optimization (GRPO) e a un approccio multi-stage basato sul reinforcement learning (RL). La combinazione di queste tecniche ha consentito di superare molte delle limitazioni tradizionali nei modelli di intelligenza artificiale per il ragionamento avanzato.

Il CEO di OpenAI, Sam Altman, su DeepSeek R1: “un modello notevole.”

DeepSeek AI: Sicurezza Nazionale in pericolo?

DeepSeek, dichiara di aver sviluppato il suo modello con un budget di soli 5 milioni di dollari, ha sovvertito il paradigma tradizionale dell’IA, basato su enormi risorse computazionali. Mentre aziende occidentali come OpenAI spendono miliardi di dollari in infrastrutture, DeepSeek sembra aver dimostrato che è possibile ottenere risultati comparabili con un approccio più efficiente e innovativo. Tuttavia, questa straordinaria efficienza tecnica è ora sotto esame, non solo per la sua innovatività, ma anche per le implicazioni geopolitiche e di sicurezza che comporta.

DeepSeek Janus Pro sfida DALL-E 3: il nuovo standard per l’AI multimodale?

Con il rilascio di Janus Pro, il laboratorio cinese DeepSeek ha lanciato una sfida diretta a DALL-E 3, il modello generativo di immagini di punta di OpenAI. Janus Pro si distingue per essere un modello open-source che offre prestazioni superiori in benchmark chiave come GenEval e DPG-Bench, una mossa che potrebbe ridefinire gli equilibri tra i leader dell’intelligenza artificiale multimodale.

Il venture capitalist Marc Andreessen l’ha definito “il momento Sputnik dell’IA” e potrebbe avere ragione

Marc Andreessen ha recentemente definito (WSJ) il periodo che stiamo vivendo come “il momento Sputnik dell’IA”, un’affermazione che, a prima vista, potrebbe sembrare esagerata, ma che, se esaminata più a fondo, si svela come una descrizione sorprendentemente precisa del momento storico che stiamo attraversando.

L’analogia con lo Sputnik non è casuale. Quando il satellite sovietico fu lanciato nel 1957, il mondo occidentale, in particolare gli Stati Uniti, si ritrovò di fronte a un’invasione tecnologica che non aveva previsto e che li costrinse a reagire. Non era una questione di forza militare, ma di superiorità tecnologica che modificava l’equilibrio globale.

Nvidia perde mezzo trilione in un giorno: DeepSeek fa tremare il regno del re delle GPU

Nvidia ha visto sparire dalla sua capitalizzazione di mercato la bellezza di 589 miliardi di dollari in una sola giornata, un record storico che di certo non verrà celebrato con una targa. Il crollo è stato causato, ironia della sorte, da una startup cinese dal nome apparentemente innocuo, DeepSeek, che ha avuto l’audacia di presentare un modello linguistico di grandi dimensioni, il famigerato R1, gettando un’ombra sul dominio AI degli Stati Uniti. Jensen Huang, CEO di Nvidia, potrebbe non aver preso bene la notizia, anche se ufficialmente la compagnia applaude l’innovazione… come chi applaude il rivale che gli soffia la corona.

DeepSeek: La Sfida Cinese nell’Intelligenza Artificiale, Stargate e Nvdia, facciamo il punto al Bar dei Daini

L’intelligenza artificiale sta rapidamente emergendo come una delle sfide più complesse e interessanti del nostro tempo. Mentre le potenze occidentali, con in prima linea aziende come Nvidia, continuano a dominare il mercato globale delle tecnologie AI, la Cina sta avanzando con una serie di innovazioni strategiche. A fare da sfondo a questa corsa all’oro digitale, emergono non solo attori consolidati come Nvidia, ma anche realtà emergenti come Stargate, che stanno cercando di capitalizzare sul potenziale di un futuro dominato dall’IA.

L’intelligenza artificiale è diventata il terreno di scontro per le superpotenze tecnologiche mondiali, con il gigante asiatico che, grazie al supporto statale e a una strategia altamente mirata, si sta facendo strada nel panorama globale. Tuttavia, c’è un aspetto che rende questa sfida ancora più interessante: la crescente interconnessione tra diverse realtà, da Nvidia, con i suoi prodotti all’avanguardia, alla Cina, che sta investendo in modo aggressivo per soppiantare i leader del settore.

DeepSeek sfida OpenAI con Janus Pro-7B: l’evoluzione dei modelli multimodali e l’impatto sul mercato tech

La società cinese DeepSeek, già al centro dell’attenzione per il rilascio del modello open-source R1, ha lanciato un secondo modello multimodale open-source, Janus Pro-7B, che promette di ridefinire gli standard nell’intelligenza artificiale. Il modello è stato reso disponibile su Hugging Face, una piattaforma leader per l’IA, con l’obiettivo dichiarato di offrire comprensione e generazione unificata. Secondo DeepSeek, il Janus Pro-7B supera i precedenti modelli multimodali unificati e compete, se non addirittura eccelle, rispetto alle prestazioni dei modelli specifici per singoli compiti. Questo lo rende un forte candidato per le applicazioni di prossima generazione nel campo multimodale.


Richard Lawler

DeepSeek says its newest AI model, Janus-Pro can outperform Stable Diffusion and DALL-E 3.

Already riding a wave of hype over its R1 “reasoning” AI that is atop the app store charts and shifting the stock market, Chinese startup DeepSeek has released another new open-source AI model: Janus-Pro.

Può analizzare o produrre solo immagini piccole a una risoluzione di 384×384, ma l’azienda afferma che la versione più grande, Janus-Pro-7b, ha superato modelli comparabili in due test di riferimento per l’IA.

Two graphs showing Janus-Pro performance compared to similar AI models like SDXL and DALL-E 3.

Image: DeepSeek

Aurora Mobile: la rivoluzione dell’Intelligenza Artificiale che sconvolge il mercato con DeepSeek-V3

Aurora Mobile Limited, azienda leader nei servizi di coinvolgimento del cliente e tecnologia di marketing in Cina, ha recentemente integrato il modello di intelligenza artificiale DeepSeek-V3 nella sua piattaforma GPTBots.AI. Questa mossa strategica ha portato a un’impennata del valore delle azioni dell’azienda, con un aumento di oltre il 200% nel mercato azionario.

DeepSeek-V3 è un modello linguistico avanzato sviluppato dalla start-up cinese DeepSeek. Secondo il South China Morning Post, nei test di benchmark, questo modello ha superato prodotti concorrenti di aziende come Meta e OpenAI. La sua capacità di elaborazione e la velocità di inferenza rappresentano un significativo passo avanti nell’industria dell’intelligenza artificiale.

Il ritorno alla realtà: Tesla e il settore Tech sotto pressione a causa di DeepSeek AI

Tesla sta affrontando un calo significativo dopo che le performance di DeepSeek AI, recentemente annunciate, hanno suscitato preoccupazioni sulla sostenibilità dei premi associati all’intelligenza artificiale nei mercati finanziari. Questo sviluppo non riguarda solo Tesla ma l’intero settore tecnologico statunitense, il quale sembra iniziare a sentire il “pinch” dell’iperottimismo che ha circondato le applicazioni avanzate di AI nel corso del 2024.

DeepSeek AI, una piattaforma all’avanguardia per l’analisi predittiva e la gestione dei dati, ha recentemente pubblicato benchmark che hanno evidenziato limiti tecnici rispetto alle aspettative irrealistiche create dagli investitori. Questi risultati hanno alimentato dubbi sull’attuale valutazione di aziende che hanno cavalcato il trend dell’intelligenza artificiale, come Tesla. Il titolo, che aveva registrato una crescita esponenziale grazie al posizionamento aggressivo nell’AI applicata alla guida autonoma e alla gestione delle infrastrutture energetiche, ha subito un contraccolpo.

DeepSeek V3: L’Innovazione che Ridefinisce il Futuro dell’Intelligenza Artificiale

DeepSeek, un nome che è stato relativamente poco discusso nella comunità globale dell’IA, ha appena rilasciato un aggiornamento significativo con il lancio del modello DeepSeek v3. Questa nuova versione ha attirato l’attenzione per le sue prestazioni e per il costo sorprendentemente basso. In un panorama in cui le aziende statunitensi e occidentali come OpenAI, Anthropic e altre hanno tradizionalmente dominato i progressi nell’IA, il lancio di DeepSeek v3 non è solo una pietra miliare tecnica, ma anche un segnale strategico delle capacità in rapida crescita degli sviluppatori cinesi nel campo dell’IA.

Il confronto immediato riguarda ovviamente modelli come Llama 3.1 e i suoi omologhi più noti, come GPT-4 e Claude 3.5 Sonnet. DeepSeek v3 sembra aver superato Llama 3.1 in termini di benchmark, posizionandosi come uno dei migliori modelli open-weight disponibili. Le sue prestazioni lo pongono anche in competizione con alcuni dei modelli leader a livello globale, sebbene con alcune riserve. Sebbene i benchmark siano impressionanti, rimane la sensazione che, nelle applicazioni pratiche, Sonnet 3.5 possa ancora offrire risultati superiori. Tuttavia, ciò non toglie che il risultato di DeepSeek v3 sia notevole e che segni un importante passo avanti per il panorama dell’intelligenza artificiale.

Un altro aspetto che non può passare inosservato è il costo di sviluppo. DeepSeek ha dichiarato che il modello v3 è stato addestrato con una spesa di soli 5,5 milioni di dollari, utilizzando un cluster relativamente ridotto di 2.048 GPU H800. Per fare un confronto, xAI, la compagnia fondata da Elon Musk, ha utilizzato un enorme cluster da 100.000 GPU H100 per addestrare i propri modelli. La differenza di scala tra i due progetti è abissale, ma ciò che impressiona è come DeepSeek sia riuscita a ottenere risultati di alta qualità con una risorsa molto più contenuta, mettendo in evidenza la sua capacità di ottimizzare e sfruttare al meglio l’hardware a sua disposizione.

La questione sollevata da molti osservatori è se il rilascio di DeepSeek v3 rappresenti una prova del fallimento dei controlli all’esportazione sul progresso dell’IA in Cina. La risposta non è semplice, ma c’è sicuramente un argomento che merita attenzione: se DeepSeek è riuscita a sviluppare un modello di alta qualità con un cluster relativamente piccolo, cosa sarebbe in grado di fare se avesse accesso a una potenza computazionale maggiore, come quella di un cluster massiccio? La domanda diventa ancora più intrigante se consideriamo le implicazioni di ciò nel contesto delle attuali tensioni geopolitiche e della corsa globale all’innovazione in campo tecnologico.

DeepSeek V3 ha rapidamente guadagnato l’attenzione di sviluppatori e appassionati di intelligenza artificiale per le sue straordinarie capacità di programmazione e supporto tecnico. È considerato un vero e proprio punto di svolta nel panorama dei modelli linguistici avanzati, offrendo una combinazione impressionante di potenza computazionale e precisione analitica. Dopo averlo testato approfonditamente con Open Hands (precedentemente noto come Open Devin), la comunità tecnologica è unanime nel riconoscere il suo impatto rivoluzionario.

DeepSeek V3 si distingue per la sua capacità di affrontare problemi di programmazione complessi mantenendo un livello di precisione elevato. Anche nei rari casi in cui devia dal percorso ottimale, una semplice reimpostazione della sessione è sufficiente per riportarlo in carreggiata. Questo livello di flessibilità e recupero lo rende ideale per applicazioni di sviluppo software su larga scala, garantendo affidabilità durante sessioni di lavoro prolungate.

La stabilità del modello è stata elogiata da molti utenti, che hanno trovato in DeepSeek V3 uno strumento potente per affrontare progetti articolati e altamente tecnici. Il suo ambiente di lavoro, specialmente quando utilizzato con API dedicate, consente una personalizzazione avanzata, adattandosi a una vasta gamma di esigenze.

Uno degli aspetti più impressionanti di DeepSeek V3 è la sua accessibilità economica. Rispetto ad altri modelli di fascia alta come Claude 3.5 Sonnet e GPT-4, offre prestazioni comparabili a una frazione del costo. Questa caratteristica democratizza l’accesso all’intelligenza artificiale avanzata, consentendo a startup e sviluppatori indipendenti di integrare capacità AI avanzate nei loro prodotti senza gravare eccessivamente sul budget.

Il prezzo competitivo renda DeepSeek V3 una scelta ideale per progetti di intelligenza artificiale in tempo reale, videogiochi dinamici e strumenti di automazione complessi. Nonostante il costo contenuto, la qualità dell’output non è compromessa, posizionandolo come un vero rivale dei modelli più blasonati.

Sebbene DeepSeek V3 eccella nelle applicazioni di sviluppo software e nella risoluzione di problemi tecnici, alcuni utenti hanno notato che le sue capacità di conversazione generale e ragionamento contestuale sono leggermente inferiori rispetto ad altri modelli come Claude e Gemini. Questo aspetto potrebbe essere dovuto a un affinamento specifico per compiti di codifica piuttosto che per la conversazione generica.

Tuttavia, questa specializzazione non rappresenta necessariamente uno svantaggio. Gli sviluppatori vedono in DeepSeek V3 uno strumento altamente focalizzato e ottimizzato per i loro bisogni, mentre per applicazioni più orientate alla chat si possono considerare altre opzioni più generiche.

Nonostante i suoi punti di forza, DeepSeek V3 non è privo di difetti. Alcuni utenti hanno segnalato episodi di loop nei processi e difficoltà nell’affrontare richieste complesse con contesti estesi. Ad esempio, in casi di personalizzazioni sofisticate o grandi quantità di dati, il modello può richiedere ulteriori iterazioni manuali per correggere errori persistenti.

Qualche preoccupazione sulla privacy dei dati, specialmente per quanto riguarda l’uso del modello tramite server ospitati all’estero. Soluzioni come l’esecuzione locale su hardware dedicato sono state suggerite per mitigare queste preoccupazioni, sebbene ciò richieda risorse computazionali significative.

DeepSeek V3 ha sollevato nuove domande sulla competizione globale nell’IA, specialmente in un contesto in cui aziende cinesi stanno rapidamente guadagnando terreno. Mentre alcuni utenti si interrogano sulla sicurezza dei dati e sull’influenza geopolitica, altri vedono in questa tecnologia un passo avanti verso l’innovazione aperta e distribuita.

Con un supporto crescente per API aperte e integrazioni con strumenti come Cine e VSCode, DeepSeek V3 ha il potenziale di diventare uno standard industriale nel settore dello sviluppo AI. Tuttavia, per mantenere il suo vantaggio competitivo, dovrà affrontare la sfida di aggiungere funzionalità multimodali e migliorare la gestione dei contesti estesi.

DeepSeek V3 si è dimostrato uno strumento straordinario per sviluppatori e programmatori, alzando l’asticella in termini di prestazioni e convenienza economica. Sebbene presenti alcune limitazioni nelle capacità conversazionali e nella gestione di compiti complessi, il suo valore per applicazioni specifiche è indiscutibile.

La comunità tecnologica attende con impazienza ulteriori miglioramenti, inclusa l’aggiunta di input multimodali e capacità di contesto espanso. Fino ad allora, DeepSeek V3 rimane una risorsa indispensabile per chiunque desideri esplorare il futuro dell’intelligenza artificiale applicata.

Questa realtà solleva quindi importanti interrogativi sulla natura delle future competizioni nell’IA globale. Se aziende come DeepSeek riescono a creare modelli competitivi con risorse limitate, l’inevitabile domanda è quanto lontano possa arrivare questa tecnologia con maggiori investimenti e accesso a hardware avanzato. Con il continuo progresso della Cina nel settore dell’intelligenza artificiale, la sfida tra potenze globali sembra destinata a intensificarsi, mettendo sempre più sotto pressione le politiche di controllo tecnologico internazionali.


Newsletter – Non perderti le ultime novità sul mondo dell’Intelligenza Artificiale: iscriviti alla newsletter di Rivista.AI e accedi a un mondo di contenuti esclusivi direttamente nella tua casella di posta!

DeepSeek-R1: La Nuova Frontiera dei Modelli AI di Ragionamento per Competere con OpenAI o1

DeepSeek, una compagnia di ricerca AI finanziata da trader quantitativi, ha presentato una versione preliminare di DeepSeek-R1, un modello che promette di competere direttamente con o1 di OpenAI. Questo modello di ragionamento avanzato mira a superare alcune delle sfide che i modelli AI tradizionali affrontano, come la verifica dei fatti e la gestione di domande complesse, attraverso una metodologia che sembra porre un netto miglioramento rispetto agli approcci tradizionali.

CC BY-NC-SA 4.0 DEED | Disclaimer Contenuti | Informativa Privacy | Informativa sui Cookie