Google ha presentato un nuovo modello di intelligenza artificiale chiamato Gemini 2.0 Flash Thinking, progettato per affrontare domande complesse e spiegare i processi logici utilizzati per arrivare alla soluzione. Questo sistema sperimentale rappresenta un’importante evoluzione nell’IA cognitiva, ponendosi come potenziale concorrente diretto del modello di ragionamento o1 di OpenAI.
Categoria: AI Pagina 2 di 15
L’ hub-per-una-copertura-completa-sullintelligenza-artificiale-e-lapprendimento-automatico

Instagram si prepara a lanciare nel 2025 una nuova funzionalità che promette di cambiare radicalmente il modo in cui i creatori di contenuti modificano e personalizzano i loro video. Questo strumento di editing basato sull’intelligenza artificiale generativa, alimentato dal modello Movie Gen AI di Meta, consentirà agli utenti di modificare quasi ogni aspetto dei loro video tramite semplici comandi di testo, aprendo nuove possibilità di creatività e facilità per i creatori di contenuti.

OpenAI ha annunciato il rilascio dell’API di o1, un aggiornamento significativo che ridefinisce il modo in cui gli sviluppatori interagiscono con i modelli di intelligenza artificiale. Questa evoluzione introduce funzionalità avanzate come prompt di sistema, messaggi specifici per sviluppatori, chiamate di funzioni dinamiche, output strutturati e il rivoluzionario parametro “sforzo di ragionamento”. Chi non conosce il miglior film di tutti i tempi, Balle Spaziali : “Che lo sforzo sia con voi!”

YouTube sta collaborando con la Creative Artists Agency (CAA) per offrire agli artisti e ai creatori di contenuti un potente strumento di gestione delle loro immagini generate tramite intelligenza artificiale. Questa iniziativa mira a proteggere la loro identità digitale, permettendo di individuare e rimuovere contenuti che utilizzano il loro volto o voce senza autorizzazione. Il progetto sarà testato con celebrità e atleti a partire dal prossimo anno, per poi essere esteso ai principali creatori di YouTube e altri professionisti creativi.

YouTube sta introducendo una nuova funzionalità che consente ai creatori di contenuti di autorizzare aziende terze a utilizzare i loro video per addestrare modelli di intelligenza artificiale (AI). Questa opzione, disattivata di default, permette a chiunque voglia partecipare di abilitare l’accesso attraverso YouTube Studio. L’obiettivo dichiarato è offrire ai creatori nuove opportunità di guadagno nell’era dell’intelligenza artificiale.

Google ha annunciato il lancio di Veo 2, la nuova versione del suo modello video avanzato progettato per competere con Sora. L’azienda sostiene che questa versione rappresenti un passo avanti significativo nella comprensione della fisica del mondo reale, con un’attenzione particolare ai movimenti e alle espressioni umane. L’intelligenza artificiale di Veo 2 è progettata per interpretare e replicare meglio le dinamiche naturali, rendendo le simulazioni visive e le animazioni molto più realistiche.
OpenAI ha introdotto ChatGPT Projects, una piattaforma organizzativa che ridefinisce la gestione dei dati personalizzati, conversazioni, GPT su misura, codici e chat, rendendoli facilmente condivisibili. Kevin Weil, Chief Product Officer di OpenAI, ha annunciato entusiasta la novità durante una diretta streaming: “Stiamo lanciando qualcosa che ci avete richiesto da tempo: Projects in ChatGPT. Tutti gli strumenti che conoscete ora sono parte dei Projects. Oppure potete usare Projects senza le funzioni di ChatGPT.“

YouTube sta ampliando l’orizzonte della condivisione dei contenuti attraverso un importante aggiornamento tecnologico. La piattaforma ha esteso il suo servizio di doppiaggio automatico basato sull’intelligenza artificiale a “centinaia di migliaia di canali” iscritti al Programma Partner, specializzati in contenuti educativi e informativi. Questo strumento promette di abbattere le barriere linguistiche, rendendo accessibili video di qualità a un pubblico internazionale.

OpenAI ha finalmente lanciato la Modalità Voce Avanzata con Visione per ChatGPT, presentata sette mesi fa. Questa nuova funzionalità permette agli utenti di ChatGPT Plus, Team e Pro di interagire in tempo reale attraverso il riconoscimento visivo utilizzando l’app ChatGPT. Basta puntare la fotocamera del telefono su un oggetto per ricevere risposte immediate e contestuali.

Android XR, un nuovo sistema operativo di realtà mista progettato per visori e occhiali smart, è la grande scommessa di Google per alimentare una nuova generazione di dispositivi di realtà aumentata che sembrano realizzare tutti i nostri sogni più sfrenati su cosa possano essere davvero gli occhiali smart.

Fujitsu ha annunciato un’innovazione rivoluzionaria nel campo dell’analisi video: un agente AI progettato per ottimizzare i processi nelle realtà operative di prima linea. Sfruttando dati video spaziali, immagini riprese da telecamere sul posto di lavoro e documentazione scritta come regolamenti e manuali, l’agente AI genera report e suggerimenti per migliorare la sicurezza e l’efficienza. Questa tecnologia sarà integrata nel servizio di intelligenza artificiale “Fujitsu Kozuchi“, con un ambiente di prova disponibile già nel 2024 e una implementazione interna pianificata per gennaio 2025.

AI16z DAO sta riscrivendo le regole su come le comunità crypto investono, governano e operano, sia per divertimento che per sfruttare il potenziale dell’intelligenza artificiale nel prendere decisioni finanziarie basate sui dati. Questo progetto di organizzazione autonoma decentralizzata (DAO) ha l’obiettivo di “capovolgere a16z,” una delle principali società di venture capital della Silicon Valley, ridefinendo il concetto di venture capitalist nell’era dell’IA.

In un mondo dove l’intelligenza artificiale sembra essere l’unico argomento di conversazione, Hyperbolic ha deciso di alzare la posta, raccogliendo ben 12 milioni di dollari in un round di finanziamento Series A. E chi lo ha fatto? Nientemeno che Variant e Polychain Capital, con una schiera di investitori che include Lightspeed Faction e Bankless Ventures. È come se avessero deciso di costruire un castello di sabbia in un mare di opportunità, ma con un budget decisamente più sostanzioso.

Nel panorama in continua evoluzione della programmazione, dove ogni riga di codice è una possibilità di successo o un potenziale fallimento, Google ha lanciato un nuovo strumento destinato a cambiare il modo in cui i programmatori interagiscono con il codice difettoso. Si chiama Jules, ed è un agente basato su intelligenza artificiale progettato per aiutare gli sviluppatori a risolvere i bug nel codice, con un focus particolare su Python e Javascript. Questa innovazione arriva in un momento in cui la necessità di velocizzare lo sviluppo e migliorare la qualità del software è più pressante che mai.

Con l’annuncio di Gemini 2.0, Google DeepMind si lancia in un’agguerrita competizione contro OpenAI, supportata da Microsoft. Il nuovo modello rappresenta la più sofisticata espressione dell’intelligenza artificiale sviluppata da Alphabet , progettata per ampliare le applicazioni grazie a capacità agentiche avanzate e processi multimodali.

Apple e Broadcom stanno lavorando insieme per sviluppare il primo chip server interno di Apple, progettato esclusivamente per l’intelligenza artificiale. Questo progetto, denominato internamente “Baltra”, potrebbe essere pronto per la produzione di massa entro il 2026, secondo fonti vicine alla questione riportate da The Information.

OpenAI ha sganciato la sua ultima bomba tecnologica: Sora, il modello di IA per la creazione di video a partire da testo, lanciato ufficialmente lunedì come parte della maratona di 12 giorni di annunci chiamata “Ship-mas”. Sora è disponibile ora su Sora.com per gli abbonati di ChatGPT negli Stati Uniti e in “molti altri Paesi”. La novità? Un modello aggiornato chiamato Sora Turbo, che eleva ulteriormente le potenzialità di questa tecnologia, permettendo di creare video da testo, animare immagini e remixare clip esistenti.
UPDATED
Il nuovo generatore di immagini “Aurora” di X è sparito. L’opzione “Grok 2 + Aurora” è scomparsa dal menu di selezione del modello di Grok solo un giorno dopo che è apparsa, riporta Engadget, sostituita invece da “Grok 2 + FLUX beta“. Il proprietario di X, Elon Musk, ha scritto ieri che il modello fotorealistico e in gran parte non restrittivo è un “generatore di immagini interno” in versione beta. Aggiornamento: Aggiunti dettagli di test.
X ha svelato “Aurora”, il suo nuovo generatore di immagini AI, che promette un livello di fotorealismo mai visto prima. Questo modello avanzato è integrato nella nuova opzione “Grok 2 + Aurora beta” ed è già disponibile per gli utenti, anche se solo per un numero limitato di query prima di incappare nel paywall di X Premium.

Dunque, l’intelligenza artificiale sta cambiando il mondo, e non solo correggendo le vostre email mal scritte (non che questa newsletter ne avesse bisogno, capiamoci). È qualcosa di più profondo, tipo prevedere il meteo con precisione millimetrica — il che potrebbe sembrare meno eccitante di un film di supereroi, ma pensateci: se sapete che lunedì pioverà, potreste persino annullare quella terribile riunione all’aperto e salvare la vostra sanità mentale.

Nel panorama sempre più affollato delle tecnologie AI generative, Google ha appena lanciato Veo, un modello avanzato per la creazione di video ad alta qualità, facendo un passo importante verso l’integrazione di AI nei flussi di lavoro aziendali. Disponibile attraverso la piattaforma Vertex AI, Veo promette di rivoluzionare il modo in cui le aziende sviluppano contenuti video. Annunciato per la prima volta a maggio, Veo ha battuto sul tempo la concorrenza di OpenAI, che aveva mostrato il suo modello Sora solo qualche mese prima, lanciandosi in anteprima privata su Vertex AI.

Nel mondo della tecnologia, ogni piccola innovazione ha il potenziale di cambiare le regole del gioco, e l’ultima mossa di o1 con il suo annuncio di “reinforcement fine-tuning” non fa eccezione. Questo aggiornamento consente agli sviluppatori di personalizzare il modello di intelligenza artificiale per adattarlo meglio ai propri casi d’uso, una novità che apre a nuove possibilità per l’intera comunità di sviluppatori, dalla creazione di soluzioni altamente specializzate a quella di esperienze personalizzate per gli utenti finali.

Hailuo AI MiniMax ha appena rilasciato una rivoluzionaria innovazione nel campo dell’intelligenza artificiale e della creatività digitale: il modello I2V-01-Live, progettato per animare le illustrazioni artistiche con un realismo e una fluidità mai visti prima. Questa tecnologia rappresenta un passo avanti significativo nel mondo della generazione di contenuti dinamici, trasformando opere d’arte statiche in esperienze immersive e interattive.
Mentre OpenAI continua a stuzzicare l’attesa per Sora, il suo promesso strumento di generazione video, Tencent ha preso tutti in contropiede lanciando Hunyuan Video, un modello AI open-source che ha già dimostrato di competere con le soluzioni video di punta sul mercato.


Uljan Sharka, il Ceo di iGenius, ha annunciato il lancio di Colosseum, un supercomputer italiano progettato per rivoluzionare il settore dell’Intelligenza Artificiale. La società, già conosciuta per il suo contributo nel campo dell’AI, ha annunciato il lancio del SuperPOD Nvidia DGX, equipaggiato con i potenti superchip Nvidia Grace Blackwell, destinato a supportare modelli avanzati di AI per clienti nei settori finanziari, sanitari e pubblici a livello globale.

DeepMind, parte del gruppo Google, ha recentemente annunciato Genie 2, un avanzato modello di intelligenza artificiale progettato per generare ambienti 3D interattivi a partire da semplici input, come immagini o descrizioni testuali. Questo sistema rappresenta un passo significativo nell’uso dell’AI generativa per la creazione di mondi virtuali e giochi, aprendo nuove prospettive per sviluppatori e designer di contenuti immersivi.

Nell’era della digitalizzazione accelerata, la tecnologia continua a ridefinire ogni settore, inclusa la meteorologia. Google, con il suo incessante avanzamento nel campo dell’intelligenza artificiale (AI), ha introdotto un sistema di previsioni meteo generato dall’AI che promette di superare le prestazioni dei modelli tradizionali con una velocità e precisione senza precedenti.

Suno si consolida come leader nel panorama dell’intelligenza artificiale applicata alla musica, spingendo i confini della creatività con una piattaforma capace di generare canzoni complete, inclusi testi e vocalizzi, a partire da semplici input testuali. Fin dal suo debutto, avvenuto lo scorso anno, Suno ha introdotto significativi miglioramenti: brani di maggiore durata, funzionalità community potenziate e la possibilità di creare cantanti virtuali personalizzati.
La versione 4 promette un ulteriore balzo qualitativo, grazie a innovazioni già anticipate sui social da dipendenti e beta tester.

Oggi, catturare e mantenere l’attenzione degli utenti è cruciale per il successo di qualunque azienda. La personalizzazione e l’interattività sono diventate pilastri fondamentali per offrire un’esperienza utente che sia coinvolgente ed efficace. Tuttavia, la realtà attuale dei chatbot presenta una serie di ostacoli: strumenti troppo semplici, flessibilità limitata, o una complessità tecnica che esclude chi non ha competenze avanzate di programmazione.

Imogen Heap, vincitrice di Grammy e pioniera tecnologica, si è imbarcata in un progetto che definire innovativo è poco: ha unito le forze con una piattaforma di intelligenza artificiale musicale chiamata Jen. Ora, già il nome “Jen” mi fa pensare a una persona che indossa maglioni troppo grandi o cardigan con pelliccia ecologica e discute di etica mentre sorseggia tè matcha. E invece no: è una piattaforma di IA che promette di essere etica. Ecco, non so voi, ma io quando sento “IA etica” mi viene un leggero mal di testa.

Negli ultimi anni, l’intelligenza artificiale generativa (GenAI) e i grandi modelli linguistici (LLMs) hanno monopolizzato l’attenzione globale, grazie a innovazioni come ChatGPT. Tuttavia, il panorama è dominato da modelli “closed source” sviluppati da grandi aziende statunitensi e cinesi, limitando la sovranità digitale delle imprese europee. Il progetto OpenGPT-X, guidato dalla Germania, si propone di ribaltare questa tendenza, offrendo un’alternativa europea orientata alla trasparenza, alla personalizzazione e alla sicurezza.

Alibaba ha annunciato il lancio di QwQ-32B-Preview, un modello di intelligenza artificiale di nuova generazione progettato per il ragionamento complesso. Con 32,5 miliardi di parametri, QwQ è in grado di gestire prompt lunghi fino a 32.000 parole, distinguendosi come uno dei modelli AI open-weight più potenti disponibili gratuitamente su piattaforme come Hugging Face. Secondo Alibaba, il modello supera OpenAI o1-preview in specifici benchmark come AIME e MATH-500, test focalizzati su logica e problemi matematici complessi.

Il cielo si sta preparando a un cambiamento epocale e il protagonista di questa rivoluzione non è solo il Falco Xplorer, il drone a pilotaggio remoto sviluppato da Leonardo, ma anche l’intelligenza che lo guida: gli algoritmi. Questi cervelli digitali sono la chiave di volta che consente al Falco Xplorer di volare in modo autonomo e sicuro, operando in spazi aerei condivisi con velivoli con equipaggio. Ma c’è di più: grazie a una serie di test recenti, il drone ha raggiunto traguardi che lo pongono all’avanguardia nella corsa alla sicurezza del traffico aereo europeo.

La crescente diffusione di chatbot AI come ChatGPT Search o Perplexity ha mostrato chiaramente come l’integrazione di ricerche web e citazioni inline possa migliorare significativamente le risposte generate. L’accesso a informazioni aggiornate non solo arricchisce la qualità dei risultati, ma riduce anche il rischio di cosiddette “allucinazioni”, ovvero errori generati dai modelli linguistici.

Un nuovo dispositivo indossabile promette di trasformare la vita dei pazienti colpiti da disartria, un disturbo motorio del linguaggio spesso associato a ictus e altre condizioni neurologiche. Soprannominato “Intelligent Throat,” questo sistema combina sensori avanzati e intelligenza artificiale (AI) per tradurre in tempo reale il linguaggio silenzioso e le sfumature emotive, offrendo un nuovo livello di comunicazione naturale e fluente.

Amazon ha annunciato lo sviluppo di un innovativo modello di intelligenza artificiale, progettato per effettuare ricerche approfondite e analisi nei contenuti video. Questa iniziativa rappresenta un tentativo di posizionarsi come leader nel settore, differenziandosi anche dai partner come Anthropic, con cui l’azienda collabora ma di cui sembra voler competere direttamente.

Un nuovo fronte di sfruttamento dei lavoratori a contratto? Uber, colosso noto per il ride-hailing e le consegne a domicilio, si sta espandendo nel settore del data labeling per l’intelligenza artificiale (AI), utilizzando ancora una volta il modello di business basato sui lavoratori indipendenti. Questo approccio apre interrogativi significativi sul futuro del lavoro e sul trattamento equo dei gig worker.
Con il lancio della divisione “Scaled Solutions”, Uber promette di mettere in contatto le aziende con “analisti, tester e operatori di dati indipendenti” tramite la sua piattaforma. Questa nuova iniziativa nasce da un team interno di supporto, che da anni si occupa di attività come il test di nuove funzionalità e la conversione dei menu dei ristoranti in opzioni Uber Eats. Ora, la stessa forza lavoro sarà messa a disposizione di aziende esterne per attività cruciali nel campo dell’AI, come la classificazione e l’etichettatura dei dati.

Google ha lanciato una nuova piattaforma di scacchi (potrebbe servire una VPN) che unisce la passione per il gioco alla potenza della creatività generativa. Questo innovativo sito web permette ai giocatori di immergersi in un’esperienza unica: la creazione personalizzata dei pezzi attraverso l’intelligenza artificiale. Grazie al modello AI Imagen 3, ogni partita inizia con una novità sorprendente. L’utente può descrivere brevemente il tema desiderato per i pezzi bianchi, e il sistema genererà un set unico. Per bilanciare, i pezzi neri verranno automaticamente progettati con un tema correlato. Ad esempio, una richiesta di pezzi a tema fantascientifico potrebbe tradursi in un esercito avversario ispirato al fantasy.

Un gruppo di ex leader del progetto Android, incluso Hugo Barra, ha annunciato la creazione di una startup che potrebbe ridefinire il panorama tecnologico. La nuova azienda, chiamata /dev/agents, mira a sviluppare un sistema operativo di nuova generazione progettato specificamente per agenti di intelligenza artificiale (AI). Questo progetto nasce dall’idea di riportare le innovazioni alle radici dell’approccio Android, adattandole alle sfide del futuro dell’AI.