Nel caos ormai prevedibile del campo dell’intelligenza artificiale generativa, arriva un nuovo giocatore da Hangzhou con il piglio deciso di chi non vuole limitarsi a fare il follower. Alibaba Group, già gigante dell’e-commerce e dei servizi cloud, ha presentato Qwen VLo, un modello di AI per la generazione e modifica di immagini che si propone di rimescolare le carte con OpenAI e Google, finora i due colossi del settore.

La presentazione, piuttosto sobria ma efficace, parla chiaro: Qwen VLo non si limita a “vedere” il mondo, ma è in grado di capirlo e di ricrearlo con una qualità che, nelle parole del team Qwen, colma il divario tra percezione e creazione. Un claim che suona audace, soprattutto in un mercato dove “alta qualità” è ormai parola d’ordine, ma la concretezza dei risultati rimane spesso incerta. La piattaforma è accessibile in anteprima tramite Qwen Chat, dove gli utenti possono lanciare comandi testuali del tipo “Genera l’immagine di un gatto carino” o caricare un’immagine per chiederne modifiche precise, come “Metti un cappello sul gatto”. Semplice, quasi banale nella sua interfaccia, ma la sfida è tutta nell’accuratezza e nella flessibilità delle risposte.

Qwen VLo punta a superare i modelli più noti grazie a una comprensione più precisa dei contenuti e al supporto per modifiche aperte basate su istruzioni, operando in doppia lingua, inglese e cinese, un vantaggio non da poco in un mondo dove la globalizzazione dell’AI incontra ancora forti barriere linguistiche. Le capacità tecniche comprendono la generazione diretta di immagini, la modifica tramite sostituzione di sfondi, l’aggiunta di soggetti, il trasferimento di stile e persino modifiche estese su istruzioni libere. Alibaba insiste anche sulla gestione di compiti complessi come rilevamento e segmentazione, il che suggerisce un modello versatile e potenzialmente più utile in contesti industriali oltre al semplice intrattenimento.

Questa mossa si inserisce in una strategia più ampia di Alibaba di rafforzare la sua posizione nell’AI, collegandosi anche con giganti globali come Apple per portare intelligenza artificiale avanzata nel mercato cinese. Un dettaglio che mostra come l’ecosistema digitale cinese, spesso percepito come isolato o autarchico, stia invece sviluppando collaborazioni internazionali a un livello molto sofisticato.

L’uscita di Qwen VLo arriva in un momento in cui la corsa all’AI generativa diventa ogni giorno più feroce, e Alibaba mostra di voler puntare non solo su soluzioni di mercato ma su una visione tecnologica propria, capace di adattarsi a esigenze linguistiche e culturali diverse, oltre che a compiti complessi di manipolazione e creazione visuale. Non è solo un esercizio di stile: la capacità di modificare immagini partendo da comandi aperti apre scenari interessanti per creativi, aziende e sviluppatori che cercano un controllo più fine rispetto ai tradizionali generatori basati su prompt fissi.

Se OpenAI ha consolidato il suo dominio con modelli come DALL·E 3 e Google spinge con Imagen 4, Alibaba mette in campo Qwen VLo come una sfida diretta, ma soprattutto come un prodotto nato da una cultura tecnologica e commerciale che sa di dover giocare su un terreno globale e al contempo locale. L’AI generativa non è più solo una questione di algoritmi: è geopolitica, linguaggi, ecosistemi di sviluppo, e ovviamente, business. Vedremo se Qwen VLo sarà solo un altro nome nella lista o la chiave per una nuova frontiera dell’AI visiva. Nel frattempo, provate a chiedergli di mettere un cappello al gatto: la sfida è lanciata.