Dopo il clamoroso exploit di DeepSeek, le compagnie cinesi sembrano sempre più intenzionate a fare la voce grossa nel contesto dell’Intelligenza Artificiale.

Lo dimostra Alibaba che, attraverso il suo team Qwen, ha lanciato una nuova famiglia di modelli di intelligenza artificiale, ovvero Qwen2.5-VL. Questi si propongono come in grado di eseguire una serie di attività di analisi avanzata di testo e immagini.

Nello specifico, Qwen2.5-VL può analizzare file, comprendere video e contare oggetti nelle immagini. Se ciò non è un qualcosa di clamoroso, visto le potenzialità dei modelli AI in circolazione, quanto proposto da Alibaba ha altri assi nella manica: attraverso tale piattaforma, infatti, Qwen2.5-VL può agire in autonomia per quanto riguarda PC e smartphone.

Inoltre, quando si parla di test, il team Qwen dimostra di aver raggiunto risultati impressionanti. Secondo quanto sostenuto dai suoi creatori, benchmark alla mano, Qwen2.5-VL batte tutta la concorrenza (da GPT-4o a Claude 3.5 Sonnet fino a Gemini 2.0), per quanto concerne aspetti come comprensione video, matematica, analisi di documenti e risposte alle domande.

Alibaba e Qwen2.5-VL: dopo DeepSeek la Cina conquista il settore AI

Come già accennato, una delle peculiarità più interessanti di Qwen2.5-VL è la sua capacità di interagire con il software, sia su PC che su dispositivi mobile. A testimonianza di queste capacità vi è un filmato pubblicato su X da Philipp Schmid, responsabile tecnico di Hugging Face.

Don’t Miss @Alibaba_Qwen 2.5 VL! Despite all the Deepseek Hype, Qwen just dropped the best open Multimodal! Qwen 2.5 VL is a Vision Language Model that can control your computer, similar to the @OpenAI operator, extract structured information from charts, and more!! TL;DR;

3️⃣… pic.twitter.com/GeEGVdl0tI — Philipp Schmid (@_philschmid) January 27, 2025

Nonostante le enormi potenzialità, Qwen2.5-VL presenta anche diverse “zone d’ombra” che in molti casi ha in comune con DeepSeek. In primis, alcune analisi lasciano intravedere una politica non troppo trasparente per quanto concerne i dati utilizzati per l’addestramento, con potenziali violazioni di copyright. In seconda battuta, vi è sempre il problema riguardante la libertà di parola. Se si interroga Qwen2.5-VL rispetto al governo cinese e alle politiche attuate dallo stesso, l’AI presenta un messaggio di errore.

I modelli AI cinesi devono infatti sottostare a specifiche autorità di regolamentazione. Le stesse, controllano che i chatbot garantiscano risposte che “incarnino i valori socialisti fondamentali“.