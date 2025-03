Un set di dati trapelato online ha rivelato che il governo cinese sta sviluppando un sistema di censura avanzato basato su large scale language models (LLM).

L’obiettivo di questo piano è quello di oscurare alcuni argomenti, spaziando dai fatti di Piazza Tienanmen fino a Taiwan, andando anche a insabbiare argomenti come la corruzione tra le forze dell’ordine del paese e all’interno del Partito Comunista.

Questo è quanto scoperto dal ricercatore di sicurezza NetAskari, che ha ottenuto accesso a un set di dati di LLM cinesi. Il pacchetto, che include circa 300 GB di informazioni, è stato individuato in un database non protetto sui server Baidu.

La Cina schiera l’Intelligenza Artificiale in prima linea per rafforzare la censura

Secondo quanto affermato dagli esperti, il database presentava 133.000 voci e aveva riferimenti a “eb35” e “eb_speedpro“. Ciò sembra significare che i dati riguardano chatbot AI di Baidu ed Ernie Bot.

Stando a quanto sostenuto da NetAskari, il set può essere utilizzato per addestrare sistemi AI avanzati, utili per segnalare in modo automatico la presenza di contenuti ritenuti sensibili dal governo del paese asiatico. Nell’ampio pacchetto di dati, sembra che la parola “Taiwan” sia particolarmente a cuore al Partito Comunista cinese, visto che viene menzionata più di 15.000 volte.

Per gli esperti, il set sembra appositamente creato per attuare una manipolazione dell’opinione pubblica, direttamente gestita dalla Cyberspace Administration of China (CAC). D’altro canto non è la prima volta che il governo cinese ha dimostrato come considerare Internet essenziale per tenere sotto controllo l’opinione della popolazione.

A rendere il tutto ancora più inquietante vi è il fatto che l’AI cinese sta vivendo grande popolarità anche al di fuori dei confini nazionali, con il boom di DeepSeek e altri progetti significativi a livello globale.