Claude Mythos: ecco l'AI concorrente dalla Cina per individuare bug di sicurezza

Aggiungi IlSoftware.it come Fonte preferita su Google

La ricerca automatica delle vulnerabilità software è diventata uno dei fronti più caldi dell’Intelligenza Artificiale applicata alla sicurezza informatica.

I modelli linguistici di ultima generazione non si limitano più a generare codice o rispondere a domande complesse: oggi analizzano milioni di righe sorgente, riconoscono pattern pericolosi e suggeriscono correzioni prima che un difetto diventi una falla sfruttabile.

In questo scenario, i laboratori cinesi stanno accelerando con modelli specializzati. Tra gli esempi più recenti figura GLM-5.2, sviluppato da Z.ai, che secondo valutazioni indipendenti citate dal Wall Street Journal mostra risultati molto vicini a quelli di Mythos, il modello sperimentale di Anthropic dedicato alla cybersecurity.

GLM-5.2 e Mythos: il confronto sulla cybersecurity

Secondo i ricercatori citati dal Wall Street Journal, GLM-5.2 raggiunge prestazioni comparabili a Mythos nell’identificazione delle vulnerabilità software. Il dato non segnala un sorpasso generale dei laboratori cinesi nel campo dell’AI, ma indica un progresso concreto in una disciplina altamente specializzata e strategicamente sensibile.

Nelle attività di ragionamento generale, pianificazione complessa e comprensione multidisciplinare, GLM-5.2 mantiene ancora prestazioni inferiori rispetto alle soluzioni di Anthropic e OpenAI. L’ottimizzazione verso specifici scenari di sicurezza informatica rappresenta però un risultato tecnico rilevante: il modello dimostra una notevole efficienza nell’analisi del codice, in tempi compatibili con i cicli di sviluppo moderni.

Un elemento che distingue GLM-5.2 è la distribuzione come modello open-weight. Le organizzazioni possono scaricare i pesi, installarlo su infrastrutture locali ed eseguirlo senza dipendere da servizi cloud esterni, un vantaggio concreto in ambienti soggetti a requisiti di riservatezza o conformità normativa. La stessa apertura, tuttavia, introduce criticità: un modello capace di individuare vulnerabilità può essere usato anche per automatizzare la ricerca di punti deboli da sfruttare in operazioni offensive.

La corsa AI alla cybersecurity è globale

Negli ultimi mesi diversi laboratori cinesi hanno ridotto rapidamente il divario con i principali sviluppatori statunitensi in ambiti tecnici specifici. Parallelamente, aziende come Anthropic e OpenAI hanno adottato politiche più restrittive per l’accesso ai modelli di frontiera, soprattutto nei casi in cui potrebbero facilitare attività offensive o l’individuazione di vulnerabilità critiche in infrastrutture sensibili.

I benchmark rappresentano uno strumento utile per confrontare i modelli, ma non descrivono completamente le prestazioni operative. Nei test dedicati alla sicurezza vengono misurate capacità come il riconoscimento di vulnerabilità note, la generazione di exploit controllati e la proposta di patch correttive. Prestazioni elevate in questi scenari non garantiscono risultati equivalenti durante l’analisi di grandi basi di codice aziendali, dove architetture complesse e contesti applicativi specifici richiedono una comprensione più profonda.

Per le aziende il vantaggio non consiste soltanto nell’individuare più vulnerabilità, ma nel farlo integrando l’AI nelle piattaforme di DevSecOps, nei processi di revisione del codice e nelle verifiche continue della sicurezza. L’arrivo di modelli come GLM-5.2 conferma che la competizione AI applicata alla cybersecurity ha raggiunto una fase di accelerazione che coinvolge ormai tutti i principali attori del mercato globale.

Claude Mythos: ecco l'AI concorrente dalla Cina per individuare bug di sicurezza

GLM-5.2 e Mythos: il confronto sulla cybersecurity

La corsa AI alla cybersecurity è globale

Ti consigliamo anche

Odysseus: il "gemello" open source di ChatGPT per uso locale

Anthropic accusa Alibaba: avrebbe copiato Claude con milioni di query

OpenAI lancia un'anteprima di GPT-5.6 accessibile a pochi

Casa Bianca chiede a OpenAI di rallentare il rilascio del suo nuovo modello AI?