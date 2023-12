Google ha recentemente rilasciato un nuovo update per Gmail, che la stessa azienda definisce “uno dei più grandi aggiornamenti sulla sicurezza degli ultimi anni“. Si tratta di un nuovo sistema di classificazione del testo chiamato RETVec (Resilient & Efficient Text Vectorizer) e, secondo Google, può aiutare a rilevare contenuti potenzialmente dannosi come spam ed e-mail dannose in Gmail. In precedenza, le e-mail spam erano piene di caratteri speciali e riuscivano ad eludere la sicurezza di Gmail. Adesso, il sistema RETVec è in grado di rilevare manipolazioni a livello di carattere, come i già citati caratteri speciali, emoji, errori di battitura e altri caratteri spazzatura che in precedenza erano leggibili dagli esseri umani ma non erano facilmente comprensibili dalle macchine.

Gmail: come funziona il nuovo modello RETVec per la sicurezza

Il modello RETVec è addestrato su un nuovo codificatore di caratteri capace di codificare tutti i caratteri e le parole UTF-8 in modo efficiente. Pertanto, RETVec funziona immediatamente su oltre 100 lingue, senza la necessità di una tabella di ricerca o di dimensioni fisse del vocabolario. RETVec è open source e piuttosto leggero. Contando soltanto 200.000 parametri, richiede minori risorse di calcolo. Questo modello sembra inoltre funzionare in maniera molto simile al modo in cui leggono gli umani. Si tratta di un modello TensorFlow di apprendimento automatico che utilizza la “somiglianza visiva”per identificare il significato delle parole invece del contenuto effettivo dei caratteri. Il colosso high-tech ha inoltre affermato che rispetto al precedente modello di classificazione, il tasso di rilevamento dello spam è aumentato del 38% e i falsi positivi si sono ridotti del 19,4%. Infine, RETVec ha ridotto dell’83% l’utilizzo della TPU (unità di elaborazione Tensor) del modello.

Big G ha testato internamente il suo sistema di classificazione del testo nell’ultimo anno. Considerando i risultati eccellenti ottenuti da questo modello, ha quindi deciso di rilasciare RETVec ore a livello globale per tutti gli account Gmail.