Scrivere trascinando il dito sulla tastiera è diventato un gesto naturale per milioni di utenti Android.
Dietro quella semplicità si nasconde una combinazione complessa di modelli linguistici, algoritmi di riconoscimento dei movimenti e grandi quantità di dati. Per anni le migliori tecnologie di swipe typing sono rimaste legate a piattaforme proprietarie come Gboard e SwiftKey.
FUTO, organizzazione nota per il proprio impegno nel software orientato alla privacy, ha deciso di cambiare le cose pubblicando FUTO Swipe: un sistema aperto, progettato per funzionare interamente sul dispositivo senza dipendere da servizi cloud, che include modelli AI, dataset pubblici e una libreria software per gli sviluppatori.
Come funziona FUTO Swipe
Il sistema si basa su tre modelli distinti. Il primo è un Encoder indipendente dalla lingua e dal layout, che interpreta il percorso del dito sullo schermo. Il secondo è ContextLM, un piccolo modello linguistico che valuta le parole candidate in base al contesto della frase, riducendo i suggerimenti privi di senso. Il terzo è il Decoder, specializzato per lingua e disposizione dei tasti, responsabile della precisione finale del riconoscimento.
La combinazione dei tre modelli trasforma una traiettoria continua in una serie di parole plausibili. Durante l’inferenza il sistema applica inoltre una ricerca su dizionario tramite beam search, confrontando diverse interpretazioni possibili del gesto effettuato dall’utente.
Quanto alle dimensioni, l’encoder utilizza circa 635 mila parametri e il decoder poco più di 300 mila: valori molto inferiori rispetto ai modelli AI moderni, che consentono latenze dell’ordine dei millisecondi anche su smartphone economici. L’assenza di elaborazione remota elimina la necessità di trasmettere dati a infrastrutture esterne, un elemento che FUTO considera centrale per la tutela della privacy.
Secondo i risultati pubblicati dall’azienda, l’architettura raggiunge un tasso di errore inferiore all’1% escludendo i termini fuori vocabolario, con un top-4 fail rate di circa il 4%. I numeri dipendono dalle condizioni del test, ma le versioni più recenti della tastiera FUTO hanno ricevuto riscontri positivi da numerosi utenti che hanno segnalato miglioramenti significativi nell’accuratezza rispetto alle implementazioni precedenti.
Dataset aperto e libreria per sviluppatori
Nell’agosto 2024 FUTO ha avviato una campagna pubblica invitando gli utenti a contribuire con esempi di digitazione tramite swipe.
I partecipanti riproducevano frasi da smartphone su una pagina web dedicata, principalmente tratte da Wikipedia. Dopo il filtraggio, il progetto ha raggiunto oltre un milione di esempi utilizzabili, pubblicati nel marzo 2025 con licenza MIT. Si tratta di una raccolta rara nel settore, tradizionalmente dominato da soluzioni chiuse e dataset non accessibili.
Il progetto include anche una libreria in C++ che gestisce l’intero processo di inferenza e selezione delle parole candidate. Gli sviluppatori possono integrarla in applicazioni proprie senza implementare da zero gli algoritmi necessari. FUTO incoraggia l’adozione in progetti esterni, chiedendo semplicemente un’attribuzione visibile agli utenti finali, e ha già mostrato utilizzi sperimentali in ambienti VR e su trackpad per laptop.
Una sfida aperta ai giganti del settore
Il mercato delle tastiere virtuali è dominato da poche piattaforme che combinano algoritmi proprietari, raccolta dati massiva e integrazione cloud.
FUTO Swipe segue una strada diversa: modelli aperti, elaborazione locale, dataset pubblici. Il decoder più avanzato è attualmente ottimizzato per la configurazione QWERTY inglese, ma la struttura modulare è stata progettata per consentire future estensioni. Se la comunità contribuirà con nuovi dati e modelli, il progetto potrebbe diventare un riferimento concreto per le tecnologie di input mobile aperte e rispettose della privacy.