Per scrivere testi usando il riconoscimento vocale sui dispositivi Android, è sufficiente fare apparire la tastiera virtuale quindi toccare l’icona raffigurante un piccolo microfono. A seconda della tastiera scelta, tuttavia, l’audio dell’utente è generalmente trasferito su server remoti che si occupano di convertire il parlato in testo a scorrere (motore speech-to-text). Abbiamo visto cos’è una tastiera virtuale e a cosa prestare attenzione. Per dettare testi su Android senza trasferire altrove un singolo byte, si possono sfruttare strumenti come FUTO Keyboard.

FUTO Keyboard è un progetto innovativo in fase di sviluppo, nato da un fork della tastiera AOSP del sistema operativo Google. L’obiettivo principale è creare una tastiera altamente personalizzabile che non comprometta la privacy o le libertà dell’utente. In particolare, l’idea è evitare qualunque scambio di dati con qualsivoglia sistema remoto.

Come dettare testi su Android usando l’intelligenza artificiale

Poteva uno strumento di dettatura avanzato come FUTO Keyboard esimersi dall’utilizzare i modelli Transformer e, in generale, l’intelligenza artificiale (IA)? Certamente no. E infatti il software abbina ai modelli di lingua anche un meccanismo predittivo e di autocorrezione che sfrutta proprio l’IA.

Diversamente rispetto ad altre applicazioni, tuttavia, FUTO Keyboard lavora interamente in locale: questo significa che i modelli sono caricati ed eseguiti sui dispositivi mobili, senza bisogno di scomodare alcun tipo di elaborazione cloud. Sui dispositivi di fascia bassa, tuttavia, le prestazioni potrebbe non essere convincenti.

Input vocale integrato

FUTO Keyboard supporta l’input vocale integrato in Android, senza necessità di ricorrere ad app esterne. È possibile scaricare e importare diversi modelli diversi facendo riferimento a questa pagina. Il supporto dell’italiano deve ancora essere migliorato ma intanto è possibile avvalersi di una dettatura vocale in grado non solo di riconoscere la maggior parte dei termini ma anche di gestire correttamente la punteggiatura. Senza bisogno di declamare “punto” oppure “virgola” ad alta voce.

Tecnicamente è possibile importare qualsiasi modello compatibile con whisper.cpp, libreria che implementa modelli di riconoscimento vocale sviluppati inizialmente da OpenAI. Consente appunto di eseguire il riconoscimento vocale sui dispositivi locali (on-device), senza la necessità di inviare i dati vocali a server remoti, garantendo così una maggiore privacy e sicurezza.

Tuttavia, gli sviluppatori di FUTO Keyboard sottolineano che potrebbero presentarsi anomale ripetizioni di testo, a causa dell’uso estensivo del parametro audio_ctx , che richiede un’attività di fine tuning, come spiegato in questo documento di supporto.

Come installare e configurare FUTO Keyboard

Per installare FUTO Keyboard su Android, è possibile fare riferimento al Google Play Store oppure servirsi degli altri download.

Come primo passo, è necessario attivare FUTO Keyboard come input da tastiera nelle impostazioni di Android.

È quindi necessario cercare la sezione input da tastiera o Lingue e immissione e impostare FUTO Keyboard come tastiera virtuale corrente. Ancora, bisogna accedere alla sezione Permessi app di FUTO Keyboard e accordare all’applicazione il permesso di usare il microfono mentre l’app è in uso.

Barra delle azioni

A questo punto, aprendo una qualunque app Android che accetta l’immissione di testo, si può provare la nuova tastiera virtuale che – a sua volta – attiva il riconoscimento vocale basato sui modelli IA locali.

La barra dei suggerimenti sopra la tastiera mostra sulla sinistra una freccia che si espande per mostrare una serie di “icone di azione”. FUTO Keyboard consente di inserire emoji, aprire un editor di testo evoluto, accedere ai pulsanti per annullare, ripristinare e incollare. L’icona dell’ingranaggio consente di accedere alle impostazioni.

Importare un modello

Toccando Language & Models nelle impostazioni quindi sulla voce a destra del microfono, si può importare un modello vocale, scaricabile dalla pagina Web segnalata in precedenza. Il modello Multilingual-244 supporta più lingue, tra cui anche l’italiano anche se non è ottimizzato. Dalle impostazioni di FUTO Keyboard si può importare (Import) facilmente il modello .bin appena scaricato e iniziare subito a fare qualche prova.

Dopo aver aperto la tastiera virtuale, si può toccare l’icona del microfono presente in alto a destra e iniziare a parlare. Discorrendo normalmente e facendo delle pause, FUTO Keyboard è in grado di riconoscere il testo pronunciato, correggere eventuali imperfezioni e visualizzare la trascrizione nell’applicazione che si sta usando.

Alcune di queste azioni occupano l’intera finestra. In tal caso, puoi sollevare l’azione sopra la tastiera con la freccia in alto a destra. È anche possibile trascinare le azioni tenendo premuto e trascinando.

Nessun dato trasmesso da e verso server remoti

Come abbiamo osservato in precedenza, l’elaborazione del parlato avviene completamente in locale. Accedendo alle informazioni dell’app FUTO Keyboard dopo averla utilizzata per un po’, si noterà che l’utilizzo dei dati è e rimane fermo su 0 byte. Questo significa che l’applicazione non ha trasferito e non sta trasferendo alcun tipo di informazione verso server remoti, confermando ancora una volta che tutte le elaborazioni avvengono sempre e comunque in ambito locale.

Conclusioni

Sebbene FUTO Keyboard sia ancora ampiamente suscettibile di migliorie, l’applicazione rappresenta un importante passo avanti in fatto di tastiere virtuali rispettose della privacy e della riservatezza dei dati degli utenti. Questa soluzione gode inoltre di un ampio supporto da parte della comunità, grazie anche al fatto che il codice sorgente è pubblicato e aggiornato sul repository GitHub dedicato.

L’unico “neo” è la licenza: gli sviluppatori si sono inventati delle condizioni di loro sponte, senza invece abbracciare una licenza GPL-compatibile.

Da tenere d’occhio anche il progetto Transcribro. Nel momento in cui abbiamo provato l’applicazione, ci siamo accorti di un problema relativo al rilevamento del permesso di utilizzo del microfono con alcuni modelli di smartphone Android. Peccato perché le premesse sono davvero interessanti.

