/https://www.ilsoftware.it/app/uploads/2025/06/wp_drafter_481556.jpg)
Un modello di Intelligenza Artificiale che funziona senza necessità di connessione a internet e si addestra con poche dimostrazioni? È questa la promessa di Gemini Robotics, la nuova frontiera tecnologica di Google DeepMind. Presentato al pubblico nella giornata di ieri, il sistema punta a rivoluzionare il settore della robotica avanzata con un approccio locale, privo di dipendenze dal cloud.
Alla base di questa innovazione troviamo il modello VLA, progettato per operare esclusivamente su GPU locali, in grado di eliminare la necessità di connessione a server remoti e garantendo risposte rapide e un’elaborazione dati in tempo reale. Questa caratteristica è cruciale per applicazioni che richiedono alta precisione, come la manipolazione di oggetti o l’interpretazione di comandi vocali.
Un altro punto di forza del sistema è la sua ottimizzazione per robot dotati di due braccia, capaci di operare con risorse di calcolo limitate. Inizialmente sviluppato per il braccio robotico proprietario di Google, ALOHA, il sistema è stato reso compatibile con altri dispositivi di terze parti, tra cui Franka Research 3 e Apollo. Questa compatibilità amplia le possibilità di adozione in diversi settori.
Gemini Robotics On-Device è fatto su misura per robot con due braccia
Durante le dimostrazioni, i robot equipaggiati con Gemini Robotics On-Device hanno eseguito compiti complessi come appendere strumenti su pareti o selezionare oggetti specifici da un insieme. Queste capacità dimostrano il livello avanzato di comprensione e manipolazione che il sistema può raggiungere.
Un aspetto particolarmente interessante è la personalizzazione del modello tramite fine-tuning. Con soli 50-100 esempi dimostrativi, gli sviluppatori possono adattare il sistema a nuovi scenari e compiti, rendendolo applicabile in settori come logistica, manifattura e sanità. Questa flessibilità lo rende una soluzione versatile per molteplici esigenze operative.
Per incentivare l’adozione della tecnologia, Google ha lanciato un kit di sviluppo completo, accessibile tramite lista d’attesa. Questo pacchetto include strumenti per la personalizzazione del modello e un simulatore fisico, MuJoCo, progettato per testare la destrezza bimanuale dei robot. MuJoCo, essendo open-source, permette agli sviluppatori di valutare le performance del sistema in un ambiente simulato prima di implementarlo nel mondo reale.
Con questa iniziativa, Google DeepMind si posiziona all’avanguardia nell’integrazione dell’AI nei sistemi robotici locali. Il risultato è una tecnologia più efficiente, accessibile e capace di adattarsi alle esigenze di sviluppatori e ricercatori.