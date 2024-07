Del modello Gemini AI si parla spesso del modo in cui è destinato a cambiare il modo di utilizzare smartphone e tablet sia in termini di produttività che di svago. Ovviamente c’è molto di più, come testimoniato dall’ultimo video pubblicato su Instagram da Google DeepMind.

Il colosso di Mountain View sta utilizzando Gemini per addestrare i suoi robot e renderli ancora più efficienti nel completamento delle attività. Oltre alla clip (riportata di seguito), il team di robotica di Google ha condiviso anche un documento di ricerca nel quale si spiega come l’utilizzo di una lunga finestra di contesto di Gemini 1.5 Pro possa tradursi in una migliore interazione con i robot R2-T utilizzando istruzioni in un linguaggio naturale.

Tutto inizia con un tour visivo di un’area designata, come un appartamento o un ufficio, da parte del robot, affinché possa imparare a conoscerlo. Dopo aver studiato l’ambiente, il robot può eseguire comandi in base a ciò che ha osservato in precedenza utilizzando output verbali e/o visivi, come indicare ad un utente una presa di corrente per ricaricare lo smartphone.

In base a quanto dichiarato da DeepMind, il robot alimentato da Gemini 1.5 Pro ha avuto nei test un tasso di successo del 90% in oltre 50 istruzioni fornite in un’area molto ampia (oltre 800 metri quadrati).

I robot, poi, potranno svolgere anche altro e non limitarsi alla semplice navigazione. Nell’esempio riportato nel documento di ricerca, un utente con molte lattine di Coca-Cola sulla sua scrivania chiede al droide se la sua bevanda preferita è disponibile. Ebbene, il team ha scoperto che Gemini sa che in quella circostanza, dopo quella precisa richiesta, il droide dovrebbe dirigersi verso il frigorifero, controllare se ci sono altre lattine di Coca-Cola e infine tornare dall’utente per riferire il risultato.

Il droide richiede dai 10 ai 30 secondi per elaborare le istruzione, ma questo nulla toglie alle dimostrazioni di Google, che sono davvero sorprendenti.

Immagine di copertina realizzata con Microsoft Designer