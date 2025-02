Nella giornata di mercoledì, Microsoft Research ha presentato Magma, un modello AI capace di combinare elaborazione visiva e linguistica per controllare interfacce software e sistemi robotici.

Questo nuovo sistema potrebbe significare un passo avanti decisivo verso un’AI multimodale multiuso in grado di operare in modo interattivo sia in contesti reali che in quelli digitali.

Magma è un progetto che nasce dalla partnership che coinvolge ricercatori di Microsoft, KAIST, University of Maryland, University of Wisconsin-Madison e University of Washington.

Secondo quanto sostenuto da Microsoft, questo è il primo modello AI che non solo elabora dati come testo, immagini e video, ma che può anche agire in modo nativo sugli stessi. Di fatto, Magma dovrebbe poter navigare in un’interfaccia utente o manipolare oggetti fisici con uguale efficacia.

Microsoft e l’AI agentica: Magma potrebbe segnare una svolta per il settore

I progetti di modelli linguistici applicati sulla robotica non sono di certo una novità. Basti pensare a PALM-E e RT-2 di Google o ChatGPT for Robotics di Microsoft che utilizzano LLM come un’interfaccia. Nonostante ciò, a differenza di altri sistemi che richiedono modelli separati per percezione e controllo, Magma integra queste capacità in un singolo modello di base.

Questa nuova creazione di Microsoft potrebbe rappresentare un passo avanti considerevole nel contesto dell’AI agentica, ovvero sistemi in grado di elaborare autonomamente piani ed eseguire attività a più fasi.

Nonostante l’operato della compagnia di Redmond risulti importante in questo settore, non è di certo il primo colosso tecnologico a esplorare i confini dell’AI agentica.

OpenAI, per esempio, ha già sperimentato agenti AI attraverso progetti interessanti come Operator, in grado di eseguire attività tramite interfaccia utente in un browser Web. Anche Google, attraverso Gemini 2.0, sembra aver intenzione di dire la sua in questo settore così interessante e innovativo.