Microsoft lancia i suoi modelli AI: MAI-Voice-1 e MAI-1-preview, la sfida diretta a OpenAI e Google ha inizio

Per lungo tempo Microsoft ha costruito la sua strategia basata sull’intelligenza artificiale appoggiandosi a partner esterni, in primis OpenAI, con cui ha stretto una collaborazione esclusiva integrando modelli come GPT in Azure e Copilot. Ora, però, l’azienda di Redmond compie un passo decisivo verso l’autonomia con il lancio dei suoi primi modelli AI di fascia alta: MAI-Voice-1 e MAI-1-preview.

La mossa segna il debutto ufficiale della nuova divisione Microsoft AI (MAI), guidata da Mustafa Suleyman, già cofondatore di DeepMind e in seguito di Inflection AI. L’azienda di Redmond fa il suo ingresso nell’arena dei grandi modelli linguistici e multimodali, ponendosi in competizione diretta non solo con OpenAI ma anche con colossi come Google, Anthropic, xAI e Mistral.

MAI-Voice-1: un modello vocale ad alte prestazioni

Il primo modello appena presentato si chiama appunto MAI-Voice-1 ed è costruito su una rete neurale per la generazione di parlato naturale ed espressivo. Secondo Microsoft si tratta di uno dei sistemi di sintesi vocale più efficienti disponibili oggi.

È infatti in grado di generare un minuto di audio in meno di un secondo su una singola GPU, supporta scenari single-speaker e multi-speaker con alta fedeltà e intonazione naturale. È inoltre già integrato in Copilot Daily e Copilot Podcasts, oltre ad essere disponibile in versione sperimentale su Copilot Labs. Qui gli utenti possono testare funzioni di narrazione interattiva o applicazioni creative come meditazioni guidate e storytelling dinamico.

Con MAI-Voice-1 Microsoft intende consolidare la voce come interfaccia privilegiata per gli assistenti AI, puntando su esperienze fluide e personalizzate.

MAI-1-preview: il foundation model di nuova generazione

Il secondo modello, MAI-1-preview, è il primo grande foundation model proprietario sviluppato end-to-end da Microsoft. Si tratta di un modello Mixture-of-Experts (MoE), allenato e ottimizzato con circa 15.000 GPU NVIDIA H100, una quantità molto inferiore rispetto ai 100.000 chip utilizzati da xAI per Grok, a dimostrazione dell’attenzione di MAI all’efficienza dei processi di training.

Gli ingegneri di Redmond evidenziano che MAI-1-preview è addestrato con tecniche avanzate, è progettato per eccellere nelle attività che presuppongono l’attenersi a una serie di istruzioni e nel fornire risposte contestuali e utili in scenari quotidiani.

È in fase di test pubblico su LMArena, una nota piattaforma di benchmarking aperta, e sarà progressivamente integrato in Copilot per arricchire l’esperienza degli utenti di Windows e Microsoft 365.

L’obiettivo dichiarato è costruire una gamma di modelli specializzati che, orchestrati insieme, possano servire diversi intenti e casi d’uso, massimizzando il valore per utenti e aziende.

Efficienza e sostenibilità: la nuova frontiera dell’AI

Uno dei temi centrali della strategia MAI è la riduzione dei costi computazionali. Nel mercato attuale, caratterizzato da una corsa agli hyperscaler e da investimenti miliardari nei data center, l’efficienza dei modelli AI è un vantaggio competitivo cruciale.

Suleyman ha sottolineato che “l’arte del training oggi consiste nello scegliere i dati giusti e nel non sprecare potenza di calcolo su token irrilevanti”. Questo approccio non solo rende i modelli più accessibili, ma consente di scalare in modo sostenibile, soprattutto in vista dell’arrivo delle nuove GPU NVIDIA GB200, già in fase di implementazione nei cluster di Microsoft.

Secondo Suleyman, Microsoft AI dispone di una roadmap quinquennale, con investimenti continui e progressivi. Il focus non è soltanto sulla creazione di modelli generalisti, ma anche sull’orchestrazione di sistemi ibridi, in grado di combinare modelli proprietari, contributi open source e tecnologie di partner strategici (inclusa OpenAI).

Il delicato equilibrio con OpenAI

Il lancio di MAI rappresenta anche un punto critico nelle relazioni tra Microsoft e OpenAI. L’accordo tra le due aziende prevedeva infatti l’esclusiva per l’utilizzo dei modelli OpenAI su Azure. Ora, con lo sviluppo di modelli proprietari, Microsoft si pone in una posizione potenzialmente competitiva rispetto al suo partner principale.

Suleyman ha però minimizzato il rischio di conflitti, dichiarando che la priorità resta quella di mantenere una collaborazione solida e duratura. Tuttavia, per molti analisti, la mossa di Redmond potrebbe ridefinire gli equilibri dell’ecosistema AI nei prossimi anni.