Ad appena una settimana dell’annuncio di Gemini Ultra 1.0, Google ha sorpreso tutti con l’annuncio di Gemini Pro 1.5.

Se il primo modello di linguaggio IA, attivo dallo scorso giovedì, ha dimostrato potenzialità enormi, la sua evoluzione non è di certo da meno. Pe Google, infatti, Gemini 1.5 sarà in grado di lavorare come il suo predecessore, utilizzando però molte meno risorse per l’elaborazione dei dati.

Ciò è stato possibile grazie all’utilizzo di un’architettura Mixture-of-Experts (MoE) che vede l’impiego di più modelli IA a lavoro contemporaneamente. La filosofia MoE, al di là del lato prettamente prestazionale, consente anche di addestrare con maggiore facilità l’IA.

Il rapido lancio, però, sotto molti punti di vista ha poco senso. Ultra, infatti, è stato inglobato al servizio (a pagamento) Google One, catturando l’attenzione dei clienti. L’arrivo di un modello più evoluto, però, ha di certo reso meno appetibile la sottoscrizione di tale piattaforma, anche per una semplice percezione degli utenti.

Al netto di una mossa commerciale azzardata, Gemini 1.5 rappresenta una nuova generazione di LLM che può elaborare fino a 1 milione di token, con Google che specifica come ciò permette di “Raggiungere la finestra di contesto più lunga di qualsiasi modello di fondazione su larga scala finora“.

Gemini 1.5 si basa su un’architettura MoE per ottimizzare le proprie prestazioni

Quando si parla di token, si fa riferimenti a frammenti di una parola. Ciò, dunque, significa che il nuovo modello IA è in grado di affrontare anche testi molto lunghi, offrendo risposte pertinenti ed esaurienti. Per capire perché il colosso di Mountain View punta tanto sulla gestione dei token, basti capire che GPT-4 Turbo di OpenAI, al momento, può gestirne 128.000.

Un milione di token, secondo una stima approssimativa, potrebbe corrispondere a circa 700.000 parole. Durante la presentazione, Google ha affermato come il suo modello può eseguire “Ragionamenti complessi su grandi quantità di informazioni” facendo un esempio di analisi relativo a una trascrizione da 402 pagine della missione Apollo 11 sulla Luna.

Come è facile intuire, Gemini 1.5 non è al momento disponibile al pubblico, venendo offerto a titolo gratuito solo a sviluppatori e clienti aziendali attraverso AI Studio e Vertex AI di Google.

La compagnia, inoltre, ha avvertito i tester di possibili problemi come tempi di latenza prolungati a causa della natura embrionale del modello IA. Al momento non è nota una possibile finestra di lancio per il pubblico.