Gemini 2.5 Flash Image, noto anche come “Nano Banana”, rappresenta un significativo avanzamento nell’evoluzione dei modelli generativi di immagini. Il nuovo modello nativo multimodale Google integra la generazione e l’editing delle immagini in un unico flusso di lavoro, superando la necessità di passaggi separati e offrendo una maggiore coerenza e controllo creativo.

A differenza dei modelli precedenti, che trattavano testo e immagini come entità separate, Gemini 2.5 Flash Image è progettato per elaborare simultaneamente testo e immagini. Questa architettura consente una comprensione più profonda e coerente dei prompt complessi, migliorando la qualità e la pertinenza delle immagini generate.

Potete provare subito Gemini 2.5 Flash Image su AI Studio, previo login con un account Google.

Generazione ed editing avanzato delle immagini

Gli utenti possono modificare immagini esistenti utilizzando semplici comandi in linguaggio naturale, come rimuovere oggetti indesiderati, cambiare colori o aggiungere elementi specifici. Gemini 2.5 Flash Image mantiene le caratteristiche distintive di personaggi od oggetti anche quando inseriti in nuovi contesti, superando i limiti dei modelli precedenti.

Il modello made-in-Mountain View consente anche di combinare più immagini in una composizione coerente, creando scene complesse o sostituendo sfondi senza compromettere la qualità visiva.

Integrando meccanismi di “conoscenza contestuale“, Gemini 2.5 Flash Image interpreta prompt che richiedono comprensione di scene o diagrammi, rendendolo utile anche in contesti educativi e professionali.

Rispetto ai concorrenti, Gemini 2.5 Flash Image offre tempi di risposta più rapidi, con accesso tramite Google AI Studio, Vertex AI e API Gemini, con tariffe trasparenti e competitive. Infine, la compatibilità con Adobe Firefly ed Express permette di generare e modificare contenuti visivi all’interno dei flussi di lavoro esistenti, espandendo le applicazioni nel design e nel marketing.

Awesome-Nano-Banana Images: una galleria ispirazionale

Il progetto Awesome-Nano-Banana-images, pubblicato su GitHub, offre una galleria curata di immagini generate e prompt creativi, mostrando le potenzialità illimitate di Gemini 2.5 Flash Image in diversi scenari di utilizzo.

La raccolta aiuta a comprendere meglio le capacità di multi-image fusion e creative editing di Nano Banana, permettendo a creativi e professionisti di esplorare scenari innovativi e ispirarsi ad esempi concreti.

Con prompt ben formulati, ad esempio incorporando molte direttive esplicite, richiedendo integrazione o seamless blending (fusione senza soluzione di continuità) tra elementi, il modello Google può sorprendere per velocità e costo contenuto, pur non potendo eccellere nei dettagli fini.

Rimangono ancora alcune anomalie ma nel complesso, come dimostra questo confronto indipendente tra modelli generativi, Gemini 2.5 Flash Image è davvero convincente. Il progetto GenAI Image Editing Showdown ha paragonato sette modelli all’avanguardia su una serie di sfide specifiche, evidenziando punti di forza, debolezze e peculiarità di ciascun approccio. L’obiettivo era testare modifiche complesse in un singolo passaggio, escludendo multi-prompting o correzioni successive.

Gemini 2.5 Flash Image emerge come un modello capace di integrare nuovi elementi con grande coerenza stilistica, mostrando ottime prestazioni nell’adattamento delle modifiche senza stravolgere l’immagine originale, anche se tende a richiedere più tentativi su compiti spaziali complessi.