Poche ore fa Google ha presentato un nuovo strumento per generare immagini tramite l’Intelligenza Artificiale chiamato Whisk.

La caratteristica unica di questa piattaforma sta nel fatto che, per creare contenuti, non si basa solo sugli input testuali. Whisk è in grado di combinare tra loro più immagini, creando una sorta di remix, con risultati che appaiono più che convincenti.

A livello pratico, l’utente può fornire indicazioni per quanto riguarda soggetto, scena e stile. Caricando immagini per ogni aspetto, l’AI unisce tutti gli input forniti, elaborando un risultato. Processo e risultati sono stati mostrati da Google, attraverso X e il suo canale ufficiale YouTube.

Meet Whisk! 🎉 Our new experiment that lets you use images as prompts to visualize your ideas and tell your story. Try it now: https://t.co/BR1z7gmDs6 pic.twitter.com/2zrPLQZlga — labs.google (@labsdotgoogle) December 16, 2024

Whisk si appoggia a Gemini e Imagen 3 per combinare tra loro più elementi

Aspetto ancora più interessante è che l’utente può intervenire nuovamente sulla creazione di Whisk. Ciò è possibile tramite la funzione Refine (ovvero “Raffina“). Risulta dunque possibile modificare l’opera dell’AI, fornendo alla stessa delle indicazioni tramite prompt testuale.

Come spiegato da Jason Balridge di Google, Whisk si appoggia a Gemini per interpretare e gestire il testo, agendo poi con Imagen 3 per generare le immagini.

Whisk is a really fun and compelling new way to prompt our Imagen 3 model. You upload images that have subject, scene or style of interest, and then it composes these together to generate a new image based on these elements. Less wordsmithing, and fun results! https://t.co/0obgoTy7Zw — Jason Baldridge (@jasonbaldridge) December 16, 2024

Questi ultimi giorni sono stati senza ombra di dubbio movimentati per Google, che ha confermato il suo desiderio di coprire un ruolo importante nel settore dell’AI presentando anche Veo 2, strumento che permette di generare video evitando allucinazioni e offrendo filmati più lunghi rispetto a tante altre soluzioni presenti sul mercato.