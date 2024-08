Dopo una lunga pausa, iniziata nel mese di febbraio, Gemini torna finalmente a generare immagini di esseri umani.

L’Intelligenza Artificiale di Google aveva generato non poche polemiche a causa di creazioni “forzate” sotto il punto di vista razziale. Per esempio, chiedendo la generazione di un’immagine con una tipica coppia scozzese del 1850, venivano mostrati nativi americani, asiatici e altre etnie che nulla avevano a che fare con quel preciso contesto storico-geografico.

L’azienda di Mountain View, attraverso il suo blog ufficiale, lo scorso maggio aveva fatto sapere che aveva intenzione di permettere nuovamente a Imagen 3 di generare immagini di esseri umani, facendo però riferimento a un’implementazione imminente, ovvero specificando nei “prossimi giorni“. L’attesa si è poi rivelata molto più lunga del previsto.

Una versione di Imagen che permette questo tipo di output è finalmente disponibile al pubblico, accessibile tramite abbonamento gratuito a patto di avere un account Google.

Gemini permette la generazione immagini di esseri umani realistiche, ma presenta anche alcuni problemi

Il nuovo modello IA sebbene sia in grado di generare immagini con persone, è dotata di alcuni strumenti per evitare abusi. Come specificato da Google, Imagen non supporta la generazione di individui fotorealistici e identificabili nella realtà. Inoltre vengono bloccate rappresentazioni cruente, con minori o di natura sessuale.

Non solo. Test alla mano, l’IA evita rappresentazioni storicamente inaccurate quando richiesto, mantenendo una certa coerenza storica. Nonostante ciò, sotto alcuni punti di vista le rappresentazioni storiche sembrano avere più limiti rispetto al passato. Se una volta chiedere illustrazioni di un soldato tedesco del 1943 portava alla creazione di soggetti asiatiche o di colore, oggi l’IA si rifiuta del tutto di generare un’immagine.

Secondo i test portati avanti dal sito di Ars Technica questo non è un caso isolato. Prompt che richiedono la generazione di “antichi filosofi cinesi“, “leader del suffragio femminile che tiene un discorso” e “un gruppo di manifestanti non violenti” comporta dei poco comprensibili blocchi da parte dell’IA. Google, in ogni caso, ha affermato come stia lavorando su questo aspetto tenendo in grande considerazione i feedback degli utenti.