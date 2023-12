Anche Amazon si inserisce nell’agone dei generatori text-to-image presentando la sua nuova soluzione Titan Image Generator. Il modello lanciato da AWS non soltanto consente di creare immagini a partire da descrizioni testuali ma permette anche di modificare e ottimizzare quanto prodotto sulla base delle indicazioni dell’utente.

Il nuovo Titan Image Generator si inserisce nel “portafoglio” di soluzioni Amazon Bedrock. Quest’ultimo è un servizio completamente gestito, offerto da AWS, che fornisce una scelta di modelli ad alte prestazioni di importanti aziende impegnate nello sviluppo di piattaforme per l’intelligenza artificiale. I modelli integrati in Amazon Bedrock sono utilizzabili per creare e scalare facilmente applicazioni di IA che generano contenuti. Il tutto è fattibile servendosi di un’apposita API (Application Programming Interface), senza la necessità di gestire l’infrastruttura.

Obiettivo di Amazon Bedrock è democratizzare lo sviluppo di applicazioni che sfruttano l’IA generativa. Gli utenti possono infatti semplicemente caricare i loro dati per addestrare i modelli e personalizzarli secondo le rispettive necessità. Grazie a Bedrock è inoltre possibile creare degli agent in grado di eseguire compiti specifici a partire dai dati aziendali.

Come funziona la generazione di immagini con Titan Image Generator

Titan Image Generator aiuta a creare e perfezionare immagini usando prompt inviati in linguaggio naturale (al momento solo in inglese). Il modello permette quindi ad aziende attive nel campo della pubblicità, dell’e-commerce, dei media e dell’intrattenimento a creare immagini realistiche di alta qualità, in grandi volumi e a basso costo. Il sistema messo a punto da Amazon AWS può comprendere prompt complessi con oggetti multipli e generare immagini rilevanti.

Le funzionalità di modifica delle immagini dà modo di intervenire sui contenuti e sulla resa di ciascuna creatività, utilizzando sempre comandi ad alto livello di tipo testuale. I meccanismi di inpainting e outpainting, direttamente supportati da Titan Image Generator, permettono di manipolare le immagini in modo estremamente efficace.

L’inpainting si riferisce al processo di “riempimento” o riparazione di alcune parti dell’immagine; outpainting è il processo contrario, che estendere o aggiunge contenuto a un’immagine al di là dell’area occupata originariamente. Il modello di Amazon permette ad esempio di estendere o cambiare lo sfondo di un’immagine sulla base delle indicazioni fornite nel prompt di testo.

Come si vede nell’immagine, il modello generativo dapprima ha creato un’immagine seguendo pedissequamente le indicazioni dell’utente e poi ha sostituito la baita con il treno (esempio di inpainting).

Di seguito, Titan Image Generator applica il meccanismo di outpainting per conservare solo il treno rosso e cambiare lo sfondo da una montagna innevata a una foresta pluviale.

Gli ingegneri di Amazon aggiungono che è possibile personalizzare il modello con dati proprietari per generare immagini coerenti con le linee guida del brand o per generare immagini con uno stile specifico, ad esempio, proseguendo sulla strada imboccata durante una precedente campagna di marketing.

Utilizzo di agent per fornire consigli visuali e descrittivi

Come accennato in precedenza, Titan Image Generator può essere sfruttato per creare valore per gli utenti che si servono delle proprie applicazioni. Si può ad esempio chiedere all’intelligenza artificiale di fornire alcune immagini che ritraggono vari modelli di un oggetto (in figura si paragonano alcune tipologie di zaini) per poi chiedere maggiori dettagli su uno in particolare.

Come si vede nell’immagine seguente, Titan Image Generator si attiva per generare una descrizione puntuale dell’oggetto, utilizzabile per svariate finalità.

AWS ha anche presentato Amazon Titan Text Lite e Titan Text Express, LLM (Large Language Models) che supportano una vasta gamma di compiti relativi al testo, tra cui riassunti, traduzioni e chatbot conversazionali. Possono anche generare codice e sono ottimizzati per supportare linguaggi di programmazione popolari, oltre a formati come JSON e CSV.

I nuovi modelli di Amazon sono già utilizzabili dagli utenti in possesso dell’accesso alla piattaforma Bedrock. Alcuni esempi di codice sono disponibili in questo documento.

Credit immagine in apertura: iStock.com/Userba011d64_201