L'intelligenza artificiale DALL-E genera immagini a partire dal testo

OpenAI è un’organizzazione senza scopo di lucro che è stata fondata nel 2015 da Elon Musk e Sam Altman con lo scopo di guidare la ricerca in materia di intelligenza artificiale e sviluppare soluzioni che possano essere utilizzate nel quotidiano. Tra gli investitori, il nome più altisonante è sicuramente quello di Microsoft che ha sviluppato un grande interesse sulle soluzioni basate su reti neurali e machine learning tanto che le mette direttamente a disposizione dei clienti attraverso la piattaforma cloud Azure.

Ad agosto 2022 abbiamo visto il funzionamento dell’algoritmo aperto Stable Diffusion che può essere utilizzato anche servendosi di apposite API di programmazione per generare immagini di qualità partendo da descrizioni di testo anche piuttosto articolate.
Dal momento che una parte essenziale del lavoro, oltre all’addestramento con coppie immagine-testo, consiste nella corretta interpretazione della semantica, l’algoritmo utilizza un solido modello linguistico chiamato BLOOM che è il risultato di 117 giorni di lavoro svolto a un supercomputer.

Sapevamo che anche OpenAI aveva partorito la sua intelligenza artificiale DALL-E per la generazione di immagini complesse a partire dal testo.
Da oggi, però, tutti possono provare DALL-E effettuando una nuova registrazione o procedendo al login con un account Microsoft o Google: la lista d’attesa è stata infatti eliminata.
Ogni utente riceve 50 crediti gratuiti per il primo mese e 15 crediti gratuiti ogni mese successivo. Ogni credito è valido per l’invio di una richiesta (descrizione dell’immagine da generare) che porta alla produzione di quattro immagini. È ovviamente possibile acquistare crediti aggiuntivi.
Già 1,5 milioni di utenti starebbero utilizzando DALL-E per creare composizioni artistiche in digitale e ogni giorno verrebbero create 2 milioni di immagini.

OpenAI ha preferito usare i proverbiali piedi di piombo prima di rilasciare pubblicamente DALL-E: il sistema è stato affinato per bloccare contenuti sconvenienti e impedire la generazione automatica di immagini che potrebbero essere fonte di problemi.
Restano comunque i classici problemi dei sistemi basati sull’intelligenza artificiali: poiché essi vengono addestrati usando vasti insiemi di immagini acquisite dalla rete Internet, l’imparzialità non è garantita. Anzi, non solo DALL-E ma qualunque altro sistema simile tende a replicare quelle disuguaglianze che permeano la nostra società.
DALL-E applica alcune correzioni “dietro le quinte” intervenendo sulla struttura della query ricevuta dall’utente ma ciò introduce alcune deviazioni rispetto alle istruzioni inviate che talvolta portano a un output insoddisfacente. Restano inoltre i classici problemi legati alla riproduzione dei volti di personaggi famosi: spesso non sono neanche lontanamente riconoscibili.

OpenAI ha aggiunto che sta testando un’API per consentire alle aziende di creare app e plug-in per usare l’intelligenza artificiale DALL-E.

L'intelligenza artificiale DALL-E genera immagini a partire dal testo

Ti consigliamo anche

Character.AI lancia TalkingMachines per i video interattivi in tempo reale

Uno studio scientifico conferma che troppa AI ci rende stupidi

ChatGPT, privacy a rischio: l'ordine del giudice impone la conservazione dei log, OpenAI senza via di fuga

FLUX.1 Kontext [dev]: AI open source per l'editing immagini potenziata da NVIDIA e pronta per le GPU consumer