GPT-4: cosa c'è da sapere sul nuovo modello generativo di OpenAI

OpenAI presenta il nuovo modello GPT-4: già integrato in ChatGPT e in Bing Chat, si apre ora all'utilizzo da parte di aziende e sviluppatori indipendenti.

Dopo il successo sconfinato ottenuto con ChatGPT e con le API OpenAI, la società in prima linea nello sviluppo di modelli generativi basati sull’intelligenza artificiale, ha presentato l’atteso GPT-4 (Generative Pre-trained Transformer di quarta generazione).

GPT-4 è il nuovo modello multimodale (accetta in input immagini e testo producendo in risposta del testo) sviluppato da OpenAI basato su una rete neurale profonda con 1 trilione di parametri, valore che lo rende il modello generativo più esteso e potente mai creato. Viene inoltre portata al debutto la nuova architettura Transformer-XL che permette di gestire sequenze più lunghe e complesse.

A partire da poche parole o immagini fornite dall’utente, GPT-4 è in grado di generare testi coerenti e convincenti su qualsiasi argomento. Il modello è anche in grado di rispondere a domande, scrivere codice, comporre email, creare presentazioni e molto altro ancora.

GPT-4 è il risultato di anni di ricerca e sviluppo da parte di OpenAI, una organizzazione senza scopo di lucro fondata nel 2015, e rappresenta l’evoluzione del modello generativo fino ad oggi utilizzato in ChatGPT come in altri prodotti.
OpenAI conferma che GPT-4 è stato già integrato, a partire da marzo 2023, proprio in ChatGPT oltre che in Bing Chat, quindi nel motore di ricerca Microsoft. Lo conferma la stessa azienda di Redmond.

OpenAI sostiene che GPT-4 mostra un comportamento molto simile a quello che terrebbe un umano su vari benchmark professionali e accademici. Vengono citati GLUE (General Language Understanding Evaluation), SuperGLUE (una versione più complessa di GLUE), SQuAD (Stanford Question Answering Dataset), ImageNet (un dataset di classificazione delle immagini) e COCO (un dataset di riconoscimento degli oggetti nelle immagini).
Tutti questi benchmark misurano le capacità linguistiche e visive del modello come la comprensione del contesto, la logica, l’inferenza, la generazione di contenuti, la traduzione e la descrizione delle immagini.

Ovviamente, così come i predecessori, GPT-4 non è perfetto né “onnisciente”: il modello è meno capace in molti scenari reali. Si pensi ad esempio alla conversazione emotiva, alla creatività artistica, ai ragionamenti morali, all’apprendimento da pochi esempi.
Può inoltre produrre errori a causa della sua mancanza di “conoscenza” del mondo reale o della sua tendenza a ripetere informazioni false o fuorvianti pubblicate sul Web. Come abbiamo visto nell’articolo citato in apertura e negli approfondimenti su come creare il proprio ChatGPT, abbiamo visto che le varie iterazioni di GPT si basano su un modello probabilistico che prevede quali termini è verosimile aggiungere al testo fornito in input dall’utente. Il cosiddetto sampling o campionamento permette di introdurre un po’ di stocasticità (casualità) quindi di generare frasi diverse per lo stesso input aumentando contemporaneamente la qualità dell’output. Lo abbiamo visto nell’articolo su come creare un modello generativo con 60 righe di codice.

Anche GPT-4, inoltre, non ha alcuna contezza degli eventi successivi al mese di settembre 2021: ciò può causare incongruenze temporali o storiche nei contenuti via via generati.
Si tratta anche di una precisa scelta degli sviluppatori: GPT-4 presenta anche delle sfide etiche e sociali.
OpenAI riconosce che il suo modello può generare contenuti falsi o potenzialmente dannosi come fake news o hate speech: per questo motivo sono state adottate diverse misure per mitigare i rischi associati a GPT-4.
Limitare la “conoscenza” del modello agli eventi avvenuti prima del settembre 2021 evita che strumenti come ChatGPT e derivati possano essere utilizzati per influenzare le elezioni o diffondere disinformazione sulle emergenze sanitarie.
L’utilizzo dell’API pubblica viene inoltre monitorato in modo più puntuale in modo da rilevare e bloccare le richieste sospette o dannose. Infine, OpenAI ha creato un comitato etico indipendente per supervisionare lo sviluppo e l’implementazione di GPT-4 garantendo il rispetto dei principi morali e legali.

ChatGPT Plus e accesso alle API di GPT-4

Gli abbonati al piano a pagamento ChatGPT Plus otterranno l’accesso a GPT-4 chat.openai.com seppur con alcuni limiti di utilizzo, almeno nella fase iniziale, dovuti al carico di lavoro ancora più impegnativo che deve essere gestito lato server.

OpenAI potrebbe presentare nuovi modelli a pagamento per l’utilizzo di ChatGPT capaci di assicurare volumi di traffico più elevati con un certo livello prestazionale.

La società ha inoltre aperto la lista di attesa per l’accesso alle API GPT-4 dando massima priorità a scienziati, ricercatori e studiosi.

Una volta ottenuto l’accesso, è possibile interagire con il modello a un prezzo variabile a seconda del numero di token da elaborare.
Un token può essere pensato come un insieme di “pezzi di parole” usati per l’elaborazione del linguaggio naturale. Per il testo in inglese, 1 token equivale a circa 4 caratteri o 0,75 parole.

Nel frattempo, gli autori di Duolingo Max, applicazione che guida gli utenti nell’apprendimento delle lingue, fanno presente di essere una delle prime soluzioni software al mondo a utilizzare GPT-4.

Ti consigliamo anche

Link copiato negli appunti