Claude 3 Haiku, Sonnet e Opus: le differenze tra i nuovi modelli di intelligenza artificiale

Anthropic, società formata da tanti ex dipendenti OpenAI, mostra il balzo in avanti compiuto dai modelli generativi Claude 3 rispetto ai principali concorrenti.

La battaglia tra i migliori modelli generativi per le applicazioni di intelligenza artificiale entra sempre più nel vivo. Anthropic ha annunciato oggi la famiglia di modelli Claude 3, grazie ai quali mira a stabilire nuovi standard di riferimento per i “compiti cognitivi” più complessi e articolati.

Anthropic è la startup italo-americana che accoglie sotto la sua ala diverse figure fuoriuscite da OpenAI. Fondata nel 2020 da Dario Amodei, ex vice presidente della ricerca presso OpenAI, insieme a sua sorella Daniela Amodei, l’azienda si è distinta per il lancio di Claude, modello progettato per competere con i concorrenti di prim’ordine. L’attività dell’azienda ha attirato l’interesse di investitori di spicco come Google e Amazon, con round di finanziamento che hanno raggiunto i 450 milioni di dollari.

I modelli Claude di Anthropic non sono ancora fruibili dall’Italia ma è possibile provarli (come spieghiamo più avanti), usando NordVPN.

Le differenze tra i nuovi modelli Claude 3 Haiku, Sonnet e Opus

Il 4 marzo 2024, Anthropic ha annunciato la disponibilità di tre versioni di Claude 3: Haiku, Sonnet e Opus. Sono indicate in ordine di prestazioni crescenti: questo significa che ogni modello è capace di offrire performance migliori, consentendo agli utenti di selezionare l’equilibrio ottimale tra abilità in fatto di intelligenza artificiale, velocità e costo per la propria applicazione specifica.

Opus, il modello più intelligente della sua famiglia, secondo Anthropic supera i suoi concorrenti in molti dei comuni benchmark. Questi includono la conoscenza esperta a livello universitario (MMLU), lo sviluppo di ragionamenti a livello di laurea (GPQA), la matematica di base (GSM8K) e altro ancora. Opus mostra livelli di comprensione e fluidità vicini a quelli umani su compiti complessi, aprendo la strada ad applicazioni capaci di fornire risultati sempre più vicini a quelli attesi.

Prestazioni Claude 3: ecco i benchmark

Risultati quasi istantanei con i modelli Claude 3

I modelli Claude 3 possono essere utilizzati per gestire un ampio spettro di campi applicativi. Si possono ovviamente allestire chatbot per dialogare con i clienti, strumenti in grado di completare automaticamente delle richieste, impostare l’estrazione di informazioni utili da grosse moli di dati ricevendo risposte immediate e in tempo reale.

Haiku è presentato come il modello più veloce e conveniente sul mercato: basti pensare che può leggere un articolo di ricerca pubblicato su arXiv, denso di informazioni e dati (~10.000 token), con grafici e tabelle in meno di tre secondi. Anthropic osserva che c’è ancora margine per migliorare le prestazioni.

Per la maggior parte dei carichi di lavoro, Sonnet – il modello “intermedio” – è 2 volte più veloce di Claude 2 e Claude 2.1, offrendo risultati nettamente migliori. Eccelle in compiti che richiedono risposte rapide.

Le elaborazioni multicanale aprono all’intelligenza artificiale

I modelli Claude 3 hanno capacità di visione sofisticate: possono elaborare una vasta gamma di formati visivi, tra cui foto, grafici, tabelle e diagrammi tecnici. Questa nuova modalità operativa risulta particolarmente interessante per i clienti aziendali, alcuni dei quali hanno fino al 50% dei loro dati conservati in formati come PDF, presentazioni e documenti strutturati con layout complessi.

Gli sviluppatori di Anthropic tendono inoltre a sottolineare che, rispetto alle generazioni precedenti, i modelli Claude 3 riducono il numero di occasioni in cui si rifiutano di rispondere alle domande degli utenti. Un comportamento, questo, che di solito è sintomo di una mancanza di comprensione contestuale.

Finestra contestuale immensa

Parlando di modelli generativi, la finestra contestuale, o context window, si riferisce alla quantità di informazioni fornite al modello per generare ciascuna risposta. Si tratta delle informazioni che il modello esamina per comprendere il contesto della domanda o dell’input.

Una finestra contestuale più ampia consente al modello di considerare una maggiore quantità di parole o token nella sequenza di input. Un aspetto decisamente utile quando si trattano conversazioni complesse o domande che richiedono una comprensione approfondita del contesto.

Nel caso dei nuovi modelli Claude 3 di Anthropic, la finestra contestuale iniziale ha dimensioni pari a ben 200.000 token. Questo significa che il modello considera gli ultimi 200.000 token dell’input per generare la risposta. Inoltre, i modelli sono capaci di gestire input superiori a 1 milione di token per quegli utenti selezionati che richiedono un’elaborazione ancora più pesante e articolata.

Progettazione responsabile

Secondo Anthropic, la progettazione e la messa a terra di modelli come Claude 3 ha impegnato e continua a coinvolgere diversi team tecnici che si occupano di monitorare e mitigare un’ampia gamma di rischi. L’obiettivo è mettere nelle mani di aziende, professionisti e utenti finali, modelli di IA che riducano al minimo potenziali rischi migliorando al tempo stesso aspetti come la trasparenza e la sicurezza.

Come provare Claude 3

Anthropic offre la possibilità, sin da oggi, di iniziare a usare i nuovi modelli Claude 3: basta visitare la home page del sito, fare clic su Try Claude quindi effettuare il login tramite un account email (previa registrazione) o un account Google mediante autenticazione OAuth. Ovviamente, sono disponibile anche le API (Application Programming Interface), utili per integrare i modelli Claude 3 con i propri progetti.

Purtroppo Claude non è ancora direttamente utilizzabile dall’Italia ma è possibile sottoscrivere un piano VPN per accedere da un altro Paese ed essere così tra i primi a utilizzare i nuovi modelli.

Questo articolo contiene link di affiliazione: acquisti o ordini effettuati tramite tali link permetteranno al nostro sito di ricevere una commissione nel rispetto del codice etico. Le offerte potrebbero subire variazioni di prezzo dopo la pubblicazione.

Ti consigliamo anche

Link copiato negli appunti