La battaglia tra i migliori modelli generativi per le applicazioni di intelligenza artificiale entra sempre più nel vivo. Anthropic ha annunciato oggi la famiglia di modelli Claude 3, grazie ai quali mira a stabilire nuovi standard di riferimento per i “compiti cognitivi” più complessi e articolati.

Anthropic è la startup italo-americana che accoglie sotto la sua ala diverse figure fuoriuscite da OpenAI. Fondata nel 2020 da Dario Amodei, ex vice presidente della ricerca presso OpenAI, insieme a sua sorella Daniela Amodei, l’azienda si è distinta per il lancio di Claude, modello progettato per competere con i concorrenti di prim’ordine. L’attività dell’azienda ha attirato l’interesse di investitori di spicco come Google e Amazon, con round di finanziamento che hanno raggiunto i 450 milioni di dollari.

I modelli Claude di Anthropic non sono ancora fruibili dall’Italia ma è possibile provarli (come spieghiamo più avanti), usando NordVPN.

Le differenze tra i nuovi modelli Claude 3 Haiku, Sonnet e Opus

Il 4 marzo 2024, Anthropic ha annunciato la disponibilità di tre versioni di Claude 3: Haiku, Sonnet e Opus. Sono indicate in ordine di prestazioni crescenti: questo significa che ogni modello è capace di offrire performance migliori, consentendo agli utenti di selezionare l’equilibrio ottimale tra abilità in fatto di intelligenza artificiale, velocità e costo per la propria applicazione specifica.

Opus, il modello più intelligente della sua famiglia, secondo Anthropic supera i suoi concorrenti in molti dei comuni benchmark. Questi includono la conoscenza esperta a livello universitario (MMLU), lo sviluppo di ragionamenti a livello di laurea (GPQA), la matematica di base (GSM8K) e altro ancora. Opus mostra livelli di comprensione e fluidità vicini a quelli umani su compiti complessi, aprendo la strada ad applicazioni capaci di fornire risultati sempre più vicini a quelli attesi.

Risultati quasi istantanei con i modelli Claude 3

I modelli Claude 3 possono essere utilizzati per gestire un ampio spettro di campi applicativi. Si possono ovviamente allestire chatbot per dialogare con i clienti, strumenti in grado di completare automaticamente delle richieste, impostare l’estrazione di informazioni utili da grosse moli di dati ricevendo risposte immediate e in tempo reale.

Haiku è presentato come il modello più veloce e conveniente sul mercato: basti pensare che può leggere un articolo di ricerca pubblicato su arXiv, denso di informazioni e dati (~10.000 token), con grafici e tabelle in meno di tre secondi. Anthropic osserva che c’è ancora margine per migliorare le prestazioni.

Per la maggior parte dei carichi di lavoro, Sonnet – il modello “intermedio” – è 2 volte più veloce di Claude 2 e Claude 2.1, offrendo risultati nettamente migliori. Eccelle in compiti che richiedono risposte rapide.

Le elaborazioni multicanale aprono all’intelligenza artificiale

I modelli Claude 3 hanno capacità di visione sofisticate: possono elaborare una vasta gamma di formati visivi, tra cui foto, grafici, tabelle e diagrammi tecnici. Questa nuova modalità operativa risulta particolarmente interessante per i clienti aziendali, alcuni dei quali hanno fino al 50% dei loro dati conservati in formati come PDF, presentazioni e documenti strutturati con layout complessi.

Gli sviluppatori di Anthropic tendono inoltre a sottolineare che, rispetto alle generazioni precedenti, i modelli Claude 3 riducono il numero di occasioni in cui si rifiutano di rispondere alle domande degli utenti. Un comportamento, questo, che di solito è sintomo di una mancanza di comprensione contestuale.

Finestra contestuale immensa

Parlando di modelli generativi, la finestra contestuale, o context window, si riferisce alla quantità di informazioni fornite al modello per generare ciascuna risposta. Si tratta delle informazioni che il modello esamina per comprendere il contesto della domanda o dell’input.

Una finestra contestuale più ampia consente al modello di considerare una maggiore quantità di parole o token nella sequenza di input. Un aspetto decisamente utile quando si trattano conversazioni complesse o domande che richiedono una comprensione approfondita del contesto.

Nel caso dei nuovi modelli Claude 3 di Anthropic, la finestra contestuale iniziale ha dimensioni pari a ben 200.000 token. Questo significa che il modello considera gli ultimi 200.000 token dell’input per generare la risposta. Inoltre, i modelli sono capaci di gestire input superiori a 1 milione di token per quegli utenti selezionati che richiedono un’elaborazione ancora più pesante e articolata.

Progettazione responsabile

Secondo Anthropic, la progettazione e la messa a terra di modelli come Claude 3 ha impegnato e continua a coinvolgere diversi team tecnici che si occupano di monitorare e mitigare un’ampia gamma di rischi. L’obiettivo è mettere nelle mani di aziende, professionisti e utenti finali, modelli di IA che riducano al minimo potenziali rischi migliorando al tempo stesso aspetti come la trasparenza e la sicurezza.

Come provare Claude 3

Anthropic offre la possibilità, sin da oggi, di iniziare a usare i nuovi modelli Claude 3: basta visitare la home page del sito, fare clic su Try Claude quindi effettuare il login tramite un account email (previa registrazione) o un account Google mediante autenticazione OAuth. Ovviamente, sono disponibile anche le API (Application Programming Interface), utili per integrare i modelli Claude 3 con i propri progetti.

Purtroppo Claude non è ancora direttamente utilizzabile dall’Italia ma è possibile sottoscrivere un piano VPN per accedere da un altro Paese ed essere così tra i primi a utilizzare i nuovi modelli.