Snowflake Arctic, il primo LLM davvero aperto destinato alle imprese

Snowflake presenta Arctic: cos'è e come funziona il primo LLM (Large Language Model) davvero aperto e con una licenza Apache 2.0 ultra permissiva, che non impone alcun tipo di restrizione. Progettato per essere efficiente e personalizzabile, Arctic consente di estrarre valore dai dati aziendali.

Snowflake aiuta ogni azienda a gestire ed estrarre valore dai propri dati grazie al Data Cloud. I clienti utilizzano il Data Cloud Snowflake per fare business intelligence sui dati che un tempo erano conservati in “contenitori” separati, che non potevano cioè essere correlati reciprocamente. Grazie alle soluzioni proposte da Snowflake, vi è la possibilità per qualsiasi realtà d’impresa di esplorare e condividere i dati in totale sicurezza, potenziare le applicazioni basate sui dati, eseguire diversi workload di analisi, intelligenza artificiale (IA) e machine learning. Ovunque siano i dati o gli utenti, Snowflake offre un’esperienza sui dati unica che si estende a più cloud e aree geografiche.

La novità di Snowflake Arctic: un modello per l’IA davvero aperto e libero da restrizioni

Oggi è disponibile un ampio ventaglio di Large Language Model (LLM): ce ne sono per tutte le esigenze e di tutte le dimensioni. Snowflake Arctic è la nuova proposta con cui l’azienda statunitense mira a distinguersi dalle soluzioni già sul mercato proponendosi direttamente alle imprese.

Ottimizzato per gestire workload complessi, Arctic eccelle ad esempio nella generazione di codice SQL, nell’esecuzione di istruzioni e si distingue per il recupero di informazioni dalla knowledge base aziendale.

Il tutto con un approccio aperto: Snowflake sottolinea infatti che il suo modello Arctic assicura intelligenza ed efficienza senza precedenti. E per la prima volta nel caso di un modello spiccatamente di taglio enterprise, gli utenti hanno a disposizione i “pesi” (oltre ai dettagli della ricerca sviluppata per la fase di addestramento) sotto licenza Apache 2.0.

Snowflake Arctic è quindi un modello potente veramente aperto, che consente – grazie alle condizioni di licenza – l’uso personale, di ricerca e commerciale senza restrizioni.

I modelli di codice condivisi dai tecnici di Snowflake fanno sì, inoltre, che gli utenti possano iniziare rapidamente a distribuire e personalizzare Arctic utilizzando i loro framework preferiti. Questi includono NVIDIA NIM con NVIDIA TensorRT-LLM, vLLM e Hugging Face. Per l’utilizzo immediato, Arctic è disponibile per l’inferenza serverless in Snowflake Cortex, il servizio completamente gestito che offre soluzioni di machine learning e IA nel Data Cloud.

Il nuovo modello sarà anche disponibile su Amazon Web Services (AWS), insieme ad altri modelli e cataloghi, tra cui Hugging Face, Lamini, Microsoft Azure, NVIDIA API catalog, Perplexity, Together AI ed altri ancora.

Prestazioni Snowflake Arctic

Un nuovo paradigma per l’addestramento e l’ottimizzazione dei modelli generativi

Arctic si appoggia allo schema MoE (Mixture of Experts): per la generazione dell’output, si appoggia cioè a una tipologia di architettura di rete neurale che combina più modelli “esperti” (o “sottoreti”) per gestire diversi aspetti di un compito complesso. Ogni esperto è specializzato in una determinata parte del problema: i vari sotto-modelli (gli “esperti”) cooperano per migliorare le prestazioni complessive oltre alle capacità di comprensione e generazione del linguaggio.

Il team di ricerca di Snowflake, composto da ricercatori e ingegneri di sistema tra i migliori del settore, ha impiegato – per la creazione di Arctic – meno di tre mesi e ha speso circa un ottavo del costo di formazione. L’azienda d’Oltreoceano stabilisce quindi un nuovo standard verso il quale guardare, soprattutto nell’ottica dell’efficienza e del risparmio.

Snowflake Arctic, efficienza modello generativo

Attivando 17 dei 480 miliardi di parametri alla volta, Arctic può assicurare un’efficienza nella gestione dei token senza precedenti. Il modello usa circa il 50% di parametri in meno rispetto a DBRX e il 75% in meno rispetto a Llama 3 70B durante l’inferenza o l’addestramento. Inoltre, supera i principali modelli aperti, tra cui DBRX, Mixtral-8x7B e altri ancora, nella codifica (HumanEval+, MBPP+) e nella generazione di SQL (Spider), fornendo al contempo ottime prestazioni nella comprensione del linguaggio generale (MMLU).

E sono risultati davvero importanti se si considera che circa il 46% dei decisori aziendali ha dichiarato di sfruttare gli LLM open source esistenti per trarre beneficio dall’IA generativa, come parte integrante della strategia della propria organizzazione (fonte: Forrester Research).

Estrarre valore dai dati aziendali con Snowflake

In una delle diapositive mostrate durante la presentazione di Arctic, i responsabili di Snowflake hanno scritto a caratteri cubitali: “there is no AI strategy without a data strategy” ovvero non è possibile sviluppare una strategia efficace per l’intelligenza artificiale senza prima avere una strategia ben definita per la gestione e l’utilizzo dei dati. L’IA attinge dalla disponibilità e dalla qualità dei dati per apprendere, migliorare e prendere decisioni pertinenti. Senza dati di qualità e senza un approccio strategico alla loro raccolta, pulizia, archiviazione e analisi, qualsiasi sforzo nell’implementazione dell’IA rischia di rivelarsi inefficiente, inefficace o addirittura controproducente.

Snowflake fornisce alle aziende gli strumenti per creare potenti app di intelligenza artificiale e machine learning partendo proprio dai loro dati. Arctic accelera la capacità dei clienti di creare app IA su scala, all’interno del perimetro di sicurezza e governance del Data Cloud.

La proposta di Snowflake vuole essere allo stesso tempo potente ma anche economica per combinare dati proprietari (l’immensa “dote” di informazioni prodotte o raccolte dall’azienda in anni di attività) con un LLM di primo livello. Così, è possibile ad esempio sbloccare un servizio di Retrieval Augmented Generation (RAG) o di ricerca semantica, cuciti sulle specifiche esigenze di ciascuna realtà di business.

Grazie anche all’accesso agli altri LLM, tramite il suo Data Cloud, Snowflake offre una combinazione sicura di infrastrutture e capacità di calcolo in grado di massimizzare le potenzialità dell’IA per le finalità produttive. L’azienda ha ampliato la collaborazione con NVIDIA e ha recentemente annunciato investimenti in Landing AI, Mistral AI, Reka per aiutare i clienti a creare valore dai loro dati aziendali con i LLM e l’IA.

Le immagini nell’articolo sono tratte dalla presentazione di Snowflake Arctic. L’immagine di apertura è tratta dalla pagina Life at Snowflake.

Ti consigliamo anche

Link copiato negli appunti