A sdoganare l’utilizzo dei modelli generativi capaci di ragionare, ci ha pensato a suo tempo OpenAI presentando i suoi LLM o1. L’azienda guidata da Sam Altman non è la prima ad aver pensato alla possibilità di scomporre i problemi logico-matematici in più passaggi in modo da ottimizzare il comportamento dell’intelligenza artificiale. Tuttavia, è stata la prima realtà a mettere il reasoning nelle mani di una vastissima platea di utenti. Da qualche tempo a questa parte, si affacciano sul mercato rivali sempre più agguerriti. Tra i meglio attrezzati spunta DeeSeek-R1, utilizzabile dagli utenti anche in modalità locale senza appoggiarsi alle infrastrutture cloud fornite da terzi.

Cos’è DeepSeek-R1 e qual è la sfida che lancia a OpenAI

DeepSeek-R1 è un innovativo modello di intelligenza artificiale sviluppato da DeepSeek, una realtà cinese emergente nel settore AI. Questo modello si distingue per la sua capacità di ragionamento avanzato, che lo rende competitivo rispetto ad altri modelli di punta, come il già citato OpenAI o1.

L’approccio riflessivo, che dedica tempo all’analisi delle domande per migliorare l’accuratezza delle risposte, permette di ridurre gli errori comunemente associati ai sistemi tradizionali.

A differenza di molti modelli AI, inoltre, DeepSeek-R1 integra una procedura di auto-verifica, che sviluppa un processo per passaggi e successive iterazioni verificabile in tempo reale da ciascun utente.

DeepSeek-R1 rappresenta un passo significativo nell’evoluzione dei modelli AI, combinando capacità avanzate di ragionamento con un’infrastruttura robusta. Con la promessa di prestazioni elevate a costi significativamente inferiori rispetto ai concorrenti, il modello potrebbe avere un impatto notevole nel panorama dell’intelligenza artificiale su scala globale.

I modelli disponibili e l’integrazione con Ollama

Ollama è una piattaforma aperta progettata per semplificare l’uso dei modelli linguistici avanzati, rendendoli facilmente accessibili e integrabili nelle proprie applicazioni e nei flussi di lavoro.

La piattaforma offre strumenti per l’hosting, l’interazione e l’ottimizzazione dei modelli di intelligenza artificiale, permettendo agli sviluppatori di sfruttare la potenza dei modelli linguistici senza dover gestire complessi dettagli tecnici.

Da oggi anche i modelli della serie DeepSeek-R1 sono integrabili e utilizzabili con Ollama: ciò significa che un’unica istruzione essi possono essere avviati in locale oppure su server remoti. I comandi da usare con Ollama per installare i modelli DeepSeek-R1 e iniziare a usarli sono disponibili in questa pagina mentre nel repository GitHub sono riassunte le differenze tra l’uno e l’altro.

Con strumenti come il bilanciamento del carico, il supporto per il parallelismo e la gestione delle risorse, Ollama garantisce che i modelli operino in modo efficiente. Inoltre, le API (Application Programming Interfaces) di Ollama consentono l’uso dei modelli all’interno di applicazioni personalizzate, chatbot, sistemi di supporto, analisi di dati e altri progetti.

Credit immagine in apertura: iStock.com – BlackJack3D