OpenAI ha presentato il suo primo chip proprietario per l’Intelligenza Artificiale, battezzato Jalapeño e sviluppato insieme a Broadcom. L’annuncio segna una tappa importante nell’evoluzione dell’infrastruttura che sostiene ChatGPT, Codex e gli altri servizi dell’azienda.
La crescita dei modelli linguistici ha trasformato la disponibilità di potenza computazionale in uno dei principali fattori competitivi del settore. Quasi tutti i grandi operatori dell’AI hanno investito in processori personalizzati per ridurre la dipendenza da fornitori esterni e contenere i costi. OpenAI entra ora ufficialmente in questo gruppo.
Cos’è Jalapeño e a cosa serve
Jalapeño è un ASIC progettato specificamente per l’inferenza AI. A differenza delle GPU general purpose, un ASIC nasce per eseguire un insieme limitato di operazioni con livelli superiori di efficienza energetica. Nel caso di OpenAI, il chip è stato ottimizzato per i carichi tipici dei grandi modelli linguistici.
L’inferenza è la fase in cui il modello elabora una richiesta dell’utente e genera una risposta. Richiede enormi quantità di calcolo distribuite su milioni di query giornaliere e rappresenta una delle principali voci di costo per i fornitori AI. Progettare hardware su misura consente quindi di ridurre questa dipendenza dalle GPU disponibili sul mercato.
Il processore è stato sviluppato in circa nove mesi. OpenAI sostiene di aver utilizzato strumenti basati sull’AI per accelerare alcune fasi del design e della verifica del chip. La produzione è affidata a TSMC, il principale produttore mondiale di semiconduttori avanzati, mentre l’integrazione nei server e nei rack per i datacenter è curata da Celestica. Non è prevista, almeno per il momento, una commercializzazione verso clienti esterni.
Prestazioni, efficienza e confronto con NVIDIA
Hock Tan, amministratore delegato di Broadcom, ha dichiarato che Jalapeño raggiunge livelli comparabili alle piattaforme NVIDIA Blackwell e alle TPU di Google per specifici scenari di inferenza. Le affermazioni vanno interpretate con cautela: non esistono ancora benchmark indipendenti completi.
Il dato più rilevante riguarda l’efficienza energetica. OpenAI sostiene che i primi test di laboratorio mostrano un miglioramento del performance per watt rispetto ad alcune soluzioni attualmente utilizzate nei datacenter AI. Quando un servizio gestisce centinaia di milioni di richieste al giorno, anche piccoli incrementi nell’efficienza generano risparmi economici considerevoli e riducono il fabbisogno energetico complessivo.
Jalapeño non sostituisce immediatamente le GPU NVIDIA presenti nell’infrastruttura di OpenAI, che continuerà ad affidarsi a hardware di più fornitori, tra cui lo stesso colosso coreano. Le prime unità stanno però già eseguendo carichi reali nei laboratori, compresi workload associati a GPT-5.3-Codex-Spark.
Roadmap e sfide ancora aperte
La distribuzione su larga scala è prevista progressivamente tra la fine del 2026 e il 2027, con una roadmap che punta a sostenere diversi gigawatt di capacità computazionale.
Restano però sfide concrete: i costi di sviluppo dei semiconduttori avanzati continuano a crescere e la disponibilità di HBM, la memoria ad alta larghezza di banda, resta molto inferiore alla domanda globale.
OpenAI descrive Jalapeño come il primo elemento di una famiglia di processori destinata a evolversi nel tempo. Se il progetto manterrà le promesse iniziali, l’azienda otterrà un controllo più diretto sulla propria infrastruttura, riducendo la dipendenza dai cicli tecnologici dei grandi produttori di GPU.