Raja Koduri, leggendario architetto di GPU con un fulgido passato in ATI Technologies, AMD, Apple e Intel, ha annunciato la nascita di Oxmiq Labs, una startup che segna il suo ritorno sulla scena tecnologica con un approccio radicalmente diverso rispetto ai modelli tradizionali di progettazione grafica. Dopo un periodo sottotraccia (Koduri aveva lasciato Intel a marzo 2023 per dedicarsi a tempo pieno a un suo progetto), l’azienda emerge con un obiettivo chiaro: sviluppare hardware e software per GPU e concederne la licenza a partner strategici, puntando alla massima indipendenza da componenti proprietarie.
Una piattaforma GPU “aperta” basata su RISC-V
Il “nocciolo” della nuova proposta di Koduri si chiama OxCore, un’architettura modulare GPU basata sull’ISA RISC-V, che integra motori di calcolo scalari, vettoriali e tensoriali nello stesso design. Una struttura unificata che consente di affrontare in maniera ottimale carichi di lavoro AI, grafici e multimodali, con supporto sia per near-memory computing che per in-memory computing, due approcci fondamentali per ridurre la latenza e aumentare l’efficienza energetica negli scenari di elaborazione più intensivi.
Parallelamente, Oxmiq propone OxQuilt, un generatore di SoC a chiplet che consente di comporre sistemi su misura combinando:
- CCB (Compute Cluster Bridge), per integrare più istanze di OxCore o unità di calcolo eterogenee.
- MCB (Memory Cluster Bridge), per ottimizzare la banda e la gestione della memoria.
- ICB (Interconnect Cluster Bridge), per la comunicazione ad alta velocità tra chiplet.
L’aspetto su cui Koduri vuole spingere forte è la personalizzazioni delle soluzioni basate su GPU: da acceleratori AI per l’edge a SoC per l’addestramento su larga scala, fino a sistemi multi-chiplet ad alte prestazioni.
Il software è parte essenziale della strategia di Koduri, che si allea con Jim Keller
Il noto designer di GPU ha chiarito che il software è il pilastro centrale della strategia Oxmiq. La piattaforma si fonda su OXCapsule, un livello di runtime e scheduling unificato che gestisce l’astrazione hardware, il bilanciamento dei carichi e l’isolamento delle applicazioni in “container eterogenei”.
L’architettura congegnata da Koduri consente di eseguire lo stesso codice su CPU, GPU e acceleratori AI senza modifiche; ridurre la complessità dello sviluppo su hardware eterogeneo; favorire la portabilità delle applicazioni AI e grafiche.
Elemento distintivo è OXPython, un layer di compatibilità che traduce i workload CUDA in modo da eseguire applicazioni Python-based su piattaforme non NVidia, senza ricompilazione. Il debutto avverrà sui chip AI Wormhole e Blackhole di Tenstorrent, società guidata da Jim Keller, partner di Oxmiq in questa iniziativa.
OXPython e la rottura del lock-in NVIDIA CUDA
OXPython è un layer di compatibilità che consente di eseguire applicazioni Python basate su CUDA senza modificare il codice sorgente. Traduce le chiamate CUDA in un runtime unificato, OXCapsule, che supporta hardware eterogeneo, inclusi acceleratori RISC-V e AI. L’approccio, come accennato in precedenza, permette di eseguire software CUDA su hardware non NVIDIA, con un alto livello di portabilità e senza dipendere dal vendor.
I tentativi di AMD nel supporto CUDA e i limiti riscontrati
AMD ha tentato di rompere il lock-in CUDA con la piattaforma ROCm e lo strumento HIP (Heterogeneous-compute Interface for Portability), che converte automaticamente codice CUDA in codice compatibile con GPU AMD.
Nonostante gli sforzi, la conversione non è mai stata perfetta o completa; spesso sono richiesti interventi manuali e ottimizzazioni; il supporto software e i driver non raggiungono la maturità e diffusione di CUDA; molte applicazioni rimangono comunque ottimizzate per NVIDIA, complicando la migrazione completa.
Le polemiche su ZLUDA e il divieto Nvidia sul porting CUDA
ZLUDA è un progetto open source che punta a portare le API CUDA su hardware non NVIDIA, in particolare su GPU AMD. Il progetto mira a emulare il runtime CUDA per permettere l’esecuzione di software CUDA su altre piattaforme.
Da parte sua, NVIDIA ha imposto restrizioni severe e condizioni legali molto rigide per l’utilizzo delle librerie e dei driver CUDA, vietando esplicitamente il porting o la modifica non autorizzata del software CUDA su hardware di terze parti. Tali restrizioni hanno rallentato lo sviluppo di progetti come ZLUDA, limitando fortemente la possibilità di eseguire CUDA su piattaforme diverse da NVIDIA.
Perché OXPython rappresenta un salto innovativo
A differenza di progetti come ZLUDA, che cercano di emulare o ricostruire l’ecosistema CUDA, OXPython sfrutta appunto un layer di compatibilità che traduce le chiamate CUDA in un runtime indipendente e hardware-agnostico.
La soluzione partorita da Koduri e dai suoi collaboratori permette l’esecuzione nativa e senza ricompilazione di applicazioni Python CUDA su hardware eterogeneo. Inoltre, è progettata come parte di una piattaforma modulare e scalabile, aperta alle collaborazioni con vari produttori hardware (a partire da Tenstorrent).
La strategia messa a terra dall’apprezzato ingegnere, rende OXPython meno vulnerabile a controversie legali e più appetibile per l’ecosistema AI, aprendo finalmente la strada a un’effettiva alternativa al lock-in CUDA.
Non una GPU consumer
Sebbene Koduri parli di “prima GPU startup nella Silicon Valley in oltre 25 anni”, Oxmiq non mira a competere con prodotti della gamma Radeon e GeForce. L’azienda non fornisce proprietà intellettuale per tutte le funzioni grafiche tipiche di una GPU consumer (unità texture, backend di rendering, pipeline di visualizzazione, ray tracing, output video). I licenziatari interessati a un prodotto completo dovranno integrare queste componenti autonomamente.
I nomi di Koduri e Keller sono già garanzia di successo ma Oxmiq ha già raccolto 20 milioni di dollari da investitori strategici, tra cui MediaTek, e ha generato le prime entrate lato software.
Il modello IP-licensing permette all’azienda di evitare costi legati alla produzione di chip, mantenendo un’elevata efficienza e riducendo le spese più grosse.