NVIDIA-Cina, scontro aperto: la risposta dura di Jensen Huang

Aggiungi IlSoftware.it come Fonte preferita su Google

La discussione sulla vendita di chip avanzati per l’intelligenza artificiale alla Cina non nasce oggi. Già in passato, il controllo sulle tecnologie critiche rappresentava uno degli strumenti principali di pressione geopolitica; oggi si parla di GPU per addestrare modelli linguistici e sistemi di analisi su larga scala. Limitare l’accesso alle tecnologie rallenta davvero lo sviluppo di un avversario oppure lo spinge a costruire alternative autonome? In un momento in cui la domanda globale di potenza di calcolo cresce a ritmi superiori al 30% annuo, la risposta non è affatto scontata.

A questa crescita della domanda corrisponde un’espansione senza precedenti della filiera: NVIDIA ha superato i 200 miliardi di dollari di ricavi annuali, mentre la disponibilità di componenti critici come memorie HBM e packaging avanzato CoWoS (Chip-on-Wafer-on-Substrate) – tecnologia avanzata di packaging dei semiconduttori che consente di integrare più chip su un unico substrato – è diventata un fattore limitante. Il punto è che non si tratta solo di progettare chip migliori, ma di riuscire a produrli e integrarli su scala.

Il punto di vista di Jensen Huang (NVIDIA) : controllo attraverso la dipendenza tecnologica

Jensen Huang, CEO di Nvidia, propone una lettura meno intuitiva rispetto alla linea restrittiva adottata da Washington. Il suo ragionamento parte da un presupposto tecnico: l’intelligenza artificiale non è solo hardware, ma un insieme stratificato di componenti che include energia, chip, infrastrutture, modelli e applicazioni. Limitarsi a bloccare una sola di queste dimensioni rischia di produrre effetti collaterali indesiderati.

Secondo Huang, mantenere gli sviluppatori cinesi all’interno dello stack tecnologico statunitense significa conservare un certo grado di influenza. Framework come CUDA, librerie di deep learning e tool di orchestrazione distribuita creano una dipendenza difficile da sostituire rapidamente. Il punto è che chi sviluppa su queste piattaforme tende a rimanerci: migrare interi workflow verso alternative richiede tempo, risorse e una revisione completa del codice.

CUDA non è solo un linguaggio o un SDK: include librerie altamente ottimizzate come cuDNN per il deep learning e NCCL per la comunicazione distribuita tra GPU. Inoltre, le architetture NVIDIA integrano unità specializzate come i Tensor Core: spostare workload complessi verso piattaforme alternative significa riscrivere kernel, riottimizzare la memoria e rivedere le strategie di parallelizzazione.

Rischi cyber e limiti reali della potenza computazionale

Uno degli argomenti più forti contro l’esportazione riguarda il rischio di utilizzo offensivo, soprattutto in ambito cyber. Durante il confronto con Dwarkesh Patel, visibile su YouTube, viene citato il caso di Claude Mythos, un sistema che ha identificato migliaia di vulnerabilità zero-day nei software.

Il timore è che più potenza di calcolo equivalga a maggiore capacità di scoprire e sfruttare falle nei sistemi.

Huang, con evidente irritazione, ha però voluto ridimensionare questo punto. Sostiene che modelli del genere non richiedono necessariamente cluster estremamente avanzati; possono funzionare anche con risorse considerate “ordinarie”. Inoltre, la Cina dispone già di infrastrutture significative, come il cluster CloudMatrix sviluppato da Huawei, basato su architetture distribuite che compensano l’eventuale inferiorità hardware con un approccio scalabile. In altre parole: anche senza le GPU più avanzate, il progresso non si ferma.

Il limite non è solo la singola GPU, ma l’architettura complessiva del cluster. Un sistema meno efficiente per nodo, spiega Huang, può compensare aumentando il numero di nodi, a costo di consumi energetici più elevati e maggiore complessità di orchestrazione. È una dinamica nota nei sistemi distribuiti: si perde in efficienza per unità, ma si recupera in scala.

La fabbrica dei token: la visione di Jensen Huang sul futuro di NVIDIA e dell’AI

Il fondatore di NVIDIA ha insistito su un’idea che torna spesso nei suoi interventi recenti: la sua azienda non vende semplicemente GPU, ma trasforma energia elettrica in token utili, cioè in output computazionale con valore economico crescente. Da qui nasce la formula, quasi brutale nella sua chiarezza, “electrons to tokens“.

Per capire la durezza della risposta di Huang bisogna partire da come definisce NVIDIA. Nel colloquio con Patel, spiega che l’input del suo business sono gli elettroni e l’output sono i token. In mezzo ci sono progettazione di chip, memoria ad alta banda, interconnessioni, software, librerie, sistemi rack scale, tool di gestione e una quantità enorme di co-design tra hardware e software.

Se si guarda a NVIDIA solo come fornitore di silicio, si perde quasi tutto il valore reale dell’azienda.

La reazione di Huang non nasce da una sola obiezione: nasce da tre livelli che, sommati, toccano il cuore della sua tesi. Il primo è quasi personale: Patel ha impostato il ragionamento in modo che, anche competendo in Cina, NVIDIA finirebbe comunque per perdere quel mercato nel lungo periodo, perché Pechino costruirebbe prodotti alternativi e spingerebbe i clienti a migrare.

Huang ha letto l’ipotesi come una “resa preventiva”: quando dice “you’re not talking to somebody who woke up a loser“, non sta solo difendendo la quota di mercato di NVIDIA: sta rifiutando l’idea che l’industria USA debba abbandonare il secondo mercato tecnologico del mondo per paura di una concorrenza futura.

Per Huang, uscire dal mercato cinese non significa solo perdere vendite, ma perdere la capacità di influenzare gli standard tecnici su cui saranno costruiti i modelli futuri. Se gli sviluppatori si spostano su stack alternativi, l’intero baricentro dell’innovazione rischia di spostarsi con loro.

Perché il computing non è un mercato come gli altri

L’intervistatore usa l’analogia con auto, smartphone e veicoli elettrici: prodotti occidentali forti all’inizio, poi raggiunti o superati da offerte cinesi.

Huang considera quel paragone sbagliato perché, a suo giudizio, il computing non funziona come il mercato dell’auto. Ed è il “secondo livello” che ha fatto arrabbiare Huang: un chip AI non si cambia con la facilita con cui si cambia una marca di veicolo. Modelli ottimizzati, librerie, driver, stack distribuiti, tool di profiling e abitudini di sviluppo creano attrito.

Il numero uno di NVIDIA richiama esempi storici come l’architettura x86 e il successo di ARM: piattaforme che hanno costruito un vantaggio non solo sulle prestazioni, ma sull’inerzia del software. Non è lock-in in senso banale: è il costo reale di riscrivere, riottimizzare, testare e validare codice su larga scala.

Il terzo livello è politico: Patel insiste sul fatto che ogni unità di computing in più può aiutare la Cina ad addestrare e distribuire modelli offensivi prima degli USA. Huang non nega il rischio in astratto, ma rifiuta la premessa implicita: che togliere Nvidia dal mercato cinese impedisca davvero alla Cina di raggiungere quella soglia critica.

I 5 layer dell’AI secondo Huang

Huang introduce una suddivisione dell’intelligenza artificiale in cinque livelli distinti: energia, chip, infrastrutture, modelli e applicazioni. Ogni livello ha vincoli specifici: la disponibilità energetica limita i data center; i chip determinano l’efficienza; le infrastrutture influenzano la scalabilità; i modelli definiscono le capacità; le applicazioni generano valore economico.

Concentrarsi esclusivamente sui modelli o sui chip rischia di distorcere la visione complessiva. Se si penalizza un livello, come quello dei semiconduttori, si indebolisce l’intera catena industriale. E qui emerge una critica implicita: le politiche di controllo delle esportazioni tendono a semplificare un sistema che, in realtà, funziona solo se tutte le componenti avanzano in parallelo.

Huang sottolinea anche che molti colli di bottiglia nella filiera, come packaging avanzato e memoria HBM, possono essere risolti in pochi anni se la domanda resta forte e prevedibile. Il vero limite strutturale, ancora una volta, resta l’energia.

Il punto in discussione non riguarda insomma solo se vendere o meno chip alla Cina. Riguarda dove si costruirà il prossimo standard tecnologico globale: e su questo terreno, per Huang, ritirarsi non può essere un’opzione.