Come funziona il chip Ampère GA102 delle nuove schede NVidia RTX 30

Maggiori informazioni tecniche sul nuovo chip GA102 (Ampère) che governa il funzionamento delle nuove schede grafiche NVidia RTX 30.

Nei giorni scorsi NVidia ha presentato la nuova serie di schede grafiche Ampère RTX 30: NVidia Ampere: ecco le tre nuove schede grafiche RTX 30.
A parte una serie di informazioni di carattere generale, NVidia non ha fornito particolari dati di carattere tecnico durante la presentazione.

Un po’ di dettagli sono arrivati in queste ore e si concentrano sul GA102 usato nelle versioni più potente delle nuove schede, RTX 3090 e 3080.

Il chip ha una dimensione pari a 628 mm2, un discreto “taglio” rispetto alla superficie occupata dal TU102 (Turing) della RTX 2080 Ti (754 mm2).
Combinando questo dato con l’utilizzo del processo litografico a 8 nm di Samsung, NVidia dovrebbe essere riuscita a contenere ulteriormente i costi di produzione del processore grafico che potrebbe essere un bel po’ più economico rispetto al TU102.

In 628 mm2 NVidia ha inserito 28 miliardi di transistor contro i 18,6 miliardi del TU102. Il chip GA104 della RTX 3070 ha una dimensione di 392 mm2 e contiene 17,4 miliardi di transistor.

Gli streaming multiprocessor (SM) sono parti della GPU che gestiscono i CUDA core: essi si occupano delle elaborazioni vere e proprie con ogni SM che dispone delle unità di controllo, registri, pipeline di esecuzione, cache. I CUDA core, invece, sono le unità che si occupano dei calcoli in virgola mobile e sugli interi.

L’architettura Ampère include molte modifiche: ogni SM comprende quattro gruppi formati da 32 CUDA core con ciascuno di essi che può eseguire 16 istruzioni INT32 e contemporaneamente altre 16 FP32. Rispetto al modello Turing, quindi, raddoppia la potenza di calcolo in FP32 quando necessario e viene conservata la capacità di eseguire le istruzioni INT32 in modo più efficiente quando necessario.

Per poter alimentare questo sistema, che si discosta da quanto fatto finora in termini di gestione degli SM, NVidia ha raddoppiato la larghezza di banda della cache di livello 1, ha aggiunto il 33% di capacità in più e ha raddoppiato le dimensioni della partizione di cache.

Già le modifiche applicate sugli SM sono notevoli ma gli ingegneri di NVidia non si sono fermati qui: l’azienda afferma di aver raddoppiato la potenza nell’elaborazione in ray-tracing oltre a quella dei core tensor.

Migrando dal processo a 12 nm di TSMC a quello a 8 nm di Samsung, la società statunitense ha ottenuto una riduzione dei consumi energetici del 40% circa con le frequenze che sono aumentate di poco (150 MHz di differenza tra RTX 2080 e RTX 3080 a vantaggio di quest’ultima). Quasi tutto il miglioramento prestazionale arriva quindi dal raddoppio dei CUDA core. Non c’è invece un deciso balzo in avanti in termini di IPC (istruzioni per ciclo) con le ottimizzazioni più significative che arriveranno in futuro con le RTX 40.

La RTX 3070 dovrebbe costare 519 euro e arrivare in ottobre; la RTX 3080 719 euro, lanciata il 17 settembre; la RTX 3090 1.549 euro e dovrebbe debuttare il 24 settembre prossimo.

Ti consigliamo anche

Link copiato negli appunti