AMD ha ufficialmente lanciato la sua prima scheda di rete compatibile con lo standard Ultra Ethernet. Denominata Pensando Pollara 400GbE, è progettata per offrire prestazioni senza precedenti nei data center AI e in ambito HPC (high performance computing). La società di Sunnyvale ne ha annunciato il debutto in occasione dell’evento Advancing AI, a pochi giorni dalla pubblicazione della specifica 1.0 da parte dell’Ultra Ethernet Consortium (UEC). Di fatto, l’azienda guidata da Lisa Su apre la strada a un nuovo punto di riferimento per la comunicazione tra GPU e acceleratori.

La suggestione del nome italiano: Pollara

Pensando è il nome della divisione AMD specializzata in soluzioni di networking avanzate, nata dall’acquisizione dell’azienda Pensando Systems nel 2022. Questa business unit si occupa di sviluppare hardware e software per data center, con particolare attenzione a tecnologie di accelerazione di rete e sicurezza. Tutte le nuove soluzioni di rete di AMD, come le schede di rete di fascia alta, portano quindi il marchio “Pensando” per sottolineare la continuità e l’innovazione derivata dall’acquisizione.

È consuetudine nel settore IT, e in particolare per AMD, utilizzare nomi in codice o di progetto ispirati a località geografiche italiane. Si pensi ai processori AMD EPYC, che sono presentati, in ogni nuova generazione, con nomi di città del Belpaese.

In questo caso, Pollara fa correre subito la mente al piccolo borgo marinaro sulla costa ovest dell’isola di Salina (Eolie), luogo in cui sorge la casa del film “Il Postino“.

Un’infrastruttura di rete progettata per la scala zettabyte

Con una velocità di trasferimento fino a 400 Gbps, la scheda di rete AMD Pollara non è semplicemente un’evoluzione tecnologica, ma un cambio di passo strategico nella progettazione delle reti per ambienti AI ad alta densità. Pensata per gestire fino a un milione di processori o GPU, questa soluzione si colloca al centro dell’architettura per AI cluster su scala zettascale, dove ogni millisecondo di latenza ridotta equivale a settimane di calcolo risparmiate.

Il primo grande cliente ad adottare la nuova tecnologia sarà Oracle Cloud Infrastructure (OCI), che prevede di integrare le Instinct MI355X e le NIC Pollara 400GbE in un colossale cluster AI composto da 131.072 GPU AMD. Un’infrastruttura di questo tipo rappresenta uno dei primi esempi concreti di ambienti capaci di gestire modelli AI multimodali di nuova generazione su scala industriale.

L’espressione “scala zettascale” indica un livello di elaborazione o gestione dei dati estremamente elevato, nell’ordine degli zettabyte (1 zettabyte = 1.000 miliardi di gigabyte). Nel contesto dell’intelligenza artificiale e dell’HPC, operare su scala zettascale significa progettare infrastrutture in grado di gestire quantità immense di dati e milioni di processi simultanei, tipici dei modelli AI di nuova generazione. È il livello successivo al petascale ed exascale: rappresenta il futuro dell’elaborazione distribuita su larga scala.

Prestazioni e ottimizzazioni: confronto con NVIDIA e Broadcom

La scheda Pollara 400GbE si basa su un chip specializzato sviluppato internamente da AMD Pensando, con hardware riconfigurabile e funzioni di accelerazione integrate, tra cui:

Supporto avanzato per RDMA (Remote Direct Memory Access)

Protocolli di trasporto regolabili

Offloading intelligente delle librerie di comunicazione

Failover a bassa latenza per connessioni GPU-to-GPU affidabili

Secondo i dati rilasciati da AMD, le prestazioni RDMA della Pollara superano del 10% quelle della NVIDIA ConnectX-7 (CX7) e del 20% Broadcom Thor2. L’adozione delle funzionalità chiave dello standard UEC 1.0 — tra cui bilanciamento del carico intelligente, retrasmissione selettiva e controllo della congestione con consapevolezza del percorso — consente ulteriori incrementi del 25% rispetto ai sistemi tradizionali.

Routing adattivo e resilienza a livello di protocollo

Uno dei punti di forza della scheda Pollara consiste nella sua capacità di frammentare e distribuire i flussi dati su percorsi multipli, evitando congestioni; gestire il rerouting dinamico del traffico in presenza di colli di bottiglia; rilevare rapidamente eventuali guasti e bypassare in automatico le “connessioni degradate”.

Questi elementi permettono di mantenere una latenza costante anche in cluster da decine di migliaia di acceleratori, migliorando l’efficienza complessiva dei workload AI e garantendo elevata disponibilità operativa.

Ultra Ethernet: lo standard che sfida InfiniBand

La pubblicazione della versione 1.0 dello standard Ultra Ethernet da parte del consorzio UEC segna un momento cruciale nel superamento delle architetture legacy, come InfiniBand, a favore di un’implementazione Ethernet moderna, scalabile e progettata nativamente per l’AI distribuita.

Ultra Ethernet promette interoperabilità tra vendor, ottimizzazione per i carichi AI e semplificazione nell’orchestrazione software-defined, posizionandosi come lo stack di rete del futuro per i cloud provider.

Con l’arrivo della scheda Pensando Pollara, AMD si posiziona non solo come fornitore di GPU ad alte prestazioni, ma come attore di spicco nelle infrastrutture di interconnessione avanzata, offrendo una piattaforma end-to-end per AI ad alte prestazioni.