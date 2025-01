La sempre più ampia diffusione di applicazioni basate sull’intelligenza artificiale ha portato a dover gestire carichi di lavoro davvero importanti. Non soltanto nella fase di inferenza ma anche e soprattutto in quella di addestramento dei modelli generativi. A maggio 2024 vi abbiamo raccontato della fondazione del consorzio UALink, un’iniziativa che mira alla promozione di un nuovo protocollo per le applicazioni di intelligenza artificiale (AI) e calcolo ad alte prestazioni (HPC). UALink mira a fornire un’interconnessione scalabile e performante utilizzabile in rete, con il preciso obiettivo di migliorare le comunicazioni ad alta velocità e a bassa latenza tra più unità di elaborazione.

In uno scenario finora dominato da NVIDIA, UALink si propone come una soluzione di interconnessione ad alta velocità sostenuta da tanti big dell’industria. Tra i nomi più altisonanti ci sono AMD, Intel, Google, Microsoft, Meta, Broadcom, Cisco e HPE. A distanza di qualche settimana dall’approvazione delle specifiche UALink 1.0, entrano nella partita anche “pezzi da novanta” come Apple, Alibaba Cloud e Synopsys.

Due parole sulle novità di UALink

UALink permette di interconnettere fino a 1.024 acceleratori in un pod di calcolo AI, permettendo attività dirette di caricamento, memorizzazione e operazioni atomiche tra le GPU. Grazie a questo schema, si possono gestire compiti computazionali complessi, migliorando significativamente le performance rispetto alle tecnologie esistenti come NVLink di NVIDIA. Ed è proprio per questo che NVIDIA non è fra i membri del consorzio. La nuova tecnologia è infatti vista come un rivale diretto e un rimpiazzo di NVLink.

Non solo. Una delle principali ambizioni del consorzio UALink è quella di promuovere un ecosistema aperto che favorisca l’interoperabilità tra diversi produttori e tecnologie. Questo approccio mira a evitare il lock-in tecnologico e a promuovere l’innovazione nel settore degli acceleratori AI.

Tornando alle performance, UALink supporta una larghezza di banda fino a 200 Gbps per lane, mantenendo la latenza nell’ordine delle centinaia di nanosecondi. A fronte di questi dati, UALink promette miglioramenti dal punto di vista dell’efficienza energetica fino al 40%, consentendo un utilizzo ottimale delle risorse disponibili nei data center.

Perché Apple ha deciso di abbracciare UALink?

Con la sua adesione al progetto UALink, Apple ottiene un “seggio” nel consorzio, avendo così modo di influenzare direttamente la creazione e l’adozione di nuovi standard per l’interconnessione tra acceleratori AI.

È inoltre pieno interesse di Apple investire su soluzioni alternative a quelle di NVIDIA, vista l’intenzione della Mela di offrire nuove funzionalità basate sull’intelligenza artificiale, ospitandole a livello di data center. Con la sua partecipazione al consorzio UALink, Apple intende sostenere la crescita di uno standard in grado di competere efficacemente con le soluzioni esistenti, migliorando così la diversificazione e l’accessibilità.

Becky Loop, responsabile dell’architettura della piattaforma Apple, ha sottolineato come UALink abbia davvero le carte in regola per affrontare le sfide di connettività e soddisfare le crescenti esigenze nel campo dell’AI.

Apple: strategia volta a produrre hardware personalizzato

La mossa di Apple lascia intendere anche qualcos’altro. L’adesione al consorzio UALink suggerisce una chiara intenzione di esplorare soluzioni di connettività avanzata per acceleratori AI.

Ciò potrebbe tradursi in una strategia volta a progettare hardware su misura, come hanno già fatto altri giganti tecnologici quali Google e Meta. Questo tipo di approccio consentirebbe ad Apple di ottimizzare le prestazioni, ridurre la dipendenza da fornitori esterni come NVIDIA e AMD abbassando al contempo i costi operativi.

Qiang Liu, vice presidente di Alibaba Cloud, ha a sua volta sottolineato il valore della standardizzazione nella creazione di “supernodi intelligenti“: “il consorzio UALink, come leader nel campo dell’interconnessione degli acceleratori AI, ha riunito membri chiave dell’industria per definire un protocollo progettato specificamente per gli acceleratori AI. Guiderà l’innovazione nell’infrastruttura AI, migliorando l’efficienza dei carichi di lavoro e promuovendo un ecosistema industriale aperto e innovativo“.

Credit immagine in apertura: iStock.com – mesh cube