Intel Gaudi 3 è un potente ac­ce­le­ra­to­re di IA, pro­get­ta­to ap­po­si­ta­men­te per svolgere carichi di lavoro im­pe­gna­ti­vi con l’in­tel­li­gen­za ar­ti­fi­cia­le. Gaudi 3 viene prodotto con un processo di pro­du­zio­ne a 5 nanometri, dispone di 64 core ten­so­ria­li e offre il doppio in termini di pre­sta­zio­ni in FP8 e quattro volte la potenza di calcolo per l’IA rispetto al suo pre­de­ces­so­re. Queste ca­rat­te­ri­sti­che rendono questo ac­ce­le­ra­to­re di Intel l’ideale per eseguire ope­ra­zio­ni di inferenza e ad­de­stra­men­to dei modelli di IA di grandi di­men­sio­ni.

Quali sono le ca­rat­te­ri­sti­che pre­sta­zio­na­li di Intel Gaudi 3?

Con Gaudi 3, Intel sta­bi­li­sce nuovi standard dal punto di vista delle pre­sta­zio­ni e dell’ef­fi­cien­za ener­ge­ti­ca. Questo ac­ce­le­ra­to­re di IA si basa sull’ar­chi­tet­tu­ra di Gaudi 2, ma offre una potenza di calcolo no­te­vol­men­te superiore, una maggiore larghezza di banda di memoria e una migliore ef­fi­cien­za ener­ge­ti­ca. Il riepilogo seguente riassume le ca­rat­te­ri­sti­che prin­ci­pa­li di Intel Gaudi 3:

  • Potenza di calcolo in FP8: Gaudi 3 raggiunge una potenza di calcolo in FP8 di 1.835 PFLOPS. Il suo pre­de­ces­so­re arrivava a poco più di 0,8 PFLOPS, ossia le pre­sta­zio­ni per i calcoli in FP8 sono più che rad­dop­pia­te.
  • Potenza di calcolo in BF16: Intel Gaudi 3 raggiunge i 1.835 PFLOPS anche nei calcoli in BF16, il che rap­pre­sen­ta un aumento della potenza di calcolo pari al quadruplo rispetto a Gaudi 2.
  • Larghezza di banda della rete: la larghezza di banda della rete bi­di­re­zio­na­le è stata rad­dop­pia­ta a 1.200 gigabit al secondo, ottenendo una co­mu­ni­ca­zio­ne più veloce tra i nodi nei sistemi dei cluster IA.
  • Capacità e larghezza di banda HBM: con i suoi 128 gigabyte di memoria HBM, Gaudi 3 offre il 50 percento in più di larghezza di banda di memoria rispetto alla ge­ne­ra­zio­ne pre­ce­den­te. La larghezza di banda HBM pari a 3,7 terabyte al secondo cor­ri­spon­de a un aumento del 33 percento.
N.B.

PFLOPS (Peta Floating Point Operations per Second) è un’unità di misura che descrive la velocità di ela­bo­ra­zio­ne dei computer. Il su­per­com­pu­ter svi­lup­pa­to da IBM chiamato “Roa­drun­ner” è stato il primo a superare la barriera del PFLOP nel 2008.

Intel Gaudi 3 è dotato di due unità di ela­bo­ra­zio­ne speciali (“compute die”) che con­ten­go­no 64 core ten­so­ria­li e 8 MME (“Matrix Mul­ti­pli­ca­tion Engine” per l’ela­bo­ra­zio­ne parallela). Le 24 porte NIC RDMA, ciascuna capace di 200 gigabit al secondo, ga­ran­ti­sco­no una co­mu­ni­ca­zio­ne veloce su reti Ethernet stan­dar­diz­za­te.

Vantaggi e svantaggi di Intel Gaudi 3

L’utilizzo di un ac­ce­le­ra­to­re di IA della ge­ne­ra­zio­ne Gaudi 3 offre numerosi vantaggi. I prin­ci­pa­li sono:

  • Elevata potenza di calcolo: con pre­sta­zio­ni pari a 1.835 PFLOPS in FP8 e BF16, Gaudi 3 di Intel offre una potenza enorme, di livello pa­ra­go­na­bi­le alla ben più costosa NVIDIA H100. Secondo un co­mu­ni­ca­to stampa di Intel, in alcuni settori l’ac­ce­le­ra­to­re di IA di Intel supera ad­di­rit­tu­ra il modello di punta di NVIDIA in termini di pre­sta­zio­ni.
  • Alta ef­fi­cien­za ener­ge­ti­ca: gli ac­ce­le­ra­to­ri Gaudi 3 per l’in­tel­li­gen­za ar­ti­fi­cia­le sono rea­liz­za­ti con un processo di pro­du­zio­ne a 5 nanometri (di TSMC), che consente una maggiore densità di potenza. Il risultato è una riduzione del consumo ener­ge­ti­co e dei costi operativi nei data center.
  • Con­ve­nien­za per la sca­la­bi­li­tà dell’IA: Intel Gaudi 3 rende possibile la sca­la­bi­li­tà dei sistemi, in modo fles­si­bi­le, sia ver­ti­cal­men­te che oriz­zon­tal­men­te, il che è par­ti­co­lar­men­te van­tag­gio­so nelle di­stri­bu­zio­ni complesse.
  • Supporto per standard aperti: poiché Gaudi 3 supporta gli standard aperti, è possibile un’in­te­gra­zio­ne fles­si­bi­le degli ac­ce­le­ra­to­ri di IA nelle in­fra­strut­tu­re IT già esistenti. In questo modo si ga­ran­ti­sce una maggiore in­di­pen­den­za delle aziende nella scelta delle piat­ta­for­me di IA.

Gli ac­ce­le­ra­to­ri di IA, tuttavia, pre­sen­ta­no anche svantaggi che vale la pena men­zio­na­re. Sebbene Intel Gaudi 3 offra una per­for­man­ce di alto livello, i chip di fascia alta di NVIDIA vantano ge­ne­ral­men­te pre­sta­zio­ni ancora più elevate. Perché questo aspetto è im­por­tan­te? Perché finora le aziende operanti nel campo dell’IA hanno optato per la soluzione più potente anziché per quella più con­ve­nien­te. Di con­se­guen­za, Intel Gaudi 3 è meno diffuso rispetto agli ac­ce­le­ra­to­ri IA di NVIDIA, il cui eco­si­ste­ma beneficia di un vasto supporto da parte dei team di sviluppo delle IA.

Campi di ap­pli­ca­zio­ne: quali sono i più adatti per Intel Gaudi 3?

Intel Gaudi 3 è stato pro­get­ta­to ap­po­si­ta­men­te per carichi di lavoro ad alta intensità di calcolo per l’IA ed è par­ti­co­lar­men­te adatto per le attività di inferenza che ri­chie­do­no elevata ela­bo­ra­zio­ne parallela e larghezza di banda della memoria. Tra i carichi di lavoro tipici si contano la creazione di testi con i modelli lin­gui­sti­ci di grandi di­men­sio­ni (LLM), la ge­ne­ra­zio­ne di immagini e la sintesi vocale. Grazie all’elevata velocità di inferenza e all’ar­chi­tet­tu­ra FP8 ot­ti­miz­za­ta, Gaudi 3 consente un’ela­bo­ra­zio­ne potente ed ef­fi­cien­te dal punto di vista ener­ge­ti­co per i modelli di IA ge­ne­ra­ti­va. Ma i campi di ap­pli­ca­zio­ne possibili non si limitano a questi. Alcuni di essi sono, in par­ti­co­la­re:

  • Ad­de­stra­men­to di base di modelli di IA di grandi di­men­sio­ni: Gaudi 3 permette di elaborare grandi record di dati in modo ef­fi­cien­te. Gli ac­ce­le­ra­to­ri di IA sono quindi l’ideale per l’ad­de­stra­men­to di modelli di in­tel­li­gen­za ar­ti­fi­cia­le, ad esempio le reti neurali per l’ap­pren­di­men­to au­to­ma­ti­co oppure modelli tra­sfor­ma­to­ri come GPT e LLaMA partendo da zero.
  • Ela­bo­ra­zio­ne di immagini e visione ar­ti­fi­cia­le: grazie alla sua elevata potenza di calcolo, Intel Gaudi 3 è in grado di elaborare dati di immagini complesse in tempo reale. Questo ac­ce­le­ra­to­re di IA risulta quindi adatto anche per ap­pli­ca­zio­ni come il mo­ni­to­rag­gio della sicurezza o l’au­to­ma­zio­ne in­du­stria­le.
  • Server GPU e cluster IA nei data center: Intel Gaudi 3 può essere uti­liz­za­to nei server GPU per fornire la potenza di calcolo ne­ces­sa­ria alle attività di ad­de­stra­men­to e inferenza dell’IA.

Quali sono le al­ter­na­ti­ve possibili a Intel Gaudi 3?

Esistono diversi ac­ce­le­ra­to­ri di IA che è possibile con­si­de­ra­re in al­ter­na­ti­va a Intel Gaudi 3. Una delle opzioni più note, offerta dalla con­cor­ren­za, è NVIDIA H100. Mentre l’ac­ce­le­ra­to­re di Intel è l’ideale per le ap­pli­ca­zio­ni di inferenza, H100 offre pre­sta­zio­ni di fascia alta per casi ap­pli­ca­ti­vi nel campo dell’in­tel­li­gen­za ar­ti­fi­cia­le e della scienza dei dati. Un’ulteriore al­ter­na­ti­va a Gaudi 3 è NVIDIA A30, che viene scelta spesso in quanto coniuga pre­sta­zio­ni elevate e prezzo ac­ces­si­bi­le.

N.B.

Nella nostra guida “Server GPU a confronto” troverai una pa­no­ra­mi­ca sui migliori pro­ces­so­ri grafici per l’uso nei data center e nei server ad alte pre­sta­zio­ni.

Vai al menu prin­ci­pa­le