Annunci “Datacenter” del Computex 2024: Intel-AMD-NVidia

-

Tradizionalmente, lo spettacolo del Computex è più uno spettacolo per PC da gioco e macchine portatili sempre più ultranomadi. Ma quest’anno, la pressione sulle esigenze dell’intelligenza artificiale ha incoraggiato i giocatori a fare grandi annunci su CPU e GPU che alimenteranno server e data center in futuro.

La fiera Computex, che si è tenuta la scorsa settimana, non è solo un’occasione per presentare in anteprima i PC di fine anno. È anche un’occasione per i produttori di processori di fare qualche annuncio e non solo nel mondo “Copilot+ PC”. La corsa all’intelligenza artificiale obbliga Intel, AMD e NVidia hanno molto da dire sulle loro offerte per i datacenter.

Ecco cosa devi ricordare da questi annunci…

Intel inizia a consegnare i suoi Xeon 6 e Gaudi 3

Il 2024 promette di essere un anno cruciale per gli Xeon di Intel. Il fondatore separa la sua gamma in due famiglie e 4 serie! In altre parole, Intel sta cercando di inserire una piccola classifica nei suoi SKU senza necessariamente cercare di ridurne il numero. Dovremo tenere il passo, non è facile. Grosso modo, la gamma Xeon 6 – incisa su tecnologia Intel 3 – è composta da due famiglie:
– IL ” Sierra Foresta », Xeon 6 ad alta efficienza energetica e costruiti solo attorno a “ E-Core ”, quindi cuori efficienti.
– IL ” Rapide di granito », Xeon 6 progettato per prestazioni, formazione AI e calcolo scientifico, dotato solo di “ P-Core » quindi di cuori “Performance”.

Ognuna delle sue due famiglie è divisa in due serie: la serie “ 6700 » con alimentazione ragionevole e la serie « 6900 » alimentato da 500W.

Al Computex, Intel ha annunciato l’inizio delle consegne del “6700E”, in altre parole “Xeon 6 Sierra Forrest” nel classico TDP. I modelli variano da 64 e-core (con un TDP di 205 W) a 144 e-core (con un TDP di 330 W)!

Intel ha inoltre annunciato per il terzo trimestre del 2024 la consegna dei suoi potenti Xeon 6” 6900P “. Tanto per la sua economica “Sierra Forrest”, Intel ha dato la priorità alla serie “6700”, quanto per le sue potenti “Granite Rapids”, Intel vuole subito colpire in campo pesante con la “6900P” e i suoi 128 “P- Nuclei.” Un processore destinato principalmente all’HPC e agli hyperscaler.

Bisognerà invece aspettare il 2025 per vedere l’arrivo degli “Xeon 6 6900E” (le versioni potenziate da 500 W del Sierra Forrest) con un modello con 288 core così come le versioni meno assetate di energia di Granite Rapids (con la serie 6700P e la serie Workstation 6300P).

Inoltre, Intel ha confermato al Computex che il suo nuovo acceleratore GPU AI “ Gaudì 3 » era ancora sulla buona strada e venivano consegnati i primi clienti.
Secondo Intel, i tempi di addestramento in Gaudi 3 sono del 40% più veloci rispetto a NVidia H100 quando si addestra un modello linguistico di grandi dimensioni (LLM) come GPT 3.5, che include 175 miliardi di parametri. Miglioramenti ancora maggiori sono stati riscontrati su LLama 2 con 8 miliardi di parametri. Quando si tratta di inferenza, Gaudi 3 di Intel offre il 170% delle prestazioni dell’H100 su LLama 2 ed è quattro volte più veloce nell’inferenza rispetto a un modello come Falcon 180B. Inoltre, la Gaudi 3 è considerevolmente più efficiente dal punto di vista energetico rispetto alle GPU NVidia: sarebbe due volte più efficiente dell’H100 in generale. Inoltre costa il 40% in meno.

AMD passa allo Zen 5

La generazione dei cuori Zen5 arriva in AMD, sia nella gamma Ryzen con Ryzen 9000 per PC Copilot+ dotato di NPU da 50 TOPS, sia nella gamma “Datacenter” con i nuovi processori EPYC “Torino”. Questi ultimi sono processori incisi a 3 nm e costituiscono la quinta generazione di processori Epyc per server. Non saranno disponibili prima del quarto trimestre del 2024 ma AMD ha svelato il nuovo flagship della gamma “torinese” al Computex 2024: un processore da 192 core (384 thread) ! Abbastanza da promettere una densità di calcolo mai vista prima.
Secondo AMD, un processore “Torino” nella versione a 128 core è 3,1 volte più veloce di uno Xeon 5 (64 core) per l’elaborazione tradizionale e fino a 5,4 volte più veloce per le inferenze AI.

Inoltre, AMD ha completato la sua roadmap delle GPU acceleratrici AI. Alla fine dell’anno scorso, AMD ha introdotto le sue nuove GPU AMD Instinct MI300X.
Quest’anno, un nuovo sviluppo chiamato MI325X apparirà alla fine del 2024 per offrire la memoria HBM3E per fornire una larghezza di banda di 6 TB/sec e fino a 288 GB di memoria integrata. Pertanto, AMD annuncia che l’MI325X (sempre con architettura CDNA 3) sarà in media 1,3 volte più efficiente delle GPU Intel “H200”.
AMD ha anche rivelato la versione delle GPU prevista per il 2025 MI350 con architettura CDNA 4 “per assumere la leadership nel calcolo e nella memoria” e il rilascio nel 2026 di MI400 basato su una nuovissima architettura CDNA-Next.

NVidia non lo lascia contare

Ovviamente NVidia non poteva lasciare che i suoi concorrenti si vantassero senza reagire. Il progettista di chip ha già presentato all’inizio dell’anno la sua promettente (ma costosa) generazione di GPU. Blackwell » che dovrà essere consegnato nella seconda metà del 2024.
Blackwell promette prestazioni di inferenza 30 volte superiori e consumo energetico 25 volte inferiore rispetto all’attuale generazione Hopper (H100, H200).

E NVidia ha già annunciato una nuova generazione” Blackwell Ultra » nel 2025 che “supererà i limiti”.

Nel 2026 seguirà una nuova architettura GPU, denominata “ Rubino », basato sulla memoria HBM4.

Allo stesso tempo, NVidia dovrebbe presentare la sua seconda generazione di processori ARM nel 2026 per sostituire il “ Adornare » che equipaggiano le attuali soluzioni “CPU+GPU” GH100 e le future soluzioni GB200. Questa nuova generazione di processori ARM si chiamerà “ Vera “.

Il mega SOC: GB 200 (1 CPU Grace + 2 GPU Blackwell)

NVidia è preoccupata anche per le reti saturate dalle montagne di dati richiesti dall’intelligenza artificiale e annuncia un passaggio Spettro Ultra X800 per il 2025 (800 Gbps in Ethernet) oltre ad uno switch NVLink 6 nel 2026 raggiungendo i 3600 GBps.

LEGGI ANCHE:

I 6 annunci da ricordare della conferenza di lancio della generazione

Nuova tecnologia

I 6 annunci che i CIO dovrebbero ricordare dall’evento “Copilot+ PC” di Microsoft

LEGGI ANCHE:

L'intelligenza artificiale e la sicurezza informatica vanno di pari passo su Google Cloud nel prossimo 2024

Nuvola

Google Next 2024: AI nella sicurezza e un processore inaccessibile

Ti invieremo un’e-mail di convalida!

-

NEXT OpenAI lancia GPT critico per correggere GPT-4