Poznaliśmy szczegóły NVIDIA Grace, czyli wyjątkowego superchipu producenta kart GeForce
Procesory Grace są przeznaczone do zastosowań HPC (High-Performance Computing) i w rzeczywistości tworzą tak zwany superchip. Ten przyjmuje postać pakietu Grace+Hopper albo połączenia dwóch identycznych procesorów Grace o 72 rdzeniach opartych o architekturę Arm v9 Neoverse. Mają dostęp do pamięci LPDDR5X z korekcją błędów poprzez interfejs o przepustowości 1 TB/s (pierwszy na świecie), a łączy je koherentne połączenie pamięci podręcznej NVLink-C2C, które zapewnia przepustowość rzędu 900 GB/s, czyli siedem razy większą niż protokół PCIe 5.0.
Czytaj też: Xiaomi powoli szykuje się do premiery serii Xiaomi 13
Jako że Grace wykorzystuje połączenie C2C (Chip-To-Chip), kluczowe jest dla niego wewnętrzne połączenie NVLINK o przepustowości dwukierunkowej rzędu 900 GB/s, które na dodatek cechuje bardzo niski pobór mocy (1,3 pJ/bit). Oznacza to, że jest 5-krotnie wydajniejszy w myśl zużycia energii od tego samego rozwiązania na bazie interfejsu PCIe. Same rdzenie są produkowane z wykorzystaniem węzła technologicznego 4N firmy TSMC, a więc zoptymalizowanego 5-nm procesu.
Czytaj też: Xiaomi szykuje się do globalnej premiery flagowych smartfonów z serii Xiaomi 12T
Wchodząc w szczegóły pamięci, NVIDIA Grace jest wyposażony w skalowalną strukturę koherencji z rozproszoną pamięcią podręczną. Ma do 3,225 TB/s przepustowości w obu sekcjach, zawiera 117 MB pamięci podręcznej L3 i obsługuje partycjonowanie oraz monitorowanie pamięci Arm (MPAM). NVIDIA postawiła na konfigurację z maksymalnie 512 GB LPDDR5X w 32 kanałach, co zapewnia układowi Grace do 546 GB/s przepustowości pamięci. Wybór tej pamięci został podyktowany najlepszym stosunkiem ceny, energożerności oraz przepustowości.
Czytaj też: OnePlus 10T poległ w teście wytrzymałości. Co na to producent? [Aktualizacja]
Rzeczywiście Grace w konfiguracji 144-rdzeniowej cechuje dosyć niskie (jak na tego typu CPU) TDP na poziomie 500 watów. Warto też wspomnieć, że zapewnia 68 linii PCIe 5.0, z czego cztery mogą być wykorzystane dla łączy x16 o przepustowości 128 GB/s, a pozostałe dwa służą dla MISC. Według NVIDIA system oparty na procesorze Grace zapewni 10-krotnie większą wydajność niż współczesne systemy oparte na NVIDIA DGX, które działają z procesorami na bazie architektury x86.