Procesory AMD EPYC Milan-X wedle opowieści Microsoftu
Microsoft ujawnił możliwości sprzętu AMD nie bez powodu. Planuje bowiem wykorzystać procesory EPYC Milan-X do napędzenia swoich maszyn wirtualnych Azure HBv3 Series, które będą opierać się na dwóch procesorach EPYC 7V73X. Te zapewniają dostęp do nawet 64 rdzeni Zen 3 dla jednego serwera, czyli łącznie do 128 rdzeni. Microsoft z kolei wykorzystuje osiem rdzeni z każdego indywidualnego serwera do obsługi „hipernadzorcy platformy Azure i innych procedur orkiestracji”.
Czytaj też: AMD pokazało przyszłość kart graficznych i procesorów. Szczegóły Instinct MI200 i Zen 4
Taki podział zapewnia klientom Microsoft w sumie pięć różnych konfiguracji, oferujących różne liczby rdzeni — 16, 32, 64, 96 i 120. To, w procesorach Milan-X, nabierze zupełnie nowego sensu, dzięki lepszemu pokładowi pamięci podręcznej. Firma Microsoft nie zmieni jednocześnie pozostałej części sprzętu platformy Azure HBv3, która nadal będzie miała dostęp do 4458 GB pamięci podręcznej i 350 GB/s przepustowości.
Milan-X oferuje do 768 MB pamięci podręcznej L3 (L3 + 3D V-Cache) na układ, więc konfiguracja dwuprocesorowa zapewnia do 1,5 GB pamięci podręcznej L3 na system lub w przypadku Microsoftu na maszynę wirtualną. Logicznie, alokacja L3 będzie zależeć od konfiguracji. Na przykład 16-rdzeniowa maszyna wirtualna ma dostęp do 96 MB na rdzeń, podczas gdy konfiguracja 32-rdzeniowa spada do 48 MB na rdzeń. W każdym razie pojemność L3 procesorów AMD EPYC Milan-X CPU stanowi trzykrotną poprawę w stosunku do obecnych układów Milan lub sześciokrotną poprawę w stosunku do poprzednich procesorów Rome – czytamy w serwisie Tom’s Hardware.
Microsoft donosi, że flagowy Milan-X, znany również jako EPYC 7V73X, oferuje nawet 50% mniej opóźnień na poletku pamięci w porównaniu do obecnego AMD EPYC 7V13. Nic w tym dziwnego, bo AMD przeniosło w nowym układzie kontroler pamięci bezpośrednio do procesora.
Według Microsoftu, duże pamięci podręczne pozwalają na wyższe współczynniki trafień w pamięć podręczną i tworzą kombinację opóźnień L3 i DRAM, która poprawia efektywne wyniki w świecie rzeczywistym. Ze względu na sposób, w jaki AMD ułożyło pamięć podręczną L3, szerokość rozkładu opóźnień L3 wzrosła. Niemniej jednak Microsoft uważa, że Milan-X powinien mieć opóźnienie pamięci L3 na tym samym poziomie, co Milan. W najgorszym przypadku Milan-X może prezentować nieco wolniejsze opóźnienie L3– czytamy w serwisie Tom’s Hardware.
Wedle wykresów Microsoftu, procesory AMD EPYC Milan-X przewyższają Milan o 77% przy użyciu konfiguracji 64VM, a także o 257% w porównaniu Skylake przy użyciu konkretnego modelu i radzą sobie znacznie lepiej w porównaniu do tej konkurencji w szeregu innych zastosowań.
Czytaj też: Oto specyfikacja mobilnego GeForce RTX 3080 Ti z GA103. Wyciek zdradza wszystko
Czym jest 3D V-Cache?
Dla przypomnienia tego, czym pamięć 3D V-Cache w ogóle jest, musimy cofnąć się w przeszłość, bo o niej AMD miało już wiele do powiedzenia. Ta technologia wykorzystuje sposób integracji układu z chipem SoIC firmy TSMC, który umożliwia dodawanie kolejnych rdzeni krzemowych wzdłuż osi Z, zastępując to bardziej typowe podejście z dodawaniem wzdłuż osi X. W tym procesie AMD musiało odwrócić kompleks rdzenia procesora (CCX) do góry nogami i to na nim zamontować pamięć 3D V-Cache, co zapewniło procesorowi idealne wyrównanie wysokości fizycznej między CCX i pamięcią L3.
Tego typu strukturę procesora możecie zobaczyć powyżej, bo AMD pokazało już owoc tego podejścia podczas wspomnianych targów Computex 2021. 3D V-Cache trafiło wtedy na prototypowy układ 12-rdzeniowego procesora Ryzen 9 5900X, zapewniając każdemu blokowi CCX dodatkowe 64 MB pamięci podręcznej trzeciego poziomu (L3). Oznacza to zasadniczo potrojenie pokładu L3 dla procesora, co w testach wykazało wzrost wydajności w grach, przekładając się na około 15% więcej klatek.
Czytaj też: Nawet 64 GB pamięci operacyjnej w smartfonach. To umożliwiają LPDDR5X Samsunga
Nie ma w tym nic dziwnego, bo z V-Cache AMD nie tylko zapewniło obszerniejszy poziom pamięci podręcznej procesorowi, ale też zmniejszyło odległość między nią, a CCX o około 1000 razy. To z kolei doprowadziło do zmniejszenia zużycia energii, temperatury i opóźnienia.