Do czterech odlicz

Od czasu premiery pierwszych desktopowych procesorów dwurdzeniowych minęło już wystarczająco dużo czasu, aby się przyzwyczaić do ich obecności na rynku. Procent nowych komputerów zaopatrzonych w podwójne CPU stanowi mniejszość, jednak ciągle spadające ceny zachęcają użytkowników do zakupu. Systemy z procesorami dwurdzeniowymi są tańsze od tradycyjnych systemów dwuprocesorowych. Łącząc ze sobą obie technologie, uzyskamy ponadprzeciętny wzrost mocy. Maszyna wyposażona w dwuprocesorową płytę główną, obsadzoną dwurdzeniowymi procesorami, działa prawie cztery razy szybciej niż system z pojedynczym CPU.

Ewolucja

Nie ma się co dziwić, że rozwój platform wieloprocesorowych w kierunku jednostek dwurdzeniowych przebiegła tak szybko, gdyż serwery i wydajne stacje graficzne wymagają ogromnych mocy obliczeniowych. Wbrew pozorom producenci płyt głównych nie mieli tu tak łatwego zadania jak w przypadku popularnych płyt jednoprocesorowych. Tam zmiany sprowadzały się do dołożenia dwóch czy trzech faz w układzie zasilania procesora i modyfikacji BIOS-u. Płyta dwuprocesorowa jest zagospodarowana do granic możliwości i dołożenie kolejnych segmentów zasilania, i to dla obu gniazd, stanowi poważny problem. Mimo tego platformy wieloprocesorowe były wcześniej przygotowane do obsługi jednostek dwurdzeniowych niż płyty jednoukładowe.

Starcie tytanów

Do sprawdzenia rzeczywistej mocy obliczeniowej platform dwuprocesorowych wytypowaliśmy procesory AMD Opteron z serii 200. Aby porównanie było proste i obrazowe, wybraliśmy wydajne modele jedno- i dwurdzeniowe o identycznych parametrach. Opterony 250 i 280 to procesory ze złączem Socket 940 oraz zintegrowanym dwukanałowym kontrolerem pamięci DDR ECC, taktowane zegarem 2400 MHz. “250” to jedno-, a “280” – dwurdzeniowiec. Oba CPU mają po 1 MB pamięci cache L2 na rdzeń.

Taki wybór procesorów sam nasuwa pomysł, aby przetestować wszelkie możliwe kombinacje CPU, czyli kolejno: jeden jednordzeniowy, jeden dwurdzeniowy, dwa jednordzeniowe, jednordzeniowy z dwurdzeniowym oraz dwa dwurdzeniowe. Podczas testów okazało się, że jedno- i dwurdzeniowiec w parze, czyli konfiguracja mieszana, nie pracują razem. Prawdopodobnie powodem były ograniczenia BIOS-u płyty głównej, gdyż komputer momentalnie się wyłączał po inicjalizacji funkcji POST. Jednak pozostałe cztery konfiguracje działały bezproblemowo, a zgromadzony na ich podstawie materiał z przebiegu testów nasuwa bardzo ciekawe wnioski. Do testów użyliśmy płyty głównej MSI K8N Master2, o której szerzej piszemy na stronie “$(LC172540:Platforma i wyniki testów)$”.

Więcej mocy

Najsłabiej zaprezentował się Opteron 250 w konfiguracji jednoprocesorowej. Najsłabiej nie oznacza oczywiście, że był on powolny, gdyż wydajność tego procesora jest porównywalna z Athlonem 64 4000+, a w niektórych testach nawet lepsza. Jeśli nie możemy od razu zakupić systemu z dwoma procesorami, to jednoprocesorowa konfiguracja przez jakiś czas zapewni nam i tak bardzo dobre osiągi. Podczas pracy wielowątkowej pojedynczy Opteron 250 działa dużo wolniej od pozostałych konfiguracji, w których występują dwa procesory jedno- i dwurdzeniowe.

Kolejną testowaną konfiguracją był system dwuprocesorowy składający się z dwóch jednordzeniowych Opteronów 250. W tradycyjnych aplikacjach jednowątkowych nie widać przyrostu wydajności po przesiadce na tego typu platformę. Jednak uruchomienie jakichkolwiek dwóch aplikacji pracujących jednocześnie zmienia tę sytuację diametralnie. Czas wykonywania jednoczesnej kompresji pliku dźwiękowego do formatu MP3 i konwersja plików RAW do JPG skraca się prawie dwukrotnie. Bardzo wyraźnie przewagę systemu dwuprocesorowego nad jednoprocesorowym (nawet 30%) pokazują także PCMark05 i PCMark04, które mają wbudowane liczne testy wielowątkowe.

Co mogą zdziałać dwa procesory, widać najlepiej po czasie renderingu w Cinebenchu 2003, gdzie dwa Opterony uwinęły się z zadaniem w 41,5 sekundy, a jeden męczył się aż 77,6 sekundy. W grach Unreal Tournament 2003, Quake III czy Doom 3 wyniki systemu dwuprocesorowego są gorsze niż platformy z jednym CPU.

Następnie testowany był system jednoprocesorowy z dwurdzeniowym Opteronem 280. Jego wydajność powinna być zbliżona do wydajności poprzedniej konfiguracji, czyli dwóch jednordzeniowych “dwustupięćdzisiątek”. Wyniki potwierdziły te przypuszczenia – rezultaty są niemal identyczne, a w większości testów przewyższają nawet odrobinę system dwuprocesorowy, ponieważ synchronizacja między wątkami dwóch odrębnych układów jest bardziej czasochłonna niż w układzie dwurdzeniowym. Sygnały mają w nim o wiele krótszą drogę do przebycia niż na płycie dwuprocesorowej, gdzie spowalnia je magistrala FSB lub HyperTransport.

W grach, w których dwuprocesorowy system nieco kulał, dwurdzeniowy procesor nie ma już takich problemów i osiąga wyniki lepsze, niemal takie same jak pojedynczy Opteron 250.

Dwa na dwa

Na koniec najmocniejsza z konfiguracji – dwurdzeniowe Opterony 280 pracujące w parze, które sumarycznie dysponują czterema fizycznymi jednostkami obliczeniowymi. Wydawać by się mogło, że takie monstrum powinno sprostać wszystkim wyzwaniom bez mrugnięcia oka. Niestety, rzeczywistość nieco rozczarowuje.

Ponownie w grach i jednowątkowych aplikacjach para Opteronów 280 mocno niedomaga, osiągając wyniki niemal identycznie jak zestaw dwóch jednordzeniowych “250”. Najbardziej przyrost wydajności duetu “280” widać w testach syntetycznych Sandry 2005 i renderingu za pomocą Cinebencha 2003 – tu możemy mówić o prawie czterokrotnym przyroście mocy w porównaniu z systemem składającym się z jednego jednordzeniowego procesora.

W wielowątkowym teście 3ds max 7 brak przyrostu mocy w stosunku do dwurdzeniowca i pary jednordzeniowców nie powinien dziwić, ponieważ 3ds max 7 został zoptymalizowany tylko do pracy dwuwątkowej. Zwiększenie mocy obliczeniowej czterech rdzeni dostrzeżemy, obciążając system równolegle testami z 3ds max 7 i dodatkową aplikacją.

Dlaczego tak, a nie inaczej?

Zapewne wielu z Was się zastanawia w tym momencie, skąd tak słabe wyniki systemu dwuprocesorowego, nie mówiąc już o platformie składającej się z dwóch dwurdzeniowców. Gdzie się podziała cała drzemiąca w nich moc – przecież widać ją w testach niskopoziomowych i syntetycznych? Odpowiedź jest prosta: moc jest, tylko niestety aplikacje nie są w stanie jej wykorzystać. Przesiadka z systemu z jedną jednostką na system z dwoma CPU zapewnia znaczny przyrost mocy w bardzo wielu zastosowaniach. Niestety, niewiele aplikacji jest w stanie skorzystać z mocy drzemiącej w czterech jednostkach fizycznych. Nawet tak zaawansowana aplikacja, jaką jest 3ds max 7, nie umie zagospodarować zasobów dwóch podwójnych jednostek centralnych.

Słabsze wyniki w grach 3D i niektórych aplikacjach jednowątkowych dla systemów dwuprocesorowych to także nie przypadek. W tym wypadku przyczyną jest mniejsza wydolność magistrali HyperTransport i architektury chipsetu płyty głównej. NForce4 PRO dzieli jedną magistralę pomiędzy dwa procesory i nie robi tego w sposób dynamiczny. Stąd z powodu mniejszej przepustowości magistrali do pamięci każdy z CPU działających w duecie jest trochę mniej wydajny, niż gdyby pracował sam. Problem ten nie występuje w przypadku pojedynczej jednostki dwurdzeniowej, która z punku widzenia płyty głównej zachowuje się jak jeden procesor. Gdy jeden z rdzeni nic nie robi, drugi ma wszystkie zasoby dostępne tylko dla siebie.

Czas na wnioski

Systemy wieloprocesorowe nie umarły razem z narodzinami procesorów wyposażonych w dwa rdzenie. Jednak pojawienie się dwurdzeniowców, a szczególnie wysiłek ich twórców sprawiły, że wady, z którymi borykały się do tej pory systemy wieloprocesorowe, zostały wyeliminowane albo zminimalizowane. Po raz kolejny także widać, że możliwości sprzętu znacznie wyprzedzają to, co mogą zaoferować nam twórcy aplikacji. Z zakupem platformy wyposażonej w dwa dwurdzeniowe procesory radzę się wstrzymać do momentu pojawienia się aplikacji, które będą zoptymalizowane do pracy czterowątkowej.

Dane techniczne
ModelAMD Opteron 250AMD Opteron 280
Cena1580 zł4080 zł
Zaletyniezbyt duże zapotrzebowanie na energię, możliwość pracy dwuprocesorowejrewelacyjne osiągi nawet w konfiguracji jednoprocesorowej, możliwość pracy dwuprocesorowej
Wadyprzeciętna wydajność w porównaniu do procesorów dwurdzeniowychwysoka cena
Częstotliwość taktowania2400 MHz2400 MHz
Pamięć cache L21024 KB2 x 1024 KB
Liczba rdzeni/procesorów logicznych1/12/2
Technologia produkcji90 nm90 nm
Częstotliwość magistrali HT2000 MHz2000 MHz
Maksymalny pobór mocy89 W110 W
Obsługa instrukcji 64-bitowychtaktak
ZłączeSocket 940Socket 940
Gwarancja36 miesięcy36 miesięcy
Dostawcawww.amd.plwww.amd.pl