Ewolucja
Nie ma się co dziwić, że rozwój platform wieloprocesorowych w kierunku jednostek dwurdzeniowych przebiegła tak szybko, gdyż serwery i wydajne stacje graficzne wymagają ogromnych mocy obliczeniowych. Wbrew pozorom producenci płyt głównych nie mieli tu tak łatwego zadania jak w przypadku popularnych płyt jednoprocesorowych. Tam zmiany sprowadzały się do dołożenia dwóch czy trzech faz w układzie zasilania procesora i modyfikacji BIOS-u. Płyta dwuprocesorowa jest zagospodarowana do granic możliwości i dołożenie kolejnych segmentów zasilania, i to dla obu gniazd, stanowi poważny problem. Mimo tego platformy wieloprocesorowe były wcześniej przygotowane do obsługi jednostek dwurdzeniowych niż płyty jednoukładowe.
Starcie tytanów
Do sprawdzenia rzeczywistej mocy obliczeniowej platform dwuprocesorowych wytypowaliśmy procesory AMD Opteron z serii 200. Aby porównanie było proste i obrazowe, wybraliśmy wydajne modele jedno- i dwurdzeniowe o identycznych parametrach. Opterony 250 i 280 to procesory ze złączem Socket 940 oraz zintegrowanym dwukanałowym kontrolerem pamięci DDR ECC, taktowane zegarem 2400 MHz. “250” to jedno-, a “280” – dwurdzeniowiec. Oba CPU mają po 1 MB pamięci cache L2 na rdzeń.
Taki wybór procesorów sam nasuwa pomysł, aby przetestować wszelkie możliwe kombinacje CPU, czyli kolejno: jeden jednordzeniowy, jeden dwurdzeniowy, dwa jednordzeniowe, jednordzeniowy z dwurdzeniowym oraz dwa dwurdzeniowe. Podczas testów okazało się, że jedno- i dwurdzeniowiec w parze, czyli konfiguracja mieszana, nie pracują razem. Prawdopodobnie powodem były ograniczenia BIOS-u płyty głównej, gdyż komputer momentalnie się wyłączał po inicjalizacji funkcji POST. Jednak pozostałe cztery konfiguracje działały bezproblemowo, a zgromadzony na ich podstawie materiał z przebiegu testów nasuwa bardzo ciekawe wnioski. Do testów użyliśmy płyty głównej MSI K8N Master2, o której szerzej piszemy na stronie “$(LC172540:Platforma i wyniki testów)$”.
Więcej mocy
Najsłabiej zaprezentował się Opteron 250 w konfiguracji jednoprocesorowej. Najsłabiej nie oznacza oczywiście, że był on powolny, gdyż wydajność tego procesora jest porównywalna z Athlonem 64 4000+, a w niektórych testach nawet lepsza. Jeśli nie możemy od razu zakupić systemu z dwoma procesorami, to jednoprocesorowa konfiguracja przez jakiś czas zapewni nam i tak bardzo dobre osiągi. Podczas pracy wielowątkowej pojedynczy Opteron 250 działa dużo wolniej od pozostałych konfiguracji, w których występują dwa procesory jedno- i dwurdzeniowe.
Kolejną testowaną konfiguracją był system dwuprocesorowy składający się z dwóch jednordzeniowych Opteronów 250. W tradycyjnych aplikacjach jednowątkowych nie widać przyrostu wydajności po przesiadce na tego typu platformę. Jednak uruchomienie jakichkolwiek dwóch aplikacji pracujących jednocześnie zmienia tę sytuację diametralnie. Czas wykonywania jednoczesnej kompresji pliku dźwiękowego do formatu MP3 i konwersja plików RAW do JPG skraca się prawie dwukrotnie. Bardzo wyraźnie przewagę systemu dwuprocesorowego nad jednoprocesorowym (nawet 30%) pokazują także PCMark05 i PCMark04, które mają wbudowane liczne testy wielowątkowe.
Co mogą zdziałać dwa procesory, widać najlepiej po czasie renderingu w Cinebenchu 2003, gdzie dwa Opterony uwinęły się z zadaniem w 41,5 sekundy, a jeden męczył się aż 77,6 sekundy. W grach Unreal Tournament 2003, Quake III czy Doom 3 wyniki systemu dwuprocesorowego są gorsze niż platformy z jednym CPU.
Następnie testowany był system jednoprocesorowy z dwurdzeniowym Opteronem 280. Jego wydajność powinna być zbliżona do wydajności poprzedniej konfiguracji, czyli dwóch jednordzeniowych “dwustupięćdzisiątek”. Wyniki potwierdziły te przypuszczenia – rezultaty są niemal identyczne, a w większości testów przewyższają nawet odrobinę system dwuprocesorowy, ponieważ synchronizacja między wątkami dwóch odrębnych układów jest bardziej czasochłonna niż w układzie dwurdzeniowym. Sygnały mają w nim o wiele krótszą drogę do przebycia niż na płycie dwuprocesorowej, gdzie spowalnia je magistrala FSB lub HyperTransport.
W grach, w których dwuprocesorowy system nieco kulał, dwurdzeniowy procesor nie ma już takich problemów i osiąga wyniki lepsze, niemal takie same jak pojedynczy Opteron 250.
Dwa na dwa
Na koniec najmocniejsza z konfiguracji – dwurdzeniowe Opterony 280 pracujące w parze, które sumarycznie dysponują czterema fizycznymi jednostkami obliczeniowymi. Wydawać by się mogło, że takie monstrum powinno sprostać wszystkim wyzwaniom bez mrugnięcia oka. Niestety, rzeczywistość nieco rozczarowuje.
Ponownie w grach i jednowątkowych aplikacjach para Opteronów 280 mocno niedomaga, osiągając wyniki niemal identycznie jak zestaw dwóch jednordzeniowych “250”. Najbardziej przyrost wydajności duetu “280” widać w testach syntetycznych Sandry 2005 i renderingu za pomocą Cinebencha 2003 – tu możemy mówić o prawie czterokrotnym przyroście mocy w porównaniu z systemem składającym się z jednego jednordzeniowego procesora.
W wielowątkowym teście 3ds max 7 brak przyrostu mocy w stosunku do dwurdzeniowca i pary jednordzeniowców nie powinien dziwić, ponieważ 3ds max 7 został zoptymalizowany tylko do pracy dwuwątkowej. Zwiększenie mocy obliczeniowej czterech rdzeni dostrzeżemy, obciążając system równolegle testami z 3ds max 7 i dodatkową aplikacją.
Dlaczego tak, a nie inaczej?
Zapewne wielu z Was się zastanawia w tym momencie, skąd tak słabe wyniki systemu dwuprocesorowego, nie mówiąc już o platformie składającej się z dwóch dwurdzeniowców. Gdzie się podziała cała drzemiąca w nich moc – przecież widać ją w testach niskopoziomowych i syntetycznych? Odpowiedź jest prosta: moc jest, tylko niestety aplikacje nie są w stanie jej wykorzystać. Przesiadka z systemu z jedną jednostką na system z dwoma CPU zapewnia znaczny przyrost mocy w bardzo wielu zastosowaniach. Niestety, niewiele aplikacji jest w stanie skorzystać z mocy drzemiącej w czterech jednostkach fizycznych. Nawet tak zaawansowana aplikacja, jaką jest 3ds max 7, nie umie zagospodarować zasobów dwóch podwójnych jednostek centralnych.
Słabsze wyniki w grach 3D i niektórych aplikacjach jednowątkowych dla systemów dwuprocesorowych to także nie przypadek. W tym wypadku przyczyną jest mniejsza wydolność magistrali HyperTransport i architektury chipsetu płyty głównej. NForce4 PRO dzieli jedną magistralę pomiędzy dwa procesory i nie robi tego w sposób dynamiczny. Stąd z powodu mniejszej przepustowości magistrali do pamięci każdy z CPU działających w duecie jest trochę mniej wydajny, niż gdyby pracował sam. Problem ten nie występuje w przypadku pojedynczej jednostki dwurdzeniowej, która z punku widzenia płyty głównej zachowuje się jak jeden procesor. Gdy jeden z rdzeni nic nie robi, drugi ma wszystkie zasoby dostępne tylko dla siebie.
Czas na wnioski
Systemy wieloprocesorowe nie umarły razem z narodzinami procesorów wyposażonych w dwa rdzenie. Jednak pojawienie się dwurdzeniowców, a szczególnie wysiłek ich twórców sprawiły, że wady, z którymi borykały się do tej pory systemy wieloprocesorowe, zostały wyeliminowane albo zminimalizowane. Po raz kolejny także widać, że możliwości sprzętu znacznie wyprzedzają to, co mogą zaoferować nam twórcy aplikacji. Z zakupem platformy wyposażonej w dwa dwurdzeniowe procesory radzę się wstrzymać do momentu pojawienia się aplikacji, które będą zoptymalizowane do pracy czterowątkowej.
Dane techniczne | |||
Model | AMD Opteron 250 | AMD Opteron 280 | |
Cena | 1580 zł | 4080 zł | |
Zalety | niezbyt duże zapotrzebowanie na energię, możliwość pracy dwuprocesorowej | rewelacyjne osiągi nawet w konfiguracji jednoprocesorowej, możliwość pracy dwuprocesorowej | |
Wady | przeciętna wydajność w porównaniu do procesorów dwurdzeniowych | wysoka cena | |
Częstotliwość taktowania | 2400 MHz | 2400 MHz | |
Pamięć cache L2 | 1024 KB | 2 x 1024 KB | |
Liczba rdzeni/procesorów logicznych | 1/1 | 2/2 | |
Technologia produkcji | 90 nm | 90 nm | |
Częstotliwość magistrali HT | 2000 MHz | 2000 MHz | |
Maksymalny pobór mocy | 89 W | 110 W | |
Obsługa instrukcji 64-bitowych | tak | tak | |
Złącze | Socket 940 | Socket 940 | |
Gwarancja | 36 miesięcy | 36 miesięcy | |
Dostawca | www.amd.pl | www.amd.pl |