Wyślij wiadomość
Skontaktuj się z nami
LEO

Numer telefonu : 13486085502

Ogromny tydzień na uzbrojenie - także w centrum danych

June 29, 2020

To był ogromny tydzień dla Arm, i to nie tylko dlatego, że Apple ogłosił początek przejścia z procesorów Intel x86 na własne chipy oparte na Arm w swoich komputerach Mac.Organizacja non-profit Top500 zajmująca się wysokowydajnymi komputerami obliczeniowymi ogłosiła w tym tygodniu, że po raz pierwszy w historii najszybszym superkomputerem na świecie jestnapędzany przez Arm chips.

Dodaj jeszcze dwa duże wydarzenia dla Arm w centrum danych ogłoszonym w tym tygodniu.Jak już zapewne wiesz, wyścig mający na celu produkcję chłodniejszych i wydajniejszych serwerów odwrócił się od prawa współzałożyciela firmy Intel, Gordona Moore'a, i skierował się kuMarzenie Sophie Wilson.Ampere Computing z siedzibą w Santa Clara, start-up z chipami serwerowymi Arm utworzony przez byłego prezesa Intela Renee Jamesa, który dopiero w marcuuruchomionajego 80-rdzeniowy procesor Altra Arm ogłosił, że próbkowanie 128-rdzeniowego procesora Altra Max rozpocznie się w czwartym kwartale.Koncentrując się wyłącznie na dostawcach chmury w hiperskali, Ampere zaprojektował część tak, aby konkurowała z Xeon Platinum 8160 firmy Intel (lista sugerowana 9899 USD) i Epyc 7742 firmy AMD (6950 USD) pod względem wydajności.

Również w tym tygodniu firma z Cambridge w Wielkiej Brytanii znanyaż do zeszłego roku jako Kaleao i zrestrukturyzowany w grudniu ubiegłego roku jako Bamboo Systems, podał, że wypuści swój pierwszy serwer 1U Arm, serię B1000N, w trzecim kwartale.Serwer jest przeznaczony do środowisk o niskim poborze mocy, takich jak brzegowe centra danych.

Nagle lider wydajności

„Pojawienie się” architektury procesorów Arm w centrach danych, według naszych własnych obliczeń, jest już w pełni zaangażowane piąty rok.Tak wiele na temat architektury i konstrukcji nowoczesnych centrów danych bezpośrednio lub pośrednio wywodzi się z architektury procesorów x86 stworzonych pierwotnie dla komputerów PC.Ale ewolucja Arm w tej przestrzeni była powolna, ale stała.

Wydajność nowego 128-rdzeniowego Altra Max firmy Ampere jest skierowana na terytorium superkomputerów.Tam Intel Xeon Platinum 8160 obsługuje dziewięć systemów w najnowszym Top500.

„Na wysokim poziomie zapewniamy o wiele większą wydajność niż Intel w przeliczeniu na procesor” - powiedział Jeff Wittich, starszy wiceprezes firmy Ampere ds. Produktów.Surowe liczby jeszcze się nie wyczerpały, ale Wittich twierdzi, że wydajność wzrosła o 2,2 razy w porównaniu z podobnymi procesorami x86, a chipem Intela Ampere, który wybrał do porównania jego nowej części, był 8160.

Altra Max będzie kompatybilna z gniazdem z 80-rdzeniowym Altra, który uzyskał najwyższą liczbę rdzeni Arm.Wittich zapewnił, że 128-rdzeniowy procesor zachowa liniową skalowalność, co oznacza, że ​​wydajność na rdzeń nie spadnie stopniowo wraz ze wzrostem liczby rdzeni.

Ampere Computingampere altra arm chip.jpg

Jeśli jego twierdzenie jest prawdziwe, byłby to mile widziany rozwój od maja 2019 r. W badaniu opublikowanym w tym miesiącu [PDF], zespół z Uniwersytetu w Bristolu porównał wydajność pierwszego wówczas superkomputera opartego na Arm, systemu Cray XC50 Scout o nazwie Isambard i zasilanego przez procesory Marvell ThunderX2 Arm, z maszynami Cray o podobnych specyfikacjach, w tym z 28-rdzeniowym procesorem Xeon Procesory Platinum 8176.

Zespół z Bristolu odkrył, że wydajność układu Marvell spadła z powodu spadku wydajności, zwłaszcza po liczbie węzłów wynoszącej 16. Na 64 węzłach serwerów wydajność skalowania procesora opartego na ARM spadła poniżej 80 procent, podczas gdy wszystkie układy Intela pozostały powyżej 100. procent.

Natomiast testy Ampera są oparte na liczbie rdzeni i wątków, a nie liczbie węzłów.Jeśli jednak to, co powiedział Wittich, okazało się prawdą, oznaczałoby to, że inżynierowie procesorów Arm przezwyciężyli poważną usterkę, która mogła sprawić, że ich produkty stały się niekonkurencyjne w przestrzeni HPC.

„Skupiliśmy się na chmurze, więc optymalizujemy wszystko pod kątem naszego środowiska chmurowego” - powiedział Wittich DCK.„Ale wiele rzeczy, które tam robimy, miałoby równie zastosowanie do wysoce skalowalnego superkomputera.Więc na pewno zobaczymy tam zainteresowanie.Nic nie wyklucza tego ”.

Ampere zamierza wprowadzić Altra Max do ogólnej produkcji seryjnej do połowy 2021 roku.

Stealth Panda

„Wiele firm już umieszcza procesory Arm na swoich serwerach.HPE, Supermicro, Lenovo mają je wszystkie ”- powiedział Tony Craythorne, dyrektor generalny Bamboo Systems.„Ale wszystko, co zrobili, to dosłownie podłączenie układu Arm do architektury x86.To może dać ci niektóre korzyści z Arm - zmniejszy moc i chłodzenie - ale nie da ci żadnych korzyści z przetwarzania, I / O i przepustowości, gdzie Arm ma ogromną przewagę. ”

Chodziło mu o to, że Bamboo wprowadzał nie tylko serwer z procesorem Intel lub AMD zastąpionym przez Arm, ale całkowicie nową architekturę zbudowaną wokół tego stylu procesora.Pokazując część wysiłku, z jakim stworzono jego nazwę, nazywa ją architekturą zaprojektowaną przez węzeł równoległy lub PANDA.

„Nasz produkt może dziś zaoszczędzić klientowi do 50 procent kosztów zakupu przy minimalnym (a może nawet wzrosnąć), 75 procentach zużycia energii i około 80 procent miejsca w szafie ze względu na gęstość, jaką możemy dostać się do bardzo małej obudowy ”, powiedział Craythorne DCK.

Chociaż architektura Bamboo jest projektowana pod kątem tego, co nazwał skalowalnością „mini-superkomputera”, przynajmniej na tym wczesnym etapie skalowanie zaczyna się od najniższego końca.Każdy węzeł serwera Bamboo może zawierać jedną lub dwie kasety, przy czym każda kaseta zawiera cztery kompletne jednostki przetwarzania.Pudełko 1U zawiera osiem serwerów Linux, każdy z dedykowaną pamięcią i pamięcią masową.Bamboo planuje wyprodukować produkt 4U jeszcze w tym roku.

„Jednym z powodów, dla których wprowadzamy go jako 1U, jest to, że rozumiemy, że ta technologia jest nowa” - powiedział Craythorne.„Każdy ma starszy system Intel.Nikt tego nie wyrzuci i nie wyda 150-200 000 $ na system 4U.Mogą po prostu spróbować.Chcą czegoś, co jest łatwe do kupienia, łatwego do sprzedania, taniego do wypróbowania, aby móc sprawdzić, czy to się dla nich uda ”

„Niski koszt” Craythorne oznaczał 9 995 dolarów.Podczas gdy typowy serwer x86 o niskim poborze mocy 1U można sprzedać zaponiżej 1500 USD, każdy „węzeł” może zawierać tylko jeden czterordzeniowy procesor.Dyrektor generalny Bamboo powiedział nam, że jego zespół używałKalkulator całkowitego kosztu posiadania AWSoszacowanie trzyletniego kosztu obsługi stelaża z ośmioma serwerami Dell PowerEdge R740XD 2U o łącznej mocy 16 kW.Szacunkowa wartość TCO firmy AWS w ciągu trzech lat wyniosła około 560 000 USD.

Chociaż Bamboo jeszcze nie przetrwał prawdziwego trzyletniego okresu próbnego, firma twierdzi, że podobnie działający stojak serwerów B1008N kosztowałby około 200 000 USD w tym samym okresie.

Istnieje kilka analiz całkowitego kosztu posiadania serwerów Arm, z którymi można porównać prognozy firmy Bamboo.Analiza z 2014 r. Pierwszej 64-bitowej kasety serwerowej ARMv8 firmy Hewlett-Packard (obecnie HPE), ProLiant M400, przeprowadzona przez analityka Patricka Moorheada [PDF] mogło być przynajmniej pewnym precedensem.Chociaż M400 był raczej „kasetą” niż 1U, w scenariuszu z serwerem internetowym Moorhead przewidywał, że trzyletni całkowity koszt posiadania M400 będzie o 35 procent niższy niż TCO podobnie wydajnego serwera 1U x86.Badania Moorhead obejmowały wkład z Sandia National Labs.

Craythorne stwierdził, że B1008N może zaoszczędzić klientom do 50% kosztów zakupu, co najmniej 75% zużycia energii i 80% miejsca w szafie dzięki większej gęstości serwerów.Chociaż powiedział, że jego firma przeprowadziła wewnętrzne testy i opracowała wykresy wskazujące, że testy te obejmowały publicznie znane testy porównawcze, Bamboo jeszcze nie opublikował twardych liczb, ale Craythorne powiedział, że zrobi to w najbliższej przyszłości.

Przyznał również, że część całkowitego kosztu posiadania Bamboo można przeznaczyć na rekompilację niektórych aplikacji pierwotnie zaprojektowanych dla x86, aby działały na Arm.

Każdy procesor ARM to implementacja architektury przetwarzania, która zawiera własność intelektualną licencjonowaną przez Arm Holdings należącą do Softbank Group i zwykle wytwarzaną przez zewnętrznego producenta.W rezultacie można powiedzieć, że prawie każdy procesor Arm ma własną architekturę, przynajmniej jeśli chodzi o część nielicencjonowaną.Bamboo nazywa swoją własną wersję Panda.Naturalnie, nie będąc komputerem PC w odległej przeszłości, pomija często wymagane porty rozszerzeń, pozostawiając dwie pary portów QSFP Ethernet (po jednym na każdy moduł blade).

Systemy bambusowebamboo panda server inside.jpg

„To jest kluczowa część, z którą wiele osób ma trudności w zrozumieniu naszego produktu” - przyznał Craythorne.W Pandzie procesor jest ograniczony do zarządzania i wykonywania aplikacji, z dostępem zarówno do DRAM, jak i pamięci nieulotnej (NVMe).Ale zadania sieciowe i pamięci masowej są obsługiwane wyłącznie przez koprocesor, a wbudowany przełącznik sieciowy zastępuje przełącznik na górze szafy.

„Mamy nieblokujący przełącznik L3 w każdym pojedynczym serwerze kasetowym z fragmentem sieci wewnątrz serwera” - zauważyła Siobhan Ellis, dyrektor ds. Zarządzania produktem w firmie Bamboo.Dlatego do pewnego stopnia nie musimy wysyłać ruchu sieciowego poza serwer kasetowy ”.Opcjonalnie, oba porty QSFP na kasecie mogą być podłączone do przełącznika lub jeden port może być podłączony do przełącznika, a drugi do kasety obok.„To ogranicza liczbę zewnętrznych przełączników potrzebnych w szafie”.