Neuer Hochleistungsrechner CLAIX-2018 an der RWTH Aachen University

07.11.2018

Im Juli hat die RWTH Aachen University die Firma NEC als Lieferant der zweiten Stufe des Hochleistungsrechners CLAIX ausgewählt.

 

NEC hat sich in dem Beschaffungsverfahren, in dem die Bewertung der Systemleistung anhand einer Sammlung repräsentativer Simulationsanwendungen (Job-Mix) vorgenommen wurde, mit dem wirtschaftlichsten Angebot gegen die Mitbewerber durchgesetzt. Dabei wurde die Wirtschaftlichkeit mit Hilfe einer TCO-Berechnung (Total Cost of Ownership) bewertet, in die der Hardware-Anschaffungspreis, der Energieverbrauch, die Kühlungskosten und die Performance des Job-Mix einflossen.

Der Kern von CLAIX-2018 (Cluster Aix-la-Chapelle) wird aus rund 1100 Rechenknoten bestehen. Jeder dieser Rechenknoten ist mit zwei Intel Xeon Platinum 8160 Prozessoren ausgestattet, die jeweils 24 Kerne bei einer Taktrate von 2,1 GHz bieten, sowie 192 GB Arbeitsspeicher. In Anwendungsphasen, in denen nicht die volle Parallelität ausgenutzt wird, kann die Taktrate auf bis zu 3,7 GHz erhöht werden. Damit bietet die zweite Stufe eine maximale theoretische Rechenleistung von 3,55 PFlops. Zusätzlich sind 48 Rechenknoten mit jeweils zwei NVIDIA Volta V100 GPUs ausgestattet, die untereinander im Knoten mit dem schnellen NVLink verbunden sind. Dieser Knotentyp unterstützt die Beschleunigung passender Anwendungen und die effiziente Ausführung spezieller Arbeitsschritte wie beispielsweise der Datenanalyse. Alle Rechenknoten in CLAIX-2018 sind mit einem Intel Omni-Path 100G Netzwerk verbunden.

Für die Simulationsanwendungen des RWTH Job-Mix werden mit der zweiten Stufe von CLAIX deutliche Performance-Verbesserungen erzielt. Im Vergleich zur ersten Stufe erhöht sich die durchschnittliche Pro-Core-Performance bei gleichbleibenden Datensätzen um 30%.

Mit CLAIX-2018 wird auch ein weiteres hoch performantes Lustre-basiertes Speichersystem in Betrieb genommen werden, das durch eine spezielle Netzanbindung auch der ersten Stufe von CLAIX zugänglich gemacht werden wird. Es bietet eine Kapazität von 10 PB und eine Bandbreite von 150 GB/s lesend und schreiben.

Das Gesamtsystem wird in der neuen Rechnerhalle am IT Center der RWTH Aachen University aufgebaut werden. Diese verfügt über eine freie Kühlung, d.h. es wird keine Energie zur Kühlung des Wassers aufgebracht, welches die Abwärme der Rechner aus den Schränken abtransportiert, sondern diese wird über Rückkühltürme an die Umgebung abgegeben. CLAIX-2018 soll im November mit einem Testbetrieb starten und im Dezember uneingeschränkt zur Verfügung stehen. Aktuell kann bereits in JARA-HPC Rechenzeit auf dem System beantragt werden (Antrag).