Suchen

KIT nimmt bwUniCluster in Betrieb Unis in Baden-Württemberg erhalten ein Hochleistungs-Rechenzentrum

| Redakteur: Ulrike Ostler

Gestern ging das Hochleistungsrechner-System „bwUniCluster“ am Karlsruher Institut für Technologie (KIT) in Betrieb. Er ist das erste zentrale System für eine flächendeckende Grundversorgung der baden-württembergischen Universitäten und Hochschulen mit Hochleistungsrechnerkapazität.

Firmen zum Thema

Das Rechner-System „bwUniCluster“ am Karlsruher Institut für Technologie (KIT) sorgt für eine flächendeckende Grundversorgung der baden-württembergischen Universitäten
Das Rechner-System „bwUniCluster“ am Karlsruher Institut für Technologie (KIT) sorgt für eine flächendeckende Grundversorgung der baden-württembergischen Universitäten
(Bild: KIT)

Der Rechner ist Teil des baden-württembergischen Landeskonzepts „bwHPC“ für das Hoch- und Höchstleistungsrechnen in Forschung und Lehre. Denn um der zunehmenden Bedeutung des wissenschaftlichen Rechnens in Forschung und Lehre begegnen zu können, sind wissenschaftliche Institutionen auf solche Infrastrukturen angewiesen. Die Universitäten und weitere Einrichtungen des Landes haben daher gemeinschaftlich Konzepte entwickelt, die auf dem Prinzip einer kooperativen Bereitstellung und Nutzung von Ressourcen und Diensten basieren, um so Wissenschaftler und Studierende im Land bestmöglich unterstützen zu können.

Holger Marten, Abteilungsleiter am Steinbuch Centre for Computing (SCC) für Wissenschaftliches Rechnen und Simulation, erläutert: „Der bwUniCluster als Teil der landesweiten Konzeption ersetzt bzw. ergänzt die lokalen Hochleistungsrechner-Ressourcen an den Landesuniversitäten und ermöglicht so ein arbeitsteiliges und effizienteres Vorgehen.“

Das massiv parallele System „bwUniCluster“ (baden-württembergischer Universitäts-Cluster) mit einer theoretischen Spitzenleistung von 176 Tera-Flop/s, das sind 176 Billionen Rechenoperationen in der Sekunde, steht auch weiteren, noch nicht beteiligten Landeshochschulen sowie für Kooperationen mit der Industrie gegen Kostenbeteiligung zur Verfügung. Die Investitionskosten betragen rund 4 Millionen Euro und werden so wie die Betriebskosten je hälftig vom Land und den neun Landesuniversitäten getragen.

Die Konfiguration des bwUniCluster

Der bwUniCluster beinhaltet:

  • 2 Login-Knoten mit jeweils 16 Cores mit einer theoretische Spitzenleistung von 332,8 GFLOPS und 64 GB Hauptspeicher pro Knoten,
  • 512 „dünne“ Rechenknoten mit jeweils 16 Cores mit einer theoretische Spitzenleistung von 332,8 GFLOPS und 64 GB Hauptspeicher pro Knoten,
  • 8 „fette“ Rechenknoten mit jeweils 32 Cores mit einer theoretische Spitzenleistung von 614,4 GFLOPS und 1 TB Hauptspeicher pro Knoten
  • und als Verbindungsnetzwerk ein Infiniband 4X FDR Interconnect.

Der bwUniCluster ist ein hybrider massiv paralleler Parallelrechner mit insgesamt 532 Knoten, wobei 10 Knoten davon Service-Knoten sind. Dabei sind die File-Server-Knoten nicht mitgezählt. Alle Knoten – bis auf die „fetten“ Knoten – haben eine Taktfrequenz von 2,6 Gigahertz (GHz).

Die „fetten“ Knoten haben eine Taktfrequenz von 2,4 GHz. Alle Knoten besitzen lokalen Speicher, lokale Platten und Netzwerkadapter. Ein einzelner Rechenknoten hat eine theoretische Spitzenleistung von 332,8 beziehungsweise 614,4 GFLOPS, so dass sich eine theoretische Spitzenleistung von 176,0 TFLOPS für das gesamte System ergibt. Der Hauptspeicher über alle Rechenknoten hinweg beträgt 41,1 Terabyte. Alle Knoten sind durch ein Infiniband 4X FDR Interconnect miteinander verbunden.

Infiniband und Lustre

Das Basisbetriebssystem auf jedem Knoten ist ein Ret Hat Enterprise Linux (RHEL) 6.4. Als Management-Software für den Cluster dient „KITE“; KITE ist eine offene Umgebung für den Betrieb heterogener Rechen-Cluster.

Als globales Dateisystem wird das skalierbare, parallele Dateisystem Lustre über ein separates Infiniband Netzwerk angebunden. Durch die Nutzung mehrerer Lustre Object Storage Target (OST) Server und Meta Data Server (MDS) wird sowohl eine hohe Skalierbarkeit als auch eine Redundanz beim Ausfall einzelner Server erreicht.

Infiniband sorgt für eine schnelle Verbindung der einzelnen Komponenten des bwUniCluster
Infiniband sorgt für eine schnelle Verbindung der einzelnen Komponenten des bwUniCluster
(Bild: KIT)

Im HOME-Verzeichnis, das das gleiche ist wie das HOME-Verzeichnis des InstitutsClusterII und der hc3, stehen ca. 469 Terrabyte an Plattenplatz zur Verfügung. Im WORK-Verzeichnis stehen rund 224 Terrabyte an Plattenplatz zur Verfügung. Daneben ist jeder Knoten des Clusters mit lokalen Platten für temporäre Daten ausgestattet.

(ID:42503376)