Zum Inhalt springen
Unabhängige und kostenfreie Beratung vereinbaren: » Termin

HPC-CLUSTER - AUFBAU & BETRIEB

HPC_Modul.jpg

Im Modul HPC-Cluster - Aufbau & Betrieb lernen Sie die Hauptbestandteile eines jeden HPC-Clusters kennen: Rechenknoten (Node), Hochleistungsdatennetzwerk (Network) und Datenspeicherung (Storage). Hinzu kommen Informationen über Betriebssysteme, Compiler, MPI-Bibliotheken und Softwaremanagement. Neben den grundlegende Zusammenhänge um mit Anwendern und Softwareentwicklern über Performance-Aspekte zu diskutieren, vermitteln wir zudem Wissen über den aktuellen Stand der Technik. Über die im Basiswissen gewonnenen Kenntnissen hinaus, werden Sie Aspekte der technischen Integration eines konkreten HPC-Clusters in ein Unternehmen kennenlernen. Die weiteren, für die IT-Integration des Clusters und seinen Betrieb nötigen Kenntnisse über Batchsysteme, Monitoring und IT-Sicherheit schließen das Modul ab. In diesem Modul liegt der Fokus vor allem auf den technischen und organisatorischen Aspekten der genannten Komponenten. Fragen zur Auslegung eines HPC-Clusters sowie mit den damit verbundenen Kosten und weitergehende Aspekte der Nachhaltigkeit sind Themenbereiche des Moduls HPC-Cluster - Auslegung, Kosten & Nachhaltigkeit.

Inhaltliche Themenbereiche

  • Was ist HPC? Hardware und Herausforderungen
  • Rechenknoten
  • Storage
  • Dateisysteme
  • Netzwerketheorie und -technologien
  • Betriebssysteme für Cluster
  • Software System & Anwendung
  • Software-Releasemanagement
  • Benchmarks
  • Technische Integration in die Organisation
  • Betriebskonzepte
  • Monitoring
  • Batch-Systeme
  • Usermanagement und Accounting
  • IT-Sicherheit
  • Zu erlangende Kompetenzen
  • Sie erhalten einen Einblick in die Architektur moderner CPUs und lernen wichtige Konsequenzen für die Anwender und Entwickler von Software kennen.
  • Sie verstehen Produktbeschreibungen aktueller CPUs und können die Herstellerangaben interpretieren.
  • Sie lernen die Grundlagen zu Datenspeichern und Dateisystemen.
  • Sie lernen unterschiedliche Typen von Dateispeichern kennen, wie man sie in Speicherverbünden verbindet und welchen Speicherbereichen sie zugeteilt werden.
  • Sie werden unterschiedliche Speichernetzwerke kennenlernen, sowie die Vor- und Nachteile von parallelen Dateisystemen und die Partitionierung von Speicherbereichen für unterschiedliche Datengruppen.
  • Sie erlernen die Terminologie und Grundlagen zur Beschreibung von Netzwerken und können diese anwenden.
  • Sie erhalten einen Überblick über die aktuell wichtigsten Netzwerktopologien und -technologien. Weiter lernen sie wie sie wichtige Charakteristika eines Netzwerks mittels Benchmarks bestimmen können.
  • Sie lernen HPC-Anforderungen an das Betriebsystems und Besonderheiten gegenüber PC-Betriebssystemen kennen.
  • Sie installieren einen Compiler auf einem Cluster und erfahren, wie man Versionen und Patches mit dem Modul-System organisiert.
  • Sie erfahren, wie man einen Benchmark plant und durchführt.
  • Sie lernen die wesentlichen Aspekte von Lizenzen und die Funktionsweise von Lizenzservern kennen.
  • Sie erfahren Grundlegendes über die Anforderungen, die ein HPC-Cluster an die technische Infrastruktur stellt.
  • Sie erhalten eine Übersicht über die relevanten Themenfelder, damit Sie in Ihrer eigenen Planung keine wichtigen Aspekte vergessen.
  • Sie können nachvollziehen, weshalb Überwachung ein wesentlicher Teil des Clusterbetriebs ist.
  • Sie lernen die verschiedenen Möglichkeiten einer solchen Überwachung sowie die Vielfalt der dafür nötigen Werkzeuge und ihre Unterschiede kennen.
  • Sie werden in der Lage sein, den Grad der Überwachung unter Abwägung der durch die Überwachung entstehenden Leistungsverluste gegenüber dem Gewinn an Informationen einzuschätzen.
  • Sie lernen die Grundlagen der IT-Sicherheit kennen.
  • Sie lernen die Stride-Methode zur Angriffsanalyse kennen.
  • Sie erstellen eine Bedrohungslandkarte für eine HPC Umgebung.
  • Sie lernen Sicherheitsmaßnahmen kennen. Sie können Zertifizierungen und Regulatorien einordnen.
  • Sie verstehen, wie IT Ressourcen in Großrechner-Umgebungen verwaltet, Zugriff für Benutzer auf diese geregelt und die Planung und Ausführung verteilter Anwendungen ermöglicht werden.
  • Sie lernen die Unterschiede zwischen den Komponenten eines Batch-Systems, Resource Manager und Job-Scheduler, sowie ihr Zusammenspiel kennen.
  • Sie bekommen einen Überblick über aktuelle Software-Lösungen und eine Zusammenstellung wichtiger Beispiele für die Nutzung von Batch-Systemen.
  • Sie bekommen ein Gesamtbild, welche Überlegungen beim Aufsetzen einer Nutzerverwaltung anstehen sowie welche Art von Komponenten in eine Nutzerververwaltung und ins Accounting integriert werden können.

Bis zum 21. März gibt es noch einen Early-Bird-Rabatt von 35%!

Weitere Informationen finden Sie hier.

Dr.-Ing. Andreas Wierse

Nutzen Sie Ihren Wettbewerbsvorteil durch den Einsatz von Simulation und Höchstleistungsrechnen sowie Big und Smart Data. Ich freue mich auf den Dialog mit Ihnen.

Dr.-Ing. Andreas Wierse

[Geschäftsführer]