A Hitchhiker‘s Guide to a DIY Machine Learning Cluster

10:45 im tech-track

Ein großes Forschungsthema im Rahmen der Digitalisierung sind maschinelle Lernverfahren. Aktuelle Methoden und Techniken in diesem Bereich benötigen oft erhebliche Rechenressourcen. Ein spezieller Machine Learning Cluster befindet sich an der Hochschule Osnabrück am Institut für Management und Technik aktuell im Aufbau. Das Cluster wird bereits partiell und soll in zahlreichen Forschungsvorhaben des Campus Lingen, sowie in Lehrveranstaltungen verschiedener Studiengänge genutzt werden. Das Cluster nutzt leistungsstarke Grafikkarten zur Beschleunigung der Berechnungen. Beim Entwurf des Clusters wurden verschiedene Grafikkarten einem Leistungstest unterzogen mit zwei verschiedenen Ansätzen zum verteilten Trainieren. Zur Auswahl der Karten wurden die Ergebnisse verglichen. Es zeigten sich bei den Tests teilweise deutliche Abweichungen zwischentheoretischen Herstellerspezifikationen und praktischen Messwerten in konkreten maschinellen Lernframeworks. Darüber hinaus wurden Parameter zur Optimierung eines verteilten Lernens analysiert mit z.B. Auswirkungen auf die benötigte Netzwerkbandbreite zwischen Knoten bzw. zwischen Kommunikationsstrukturen innerhalb eines Knoten. Die Ergebnisse dieser Analysen, unter Berücksichtigung von Stromverbrauch und Kühlung, liefern eine Sammlung von Best-Practices zum Aufbau eines Machine Learning Clusters. Diese Best-Practices werden vorgestellt, dadurch erhält der Zuhörer ein Rahmengerüst um eigenständig ein Machine Learning Cluster zu entwerfen und einzurichten.

Christopher Metz

Christopher Metz ist wissenschaftlicher Mitarbeiter an der Hochschule Osnabrück –Institut Management und Technik (Campus Lingen). Dort beschäftigt er sich mit dem Aufbau eines Machine Learning Cluster, sowie den verschiedenen maschinellen Lernverfahren und wie diese auf dem Cluster verteilt werden können.