© Simon Raffeiner/SCC
Author profile picture

KI ist aus unserem Leben kaum noch wegzudenken und bestimmt die Zukunft mit. Zum Beispiel bei der Entwicklung selbstfahrender Autos, autonomer Robotersystemen, neuer Materialien, bei der Verbesserung von Klimamodellen oder der Optimierung von Energiesystemen. Oder auch bei der Bekämpfung der Corona-Pandemie. Künstliche Intelligenz (KI) und auch Maschinelles Lernen (ML) spielen hierbei eine zentrale Rolle. Am Karlsruher Institut für Technologie (KIT) forschen Wissenschaftler seit Langem auf diesen beiden Gebieten.

Um die Forschung weiter voranzutreiben, hat die Helmholtz Artificial Intelligence Cooperation Unit (HAICU) nun als erster Standort in Europa das neuartige KI-System NVIDIA DGX A100 in Betrieb genommen. Das Steinbuch Centre for Computing (SCC) des KIT habe daher „die Beschaffung für den derzeit am SCC im Aufbau befindlichen Hochleistungsrechner Karlsruhe (HoreKa) genutzt” und sei außerdem eine Partnerschaft mit dem Marktführer NVIDIA eingegangen. So könne man Zugriff auf die derzeit modernsten KI-Systeme des Unternehmens erhalten.

Fünf Billiarden Rechenoperationen pro Sekunde

Ziel sei es, „Ähnlichkeiten zwischen Anwendungen zu identifizieren und auszunutzen sowie die Entwicklung neuer Methoden voranzutreiben“, erklären die Forscher. „Dafür ist vor allem eines nötig – eine extrem hohe Rechenleistung“, sagt Martin Frank, Direktor am Steinbuch Centre for Computing (SCC) am KIT und Professor am Institut für Angewandte und Numerische Mathematik (IANM) des KIT: „Beim Training einer KI mit großen Datensätzen kommen konventionelle Computersysteme an ihre Grenzen. Viele KI-Algorithmen lassen sich aber durch den Einsatz spezieller Hardware beschleunigen. Für unsere Forscherinnen und Forscher ist ein Zugriff auf solche Computersysteme heute ein entscheidender Wettbewerbsfaktor.“

Die drei neu installierten Computersysteme vom Typ DGX A100 sind Hochleistungsserver mit jeweils acht NVIDIA A100 Tensor Core GPUs. Die Gesamtrechenleistung beträgt 5 AI-PetaFLOP/s. Das sind fünf Billiarden Rechenoperationen pro Sekunde. Im Vergleich mit dem bislang schnellsten Vorgängermodell NVIDIA V100 sei das eine Beschleunigung um den Faktor fünf, betonen die Wissenschaftler. Darüber hinaus bekamen die neuen Beschleuniger einen „deutlich größerem und schnellerem Hauptspeicher“. Der Durchsatz des speziellen NVLink-Netzwerks zwischen den einzelnen Chips wurde auf 600 Gigabit pro Sekunde erhöht. „Den Forschern ist es damit nun möglich, deutlich größere Neuronale Netzwerke als bisher in sehr viel kürzerer Zeit mit noch größeren Datenmengen zu trainieren“, sagt Frank.

Hilfe bei Bekämpfung der Corona-Pandemie

Dank der neuen Systeme von NVIDIA können die Forscher ihre Anwendungen direkt für den zukünftigen Supercomputer des KIT, HoreKa, optimieren. Er wird bei der Inbetriebnahme im Sommer 2021 voraussichtlich einer der zehn schnellsten Rechner Europas sein. „Künstliche Intelligenz und Maschinelles Lernen können die Forschung in allen Anwendungsfeldern, also dort wo die drängenden Probleme der Menschheit gelöst werden, drastisch beschleunigen“, erklärt Marc Hamilton, für den Bereich Entwicklung zuständiger Vizepräsident bei NVIDIA. „Unsere neuen DGX A100-Systeme mit Tensor Core GPUs und NVIDIA Mellanox HDR InfiniBand-Verbindungen unterstützen diese beschleunigte Forschung und werden den wissenschaftlichen Fortschritt in einem breiten Spektrum wichtiger Forschungsbereiche vorantreiben.“

Auch bei der Bekämpfung der Corona-Pandemie könnten die neuen KI-Systeme des KIT eingesetzt werden. „Etwa indem sie die Entdeckung von Infektions-Hotspots beschleunigen, Ausbreitungsmuster vorhersagen oder das medizinische Personal bei der Analyse von Röntgenbildern entlasten.“ Am KIT und in der Helmholtz-Gemeinschaft gibt es bereits jetzt entsprechende KI-Forschungsinitiativen.

Titelbild: Bei den neuen Computersystemen vom Typ DGX A100 handelt es sich um Hochleistungsserver mit jeweils acht NVIDIA A100 Tensor Core GPUs. Gemeinsam erbringen die acht Beschleuniger eine Rechenleistung von 5 AI-PetaFLOP/s (Foto: Simon Raffeiner/SCC)