Vom FACOM 230-75APU bis zum Fugaku – über 40 Jahre Supercomputer von Fujitsu

Nach den vielen Schlagzeilen und Berichten rund um Fugaku – den aktuell schnellsten Supercomputer der Welt – lohnt sich ein Blick auf die vergangenen mehr als 40 Jahre, in denen Fujitsu im Supercomputing immer wieder neue Technologien entwickelt hat.

Seit vielen Jahrzehnten werden Supercomputer für besonders rechenintensive Anwendungen eingesetzt. Bereits in den 60er-Jahren, als der Begriff „Supercomputer“ noch nicht populär war, nutzten wissenschaftliche Einrichtungen und staatliche Behörden die schnellsten Großrechner der damaligen Zeit. Zunächst waren dies oft Großrechner von Control Data Corporation wie z.B. die CDC 6600. Im Jahr 1976 wurde in den USA mit der CRAY-1 der erste Vektorrechner in Betrieb genommen. Dieser Supercomputer wurde 1979 erstmals auch in Deutschland installiert.

Der FACOM230-75 APU

Im Jahr 1977 entwickelte Fujitsu mit dem FACOM230-75 APU ein System, das man heute Supercomputer nennen würde1, 2. Dieser Großrechner enthielt eine besondere Verarbeitungseinheit für Felder von Daten (Array Processing Unit APU) und war damit der erste „Supercomputer“ in Japan, installiert beim National Aerospace Laboratory. Die Erfahrungen mit diesem System nutzte Fujitsu für die Entwicklung der späteren Fujitsu Vektorrechner.

FACOM230-75APU

FACOM230-75 APU

 

Die Vektorrechner von Fujitsu

Im Jahr 1982 kündigte Fujitsu die neuen Vektorrechner VP-100 und VP-200 an. Diese Vektorrechner hatten eine Skalareinheit analog einem Universalrechner und zusätzlich je nach Modell mehrere Vektor-Pipelines. Das erste System VP-100 wurde im Dezember 1983 beim Nagoya University Plasma Research Center in Betrieb genommen1, 2. In Europa vermarktete die Siemens AG als OEM-Partner von Fujitsu diese Vektorrechner. Die ersten Systeme vom Typ VP-200 installierte Siemens 1985 im Raum München. Für diese Vektorrechner-Serie bot Fujitsu auch eine Software-Umgebung mit FORTRAN-Compiler, automatischer Vektorisierung, mathematischen Bibliotheken und Tuning-Tools.

Anmerkung des Autors: Als wissenschaftlicher Mitarbeiter der Universität Karlsruhe konnte ich im Sommer 1985 auf einem Siemens VP-200 erste Benchmark-Tests durchführen. Dieses System kam später im Juni 1993 in der ersten Ausgabe der TOP5004 noch auf Platz 500 mit gemessenen 422 MegaFLOPS.

Die VP-Serie von Fujitsu wurde in den folgenden Jahren kontinuierlich weiterentwickelt mittels schnellerer Taktrate, Multi-Prozessor-Fähigkeit, zusätzlichen Vektor-Instruktionen und -Pipelines. Der Erfolg dieser VP-Serie zeigte sich auch durch diverse Installationen bei deutschen Universitäten.

Der Numerical Wind Tunnel

Der nächste Meilenstein war die Entwicklung des „Numerical Wind Tunnel“ (NWT), die in Zusammenarbeit von Fujitsu und dem National Aerospace Laboratory erfolgte1, 2. Nach der Installation des NWT erreichte dieser Supercomputer im November 1993 die Nummer 1 der TOP5004 mit einer gemessenen Leistung von 124 GigaFLOPS. Mit dem NWT und dem daraus abgeleiteten Fujitsu Supercomputer VPP500 wurde der erste Vektor-Parallel-Computer angeboten, der bis zu 222 Vektor-Prozessoren in Galliumarsenid / Bi-CMOS-Technologie über ein Crossbar-Netzwerk verbinden konnte. NWT konnte nach einem Upgrade mit einer Leistung von 170 GigaFLOPS die TOP500-Liste bis einschließlich November 1995 anführen 3. Für hervorragende Leistungen in realen Anwendungen auf dem NWT wurde mehrfach der ACM Gordon Bell Prize verliehen.

Numerical Wind Tunnel

Numerical Wind Tunnel

 

Skalar-parallele Supercomputer

Die VPP-Serie wurde um weitere CMOS-basierte Modelle erweitert (VPP300, VPP700, VPP5000), die dank CMOS-Technologie und reiner Luftkühlung besonders wirtschaftlich im Betrieb waren.

Parallel zu den Vektor-basierten Systemen entwickelte Fujitsu in den 1990er Jahren auch skalar-parallele Supercomputer. Die Systeme AP1000 und AP3000 nutzten Rechnerknoten mit SPARC-Prozessoren und liefen mit Solaris OS.

Anmerkung des Autors: In den 1990er Jahren gab es im globalen Supercomputer-Markt einen starken Wettbewerb zwischen klassischen Vektorrechnern und diversen neu entwickelten massiv-parallelen Supercomputern, die jeweils unterschiedliche Skalar-Prozessoren nutzten. Außerdem wurden etwa ab 1997 x86-Prozessor-basierte „PC-Cluster“ bei Universitäten populärer – nicht zuletzt wegen des günstigeren Preises. Siemens hatte für dieses Marktsegment mit der „hpcLine“ einen x86-HPC-Cluster auf den Markt gebracht und 1998 zum ersten Mal an der Universität Paderborn installiert.

Fujitsu entwickelte in den darauffolgenden Jahren sowohl SPARC64-basierte Supercomputer (PRIMEPOWER HPC2500) als auch x86-basierte Server (PRIMERGY), die sich für HPC-Cluster eigneten.

Die Entwicklung des K computers

Im Jahr 2001 wurde in Japan eine Studie hinsichtlich eines zukünftigen „High-end Computing Environment“ initiiert. Dieser Supercomputer sollte für verschiedenste technische / wissenschaftliche Anwendungen nutzbar sein und höchste Rechenleistung bieten. Nach einer Machbarkeitsstudie und einem Vorentwicklungsprojekt wurde im Jahr 2006 das eigentliche Entwicklungsprojekt für den „Next Generation Supercomputer“ gestartet. Die Wahl für den Technologie- und Entwicklungspartner für das japanische Forschungszentrum RIKEN fiel auf Fujitsu.

In diesen Co-Design-Prozess brachte Fujitsu seine Erfahrungen mit Höchstleistungsrechnern und CPU-Design ein. Um die Leistungs-Anforderungen zu erfüllen, entschied man sich für eine CPU auf SPARC64-Basis. Ergänzt wurde diese um Funktionen und Instruktionen speziell für einen massiv-parallelen Supercomputer. Außerdem wurde ein hierfür besonders optimiertes Hochgeschwindigkeits-Netzwerk „Tofu“ mit einer 6-dimensionalen Mesh / Torus-Topologie entwickelt. Für diesen Supercomputer stellte Fujitsu außerdem eine optimierte Software-Umgebung mit Compiler, Bibliotheken, Tools und Filesystem zur Verfügung – ergänzt durch Erweiterungen, die RIKEN entwickelte.

Im Juni 2011 erreichte die erste Ausbaustufe dieses Supercomputers, der nun „K computer“ 5 genannt wurde, die Nummer 1 der TOP5003 mit gemessenen 8,2 PetaFLOPS. Nach einem Upgrade auf insgesamt 88.128 Prozessoren konnte „K computer“ im November 2011 die Nummer 1 der TOP500 mit 10,5 PetaFLOPS halten. „K computer“ zeichnete sich dadurch aus, dass für reale Anwendungen eine hohe Rechenleistung erzielt werden konnte. Dieser Supercomputer blieb bis zum Sommer 2019 produktiv in Betrieb und ermöglichte viele wissenschaftliche Erkenntnisse.

K Computer

K computer

 

Fugaku – der aktuell schnellste Supercomputer der Welt

Bereits im Jahr 2010 – noch vor der Installation von „K computer“ – begannen beim japanischen Forschungsinstitut RIKEN die ersten Überlegungen für das „Post‑K“ Supercomputer-Projekt. Nach einer Machbarkeitsstudie begann 2014 das Projekt „Post‑K“. Es sollte für ausgewählte strategische Anwendungen eine Beschleunigung um etwa den Faktor 100 im Vergleich zum „K computer“ ermöglichen. Die weiteren Design-Kriterien waren eine sehr gute Energieeffizienz (max. 40 MW Stromverbrauch), die breite Nutzbarkeit durch viele Anwender*innen und neu hinzu kam die Eignung für Anwendungen in der Künstlichen Intelligenz (KI). Aufbauend auf den Erfahrungen bei der Entwicklung von „K computer“ arbeiteten auch in diesem Projekt wieder RIKEN und Fujitsu eng zusammen. Um sowohl die Performance-Anforderungen als auch die Energieeffizienz erfüllen zu können, entschieden RIKEN und Fujitsu, dass der Nachfolge-Supercomputer mit einer von Fujitsu entwickelten CPU (A64FX) auf Basis der ARM-Architektur und speziellen Erweiterungen für Supercomputing ausgestattet werden sollte. Weitere Informationen zur Fujitsu A64FX CPU finden sich in diesem Blog-Artikel.

Im Mai 2019 wurde „Post‑K“ dann auf den Namen „Fugaku“ 6 getauft. „Fugaku“ ist ein weiterer (japanischer) Name für Mount Fuji, Japans höchsten Berg. Er wurde einerseits ausgewählt, um die hohe Leistung des neuen Supercomputers zu symbolisieren. Andererseits zeigt er auch den weiten Horizont auf, den das System seinen Nutzer*innen bieten wird. Nach der kompletten Installation konnte Fugaku im Juni 2020 mit gemessenen 415,5 PetaFLOPS die Nummer 1 der TOP500-Liste erreichen. Fugaku beeindruckte sowohl durch den signifikanten Leistungsvorsprung gegenüber dem zweitplatzierten System als auch durch Spitzenwerte in weiteren Benchmarks. Weitere Informationen über Fugaku und die Benchmarks finden sich in diesem Blog-Artikel.

Der aktuelle Stand

Dank weiterer Tuning-Maßnahmen konnte Fugaku im November 2020 die gemessene Leistung auf 442 PetaFLOPS verbessern und hält bis heute die Nummer 1 der TOP500-Liste3.

Fugaku wurde aber nicht primär entwickelt, um Benchmark-Rekorde zu erzielen. Noch vor der kompletten Fertigstellung wurden bereits erste Partitionen von Fugaku für große Simulations-Berechnungen genutzt, um die Bekämpfung der COVID-19 Pandemie zu unterstützen. Inzwischen wurden viele weitere wissenschaftliche Projekte durch Fugaku gefördert, z. B. die Simulation von Wellenformationen nach Erdbeben und die Prognose von Tsunamis und deren Auswirkungen.

Fugaku

Fugaku

 
Anmerkung des Autors: Dieser Artikel beschreibt, wie Fujitsu seit über 40 Jahren innovative Technologien für Supercomputing entwickelt und damit zur Lösung gesellschaftlicher Herausforderungen beiträgt. Zunächst als wissenschaftlicher Mitarbeiter an der Universität Karlsruhe, danach als Partner bzw. Mitarbeiter von Fujitsu konnte ich das Supercomputing seit etwa 40 Jahren begleiten und in diversen Rollen unterstützen. Dieses spannende Gebiet wird mich wohl nicht mehr „loslassen“.

Referenzen

  1. Product milestones: Fujitsu Global
  2. Supercomputers-Computer Museum (ipsj.or.jp)
  3. top500.org
  4. TOP500 Report 1993 (Buch, veröffentlicht durch Universität Mannheim)
  5. What is K? | RIKEN Advanced Institute for Computational Science
  6. Fugaku | RIKEN Center for Computational Science RIKEN Website