close

Der ARM Prozessor Fujitsu A64FX für energie-effizientes Supercomputing

Der ARM Prozessor Fujitsu A64FX für energie-effizientes Supercomputing
Geschätzte Lesezeit: 4 Minuten

Hin­ter­grund-Infor­ma­tio­nen zu Fuji­tsu Super­com­pu­ting und dem gemein­sa­men Pro­jekt mit RIKEN.

Mitt­ler­wei­le ist Fuji­tsu seit mehr als 40 Jah­ren in der Ent­wick­lung von Super­com­pu­tern aktiv. Im Jahr 1977 ent­wi­ckel­ten wir den ers­ten Super­com­pu­ter Japans. Dem dama­li­gen FACOM 230–75APU folg­ten dann ab dem Jahr 1982 die Fuji­tsu Vek­tor­rech­ner VP100 und VP200. Die­se wur­den ab 1984 in Euro­pa auch durch den OEM-Part­ner Sie­mens AG ver­trie­ben. Eine Über­sicht aller Mei­len­stei­ne im Bereich Super­com­pu­ting haben wir auf die­ser Sei­te für Sie zusam­men­ge­stellt.

2011 gab es wie­der einen Grund zum Fei­ern: Wir konn­ten im japa­ni­schen For­schungs­zen­trum RIKEN mit dem K Com­pu­ter den zu die­ser Zeit schnells­ten Super­com­pu­ter der Welt instal­lie­ren. Der K Com­pu­ter war das Ergeb­nis einer lang­jäh­ri­gen Ent­wick­lungs-Zusam­men­ar­beit zwi­schen Fuji­tsu und RIKEN und erreich­te sowohl im Juni als auch im Novem­ber 2011 Platz Num­mer 1 der TOP500-Lis­te. Die­se Lis­te wird seit 1993 zwei­mal pro Jahr ver­öf­fent­licht und lis­tet die 500 schnells­ten Super­com­pu­ter der Welt. Das Kri­te­ri­um hier­für ist die gemes­se­ne Rechen­leis­tung nach den Regeln des LIN­PACK-Bench­marks von Dr. Jack Don­gar­ra, Uni­ver­si­ty of Ten­nes­see, USA.

Ein Nachfolgesystem für den K Computer

Der A64FX CPU Chip
Der A64FX CPU Chip

In den fol­gen­den Jah­ren begann in Japan bereits die Pla­nung für ein Nach­fol­ge­sys­tem, das für aus­ge­wähl­te stra­te­gi­sche Anwen­dun­gen eine Beschleu­ni­gung um etwa den Fak­tor 100 ermög­li­chen soll­te. Eine wei­te­re Rand­be­din­gung für die­ses Nach­fol­ge­sys­tem war, dass der Strom­ver­brauch aus Grün­den der Rechen­zen­trums-Infra­struk­tur 40 MW nicht über­schrei­ten dür­fe. So wur­de in Abstim­mung zwi­schen RIKEN und Fuji­tsu ent­schie­den, dass der Nach­fol­ge-Super­com­pu­ter mit dem Pro­jekt­na­men „Post‑K” mit einer von Fuji­tsu ent­wi­ckel­ten CPU auf Basis der ARM-Archi­tek­tur plus spe­zi­el­len Erwei­te­run­gen für Super­com­pu­ting aus­ge­stat­tet wer­den soll­te. Fuji­tsu ist Hard­ware-Part­ner von ARM für die Ent­wick­lung ARM-basier­ter CPUs. In die­ser Zusam­men­ar­beit haben wir bereits Erwei­te­run­gen um Vek­tor­be­feh­le für das Armv8‑A Inst­ruc­tion Set ent­wi­ckelt und auch der ARM Com­mu­ni­ty zur Ver­fü­gung gestellt. Der A64FX Pro­zes­sor ist nun die ers­te ARM-basier­te CPU mit Vek­tor­be­feh­len auf dem Markt.

Im Novem­ber 2019 wur­den die ers­ten bei­den Racks für den mitt­ler­wei­le auf den Namen „Fug­aku“ getauf­ten Super­com­pu­ter fer­tig­ge­stellt. Sie wur­den im Fuji­tsu-Werk in Numa­zu hin­sicht­lich Per­for­mance und Strom­ver­brauch ver­mes­sen und schließ­lich an RIKEN aus­ge­lie­fert. In 2020 wird er schritt­wei­se auf­ge­rüs­tet. 2021 soll schließ­lich die pro­duk­ti­ve Nut­zung des kom­plet­ten Sys­tems mit dann mehr als 150.000 CPUs auf­ge­nom­men wer­den. „Fug­aku“ ist ein wei­te­rer (japa­ni­scher) Name für den Fuji, Japans höchs­ten Berg. Er wur­de aus­ge­wählt, um einer­seits die hohe Leis­tung des neu­en Super­com­pu­ters zu sym­bo­li­sie­ren. Ande­rer­seits zeigt er auch den wei­ten Hori­zont auf, den das Sys­tem sei­nen Nut­zern bie­ten wird.

Was ist das Besondere am Fujitsu A64FX Prozessor?

Der A64FX Pro­zes­sor wur­de mit spe­zi­el­lem Fokus auf Super­com­pu­ting ent­wi­ckelt. Neben dem Ein­satz für tech­nisch-wis­sen­schaft­li­che Simu­la­tio­nen ist es eben­falls geplant, den Pro­zes­sor für Anwen­dun­gen in der Künst­li­chen Intel­li­genz (KI) zu nut­zen. Die A64FX CPU ver­wen­det die ARM-Archi­tek­tur, die bereits in vie­len Gerä­ten bis hin zu Smart­pho­nes im Ein­satz ist. Für die von tech­nisch-wis­sen­schaft­li­chen Simu­la­ti­ons-Anwen­dun­gen benö­tig­ten hohen Rechen­leis­tun­gen setzt die CPU auf Sin­gle Inst­ruc­tion Mul­ti­ple Data(SIMD)-Instruktionen mit einer Wei­te von 512Bit. Basis ist das um Vek­tor­be­feh­le (Scala­b­le Vec­tor Exten­si­on SVE) erwei­ter­te und in der CPU A64FX imple­men­tier­te Armv8‑A Inst­ruc­tion Set.

Neben den 48 CPU-Ker­nen für die mathe­ma­ti­schen Ope­ra­tio­nen gibt es in der A64FX CPU noch 4 wei­te­re Assis­tenz-Ker­ne, auf denen das Betriebs­sys­tem und I/O‑Befehle aus­ge­führt wer­den. Ein wei­te­res Hoch­leis­tungs-Merk­mal ist das in der CPU inte­grier­te High Band­width Memo­ry (HBM2), das für eine außer­or­dent­lich hohe Über­tra­gungs­ge­schwin­dig­keit von aggre­giert 1.024 GB/s zwi­schen dem Haupt­spei­cher und den CPU-Ker­nen sorgt. Eben­falls inte­griert sind die Schnitt­stel­len zum Hoch­ge­schwin­dig­keits­netz­werk. Der A64FX Chip beinhal­tet ca. 9 Mil­li­ar­den Tran­sis­to­ren und wird in einem 7nm-Pro­zess gefer­tigt. Die theo­re­ti­sche arith­me­ti­sche Spit­zen­leis­tung einer A64FX CPU beträgt bei 64bit-Genau­ig­keit max. 3,3792 TFLOPS (Tera Floating-Point Opera­ti­ons per Second). Wei­te­re tech­ni­sche Details fin­den Sie in unse­rem White­pa­per: „FUJITSU Super­com­pu­ter PRIMEHPC FX1000 – An HPC Sys­tem Ope­ning Up an AI and Exas­ca­le Era“.

Die PRIMEHPC FX1000 CPU Memory Unit
Die PRIMEHPC FX1000 CPU Memo­ry Unit

Die A64FX CPU, die zunächst für den Super­com­pu­ter „Fug­aku“ ent­wi­ckelt wur­de, wird von Fuji­tsu nun auch in den kom­mer­zi­ell ange­bo­te­nen Super­com­pu­tern PRIMEHPC FX1000 und PRIMEHPC FX700 ein­ge­setzt. Außer­dem freu­en wir uns sehr auf die Part­ner­schaft mit dem Super­com­pu­ter-Anbie­ter CRAY, die wir im Novem­ber ankün­di­gen durf­ten. CRAY plant die A64FX CPU im Super­com­pu­ter-Sys­tem CS500 ein­zu­set­zen.

Energieeffizienz – Nummer 1 in der GREEN500-Liste

Das The­ma Ener­gie­ef­fi­zi­enz wird gera­de für Höchst­leis­tungs-Rechen­zen­tren im Hin­blick auf Leis­tungs­dich­te und Nach­hal­tig­keit immer bedeu­ten­der. Für die GREEN500-Lis­te wer­den die in der TOP500-Lis­te ver­tre­te­nen Super­com­pu­ter hin­sicht­lich der Ener­gie­ef­fi­zi­enz ana­ly­siert. Kri­te­ri­um für die Lis­te ist das Ver­hält­nis aus gemes­se­ner Rechen­leis­tung und Strom­ver­brauch. Neben der Leis­tungs­fä­hig­keit berück­sich­tigt sie auch die Ener­gie­ef­fi­zi­enz von Super­com­pu­tern.

Für die­se Lis­te wur­de ein ers­tes Pro­to­ty­pen-Sys­tem bestehend aus zwei Racks und ins­ge­samt 768 A64FX CPUs des geplan­ten Super­com­pu­ters „Fug­aku“ im Fuji­tsu-Labor in Numa­zu nach den Regeln der GREEN500-Lis­te ver­mes­sen. Im Ergeb­nis erziel­te das Sys­tem eine gemes­se­ne Rechen­leis­tung von 1.999,5 TFLOPS bei einem Strom­ver­brauch in Höhe von 118 kW. Die dar­aus abge­lei­te­te Ener­gie­ef­fi­zi­enz in Höhe von 16,876 GFLOPS/Watt brach­te das Sys­tem auf Platz 1 der jüngs­ten GREEN500-Lis­te.

MFLOPS, GFLOPS, TFLOPS, PFLOPS

Die Rechen­leis­tung von Super­com­pu­tern wird seit Jahr­zehn­ten in der Ein­heit Gleit­punkt­ope­ra­tio­nen pro Sekun­de aus­ge­drückt. Als Pen­dant zur frü­he­ren Main­frame-Leis­tungs­ein­heit MIPS (Milli­on Inst­ruc­tions Per Second) wur­de die Super­com­pu­ter­ein­heit MFLOPS (Milli­on Floating-Point Opera­ti­ons Per Second) ver­wen­det, auch „Mega­flops“ genannt. Bei­spiel: die CRAY‑1 hat­te Ende der 70er Jah­re eine Spit­zen­leis­tung von ca. 100 MFLOPS. Der Super­com­pu­ter „Fug­aku“ soll im End­aus­bau eine Spit­zen­leis­tung von etwa 400 PFLOPS, d.h. 4 * 10 hoch 17 Rechen­ope­ra­tio­nen pro Sekun­de errei­chen.

Über den Autor
Eric Schnepf stu­dier­te Mathe­ma­tik an der Uni­ver­si­tät Karls­ru­he. In der For­schungs­grup­pe für nume­ri­sche Strö­mungs­me­cha­nik ent­wi­ckel­te er Soft­ware auf Vek­tor­rech­nern. Seit 1985 war er in ver­schie­de­nen Funk­tio­nen im HPC-Busi­ness für Sie­mens, Sie­mens Nix­dorf und Fuji­tsu Sie­mens Com­pu­ters tätig. Eric Schnepf ist Fuji­tsu Dis­tin­guis­hed Engi­neer und als Lead Solu­ti­on Archi­tect bei Fuji­tsu Tech­no­lo­gy Solu­ti­ons in Mün­chen tätig. Er beschäf­tigt sich schwer­punkt­mä­ßig mit IT-Infra­struk­tur-Lösun­gen für inno­va­ti­ve, rechen­in­ten­si­ve Anwen­dungs­ge­bie­te wie tech­nisch-wis­sen­schaft­li­che Simu­la­tio­nen und Deep Lear­ning für KI.

Schlagwörter: , , , ,

Story Page