Fujitsu teilt seine Server-Chip-Linie auf, um Wolken zu jagen
Wenn es um Chips geht, gibt es einen großen Unterschied zwischen einem Kicker und einem Fork.
Der Kicker ist ein Nachfolger, der eine Architektur und ein Design implementiert und Verbesserungen der Mikroarchitektur umfasst, um die Kernleistung (Kern in der doppelten Bedeutung dieses Wortes, wenn es um CPUs geht) zu steigern und die Vorteile von Chip-Herstellungsprozessen (und jetzt auch der Verpackung) zu nutzen Skalieren Sie die Leistung in einem Sockel weiter.
Die Gabelung ist eine Art Divergenz, im wahrsten Sinne des Wortes eine Weggabelung, die den entscheidenden Unterschied ausmacht, wie Robert Frost sagen würde. Es kann Kompatibilität geben – etwa die Unterschiede zwischen großen und kleinen Kernen in den Märkten Arm, Power und jetzt auch X86. Intel und AMD werden in diesem Jahr große und kleine Kernstrategien in ihren Server-CPU-Linien implementieren, AMD in seinen „Bergamo“ Epycs und Intel in seinen „Sierra Forest“ Xeon SPs. Intel verfügt seit anderthalb Jahrzehnten über X86-kompatible Atom- und
Und wir gehen davon aus, dass der japanische CPU- und Systemhersteller Fujitsu diese Art von Fork mit seinen künftigen „Monaka“- und „Fugaku-Next“-Prozessoren machen wird, von denen ersterer kürzlich enthüllt wurde und letzterer stinkend auf den Whiteboards landete Markierungen – nun ja, es war der Beginn einer Machbarkeitsstudie des japanischen Ministeriums für Bildung, Kultur, Sport, Wissenschaft und Technologie, wobei Bildung, Kultur, Sport, Wissenschaft eine Variable X darstellte und somit die Abkürzung MEXT bildete – wieder in August 2022.
Fujitsu ist seit der Entwicklung des 1,2 Milliarden US-Dollar teuren Supercomputers „Keisuko“ K, der 2006 begann, die 10-Petaflops-Grenze im 64-Bit-Präzisions-Gleitkomma zu durchbrechen, ein enger Partner des RIKEN Lab, dem führenden HPC-Forschungszentrum des Landes Die Entwicklung des Nachfolge-Supercomputers „Fugaku“ im Wert von 910 Millionen US-Dollar und 513,9 Petaflops, bei dem Fujitsu von seiner Sparc64-Architektur auf eine benutzerdefinierte Arm-Architektur mit Vektor-Turbolader umstieg, begann im Jahr 2012. Das Fugaku-System wurde im Juni 2020 ausgeliefert, war 2021 voll betriebsbereit und die Arbeiten am Fugaku-Next-System begannen ein Jahr später, genau wie geplant.
Laut der Roadmap, die Fujitsu und RIKEN Lab letzten November auf der SC22 vorgestellt haben, ist geplant, dass die Fugaku-Next-Maschine „um das Jahr 2030“ einsatzbereit sein soll, und dieser Zeitpunkt ist wichtig (wir werden gleich darauf eingehen).
Hier sind die Forschungsideen, die in Angriff genommen werden, die in Fugaku-Next verkörperte Technologie und wer sich um sie kümmert:
Alle Ideen, die man von einer Maschine erwarten würde, die in sechs oder sieben Jahren installiert wird, sind vorhanden – eine Mischung aus traditionellem HPC und KI und der Hinzufügung von Quanten- und neuromorphem Computing. Supercomputer der Zukunft werden zweifelsohne leistungsstark sein, aber es wäre besser, sie „Flow Computing“ als „Super Computing“ zu nennen, da es eine Mischung verschiedener Arten von Berechnungen und Anwendungen geben wird, die aus Arbeitsabläufen verschiedener kleinerer Anwendungen bestehen, die zusammenarbeiten , entweder seriell oder in iterativen Schleifen.
Bezeichnenderweise legen Fujitsu und RIKEN Wert auf „Kompatibilität mit dem bestehenden Ökosystem“ und „heterogene Systeme, die durch Netzwerke mit hoher Bandbreite verbunden sind“. Fujitsu sagt weiter, dass die Architektur des Fugaku-Next-Systems neue Packungen mit hoher Dichte nutzen, über energieeffiziente und leistungsstarke Beschleuniger, geringe Latenz und Speicher mit hoher Bandbreite verfügen wird.
Wenn man sich an der Geschichte orientieren kann, und bei japanischen Supercomputern ist das durchaus der Fall, dann wird eine Maschine im Jahr vor ihrer Inbetriebnahme installiert, was bedeutet, dass Fugaku-Next „ungefähr im Jahr 2029“ installiert wird.
Denken Sie daran, wenn wir uns die „Monaka“-CPU ansehen, an der Fujitsu unter der Schirmherrschaft der New Energy and Industrial Technology Development Organization (NEDO) der japanischen Regierung arbeitet. Ende Februar wurden Fujitsu, NEC, AIO Core, Kioxia und Kyocera beauftragt, an einer energieeffizienteren Rechenzentrumsverarbeitung und -verbindung zu arbeiten. Konkret strebt die NEDO-Initiative energieeffiziente Server-CPUs und Photonik-gestützte SmartNICs an.
Im Rahmen dieser Bemühungen sieht es so aus, als würde Fujitsu ein Derivat des A64FX-Arm-Prozessors im Herzen des Fugaku-Systems herstellen, aber die Leute verwechseln dies mit der Bedeutung, dass Monaka der Nachfolgeprozessor ist, der im Fugaku-Next-System verwendet wird .
Genau das wurde gesagt: „Fujitsu wird diese Technologie weiter verfeinern und eine CPU mit geringem Stromverbrauch entwickeln, die in grünen Rechenzentren der nächsten Generation eingesetzt werden kann.“
Hier sind die Aufgaben, die den NEDO-Partnern übertragen wurden:
Die Monaka-CPU soll 2027 erscheinen und soll höhere Leistung bei geringerem Energieverbrauch bieten:
Wie dies geschehen wird, ist unklar, aber die Implikation ist, dass es sich um einen Arm-basierten Serverprozessor handeln wird, der jedoch für Hyperscaler und Cloud-Builder und nicht für HPC- und KI-Zentren optimiert ist. Das sollte mehr Kerne und weniger Vektorverarbeitung im Vergleich zum A64FX (oder besser gesagt den Kick zum A64FX im Fugaku-Next-System) und höchstwahrscheinlich die Hinzufügung von Matrix-Mathematikeinheiten mit geringer Präzision für die KI-Inferenz bedeuten. Vom Konzept her etwas Ähnliches wie Intels „Sapphire Rapids“
Tatsächlich sagt Fujitsu mit Blick auf das Jahr 2027, wenn Monaka in Produktionssysteme gehen wird, dass es in der Lage sein wird, das 1,7-fache der Anwendungsleistung und das Zweifache der Leistung pro Watt einer „Another – 2027“-CPU zu liefern, was auch immer das sein mag.
Der verwirrende Teil, der einige Leute zu der Annahme veranlasst hat, dass Monaka der Prozessor ist, der den A64FX auslöst und im Fugaku-Next-System verwendet wird, ist dieser Satz: „Er steigert nicht nur traditionelle HPC-Workloads, sondern bietet auch hohe Leistung.“ KI- und Datenanalyse-Workloads.“
Aber hier ist die Sache, auf die wir oft hinweisen: Bei HPC geht es darum, Leistung um jeden Preis zu erzielen, und Hyperscaler und Cloud-Entwickler müssen die beste, vernünftige Leistung zu den niedrigsten Kosten und dem geringsten Stromverbrauch erzielen.
Dabei handelt es sich um sehr unterschiedliche Entwurfspunkte, und obwohl Sie HPC in der Cloud erstellen können, können Sie keine Cloud erstellen, die für die Ausführung von Webanwendungen optimiert ist, und erwarten, dass sie bei HPC-Simulation und -Modellierung oder sogar bei KI-Trainings-Workloads gut abschneidet. Und umgekehrt. Ein HPC-Cluster wäre nicht für niedrige Kosten und geringen Stromverbrauch optimiert und wäre eine schlechte Wahl für Webanwendungen. Sie können echte HPC-Systeme natürlich im Rahmen eines Cloud-Modells verkaufen, indem Sie InfiniBand und Fat Nodes mit vielen GPUs in 20 Prozent der Nodes in einer Cloud einsetzen, aber es wird nie so günstig sein wie die einfache Cloud-Infrastruktur. Das hat diesen anderen Designpunkt.
Da es sich bei Fugaku-Next um einen heterogenen Supercomputer im „Flow-Computer“-Stil handelt, ist es sehr vernünftig anzunehmen, dass ein Kicker für die Monaka-Arm-CPU, der auf die Cloud-Infrastruktur abzielt, im Fugaku-Next-System enden könnte. Aber das bedeutet nicht, dass es keinen Nachfolger für den A64FX geben wird, dessen Leistung sich laut Forschern bis 2028 um das Zehnfache steigern lässt, und zwar durch enorme Mengen an gestapeltem L3-Cache und Prozessverkleinerungen auf den Arm-Kernen. Dabei gibt es keine architektonischen Verbesserungen an den A64FX-Kernen, und Sie wissen, dass es hier Optimierungen geben wird.
Wir halten es für weitaus wahrscheinlicher, dass ein Nachfolger von Monaka, den wir bei einer zweijährigen Prozessorfrequenz im Jahr 2029 erwarten würden, in Fugaku-Next enthalten sein könnte, aber die Wahrscheinlichkeit, dass es sich dabei um die einzige CPU im System handelt, ist sehr gering – es sei denn, die Spartanks und MEXT und NEDO müssen sich das Geld teilen.
Die Große Rezession brachte das ursprüngliche „Keisuko“-Projekt durcheinander, bei dem Fujitsu eine Skalar-CPU entwickelte, NEC eine Vektor-CPU und Hitachi die Torus-Verbindung, die wir heute als Tofu kennen. NEC und Fujitsu zogen sich zurück, weil das Projekt zu teuer war und sie glaubten, dass die Technologie nicht ausreichend kommerzialisiert werden könne, um die Kosten zu decken. Fujitsu hat das Projekt übernommen und brillant abgeliefert, aber wir vermuten, dass es schwierig war, mit Sparc64fx und A64FX Geld zu verdienen.
Aber mit der Unterstützung der Regierung, die Fujitsu dank seiner Beziehung zu RIKEN hat, und Japans Wunsch, unabhängig zu sein, wenn es um seinen schnellsten Supercomputer geht, spielt das keine Rolle. Was im Jahr 2009 über den Wert der Unabhängigkeit der Lieferkette zutraf (den viele Länder aus Gründen der Einfachheit und der kostengünstigeren Supercomputer ignorierten), trifft im Jahr 2029 umso mehr zu.
Fujitsu macht keine Angaben und Satoshi Matsuoka, Direktor des RIKEN Lab und Professor am Tokyo Institute of Technology, kommentierte die Berichte, dass Monaka in der Fugaku-Next-Maschine verwendet wurde, in seinem Twitter-Feed folgendermaßen: „Es wurde noch nichts entschieden, ob.“ Monaka wird #FugakuNEXT antreiben; es ist sicherlich eines der technischen Elemente, die in Betracht gezogen werden.“ Aber er fügte auch Folgendes hinzu: „Da #HPC (mit KI, BD) kein Nischenmarkt mehr ist, geht es nicht darum, eine einzelne Maschine im ***Maßstab zu schaffen, sondern um S&T-Plattformen, die sich über SCs, Clouds usw. erstrecken.“ Zu diesem Zweck sind SW-Allgemeinheit und Marktdurchdringbarkeit, insbesondere für Hyperskalare, ein Muss. Wir werden mit Anbietern zusammenarbeiten, die die gleiche Vision teilen.“
Wir gehen davon aus, dass in Fugaku-Next zwei Arm-CPUs zum Einsatz kommen werden: Eine für KI-Inferenz und generische CPU-Workloads und eine für wirklich harte HPC-Simulationen und KI-Training. Nennen Sie sie A64FX2 und Monaka2, wenn Sie möchten. Es wird nur einen Chip geben, wenn das Budget dies erfordert, so wie es bei der K-Maschine der Fall war.
Aber das ist zugegebenermaßen nur Spekulation und wir müssen abwarten.
Mit Highlights, Analysen und Geschichten der Woche direkt von uns in Ihren Posteingang, ohne dass etwas dazwischen liegt. Jetzt abonnieren