Der Power5-Prozessor von IBM ist einen zweiten Blick wert

Wenn alle Dinge gleich wären und IBM seine Systeme so zugänglich machen würde wie Dell und Hewlett-Packard, könnte der IBM Power5-Prozessor Intels Itanium 2 begraben. Der im letzten Sommer erstmals vorgestellte Power5 ist ein Doppelschlag, ein Triumph der Technik Ein Unternehmen, das sich nicht nur im Prozessordesign, sondern auch in der Submikron-Wissenschaft der Chipherstellung und -verpackung auszeichnet.

Der Power5 ist natürlich sehr schnell. Es kann aber auch als der erste ernsthafte Versuch von IBM angesehen werden, die Kundenanforderungen über die Geschwindigkeit hinaus zu erfüllen. Der Power5 bietet eine verbesserte Energieeffizienz und hervorragende Skalierbarkeit, unterstützt Nicht-IBM-Betriebssysteme (einschließlich Linux und Windows) und bietet Partitionierung und Virtualisierung, die von der aktuellen Intel-Technologie nicht erreicht werden.

Der Power5 weist außerdem auf eine neue Generation von 64-Bit-PowerPC-basierten Workstations und -Servern des langjährigen IBM-Partners in Power, Apple Computer, hin. Und IBM hat kürzlich einen unerwarteten Schritt für ein auf Patenten basierendes Unternehmen unternommen, indem die Power-Architektur und -Tools unter einer offenen Lizenz veröffentlicht wurden.

Es gibt so viele Möglichkeiten, wie der Einfluss von Power5 über die primäre Basis gut betuchter Kunden von IBM hinausgeht. Obwohl IBM auch Itanium 2-, Opteron- und Xeon-Server verkauft, scheint das Unternehmen eindeutig darauf bedacht zu sein, Power5-Systeme in die Hände von Linux- und Windows-Administratoren zu legen. Ob dies sinnvoll ist, liegt bei den Kunden, aber die technischen Fähigkeiten von Power5 und das schwankende Schicksal der Itanium-Architektur erfordern, dass der Flaggschiff-Prozessor von IBM eine Reise unter die Lupe nimmt.

Machtgeheimnisse

IBM hat durchweg die klügsten Köpfe angezogen, die Art von Ingenieuren, die den Spitznamen "Informatiker" verdienen. In den 1980er Jahren entwickelten diese Wissenschaftler eine Prozessorarchitektur, die auf Leistung ausgelegt war: den IBM 801, den ursprünglichen RISC-Prozessor. Das Erbe des 801 lebt in der IBM Power-Serie von Prozessoren der Enterprise-Klasse weiter.

Der Hauptunterschied zwischen einem RISC-Prozessor und einem CISC-Prozessor wie Intels x86 kann als Tauziehen zwischen Programmierern und Chipdesignern angesehen werden. CISC-Prozessoren sollen das Leben von Anwendungsentwicklern erleichtern, indem sie allgemeine Vorgänge auf einzelne native Anweisungen mit langer Ausführung reduzieren und CISC den Ruf eines langsamen, aber benutzerfreundlichen Designs verleihen. In diesem Licht ist RISC schnell und unfreundlich. Jede seiner einfachen Anweisungen dient einem sehr engen Zweck, wird schnell ausgeführt und parallelisiert außergewöhnlich gut. RISC erfordert geduldige, begabte Programmierer und sorgfältig optimierte Compiler. Der Erfolg von RISC zeugt von einer Fülle von beidem.

Das bekannteste Power5-Attribut ist die Integration von zwei diskreten RISC-Kernen auf einem einzigen Chip. Ankündigungen von AMD, Intel und Sun Microsystems zu kommenden Multicore-Prozessoren konzentrierten sich auf diesen Aspekt von Power5, aber Multicore war auch ein Merkmal seiner Vorgänger Power4 und Power4 +. Laut IBM ist Power5 vollständig mit ausführbaren Power4-Dateien kompatibel. Das Wunder von Multicore ist, dass es den Wunsch nach mehr Geschwindigkeit auf weniger Raum ohne einen deutlichen Anstieg der Wärme erfüllt. Aber wie Sie sehen werden, ist Multicore nicht einfach SMP auf einem Chip.

Zum einen teilen sich die Power5-Kerne einen sehr schnellen Level 2-Cache. Die Geschwindigkeit und Menge des Caches ist ein Faktor für die Leistung aller Mikroprozessoren. (Die Entwicklung des x86 zeigt, dass Intel absolut vom Cache besessen ist.) Da einfache Anweisungen so schnell durch eine RISC-CPU fliegen, wird die Effizienz des Caches bei der Reduzierung der Anzahl der RAM-Fahrten zum Schlüssel für das gesamte Design.

Der Level 2-Cache des Power5 beläuft sich auf knapp 2 MB. Bei einem gemeinsam genutzten Cache stehen die von einem Kern abgerufenen Daten dem anderen sofort zur Verfügung, wodurch sich die Wahrscheinlichkeit erhöht, dass beim Abrufen des nächsten Programmbefehls oder Datenblocks kein Zugriff auf den leistungsmindernden RAM erforderlich ist. Der gemeinsam genutzte Cache erhöht jedoch auch die Wahrscheinlichkeit, dass die Kerne gleichzeitig versuchen, auf den Cache zuzugreifen, was sie nicht können.

IBM hat eine Notlösung für Cache-Konflikte implementiert und den Level 2-Cache in drei Segmente aufgeteilt. Dieses Design ermöglicht den quasi gleichzeitigen Zugriff auf den Cache, solange beide Kerne unterschiedliche Cache-Segmente treffen. IBM hat eine weitere kreative Lösung für das Problem mit Level 2-Cache-Konflikten: einen schwerfälligen externen Level 3-Cache mit 36 ​​MB. Jeder Kern besitzt ausschließlich seinen Level 3-Cache, sodass keine Möglichkeit für Konflikte zwischen Kernen besteht. Obwohl Level 3-Cache nicht annähernd so schnell wie Level 2 ist, ist Level 3 viel schneller als der Hauptspeicher, und das Design von Power5 macht die Verbindung zwischen seinem Kern und dem zugehörigen Level 3-Cache zu einer direkten Verbindung. Wir betrachten die Überarbeitung des Level 3-Cache-Designs durch IBM als einen der Top-Design-Erfolge in Power5.

Ein weiterer wesentlicher Power5-Gewinn sind die On-Chip-Speichercontroller. Jeder Power5-Kern verfügt über einen eigenen Controller und kann einen dedizierten Block des Hauptspeichers verwalten. Dies hat einen großen Einfluss auf die Gesamtleistung, wie wir beispielsweise beim Vergleich des Speicherdurchsatzes von Opteron und Xeon gesehen haben. Im Fall von Power5 passt das Design zur Strategie von IBM zur mehrstufigen Parallelisierung.

Zwei sind nicht genug

Power5 ist nicht nur Dual-Core. Es implementiert die SMT-Funktion (Simultaneous Multi-Threading) von Power4, mit der jeder Kern unter bestimmten Bedingungen Anweisungen von zwei Threads gleichzeitig ausführen kann. SMT ähnelt Intels HTT (Hyper-Threading-Technologie), bietet jedoch deutliche Vorteile, die „bestimmte Bedingungen“ erweitern und die Parallelisierung dynamisch optimieren, indem Threads analysiert und priorisiert werden, um die parallele Ausführung effizienter zu gestalten - unserer Meinung nach viel effizienter. Obwohl es schwierig ist, sich beim Testen zu isolieren, sollte die Implementierung von Power5 den maximalen Anstieg von 30 Prozent übertreffen, den Intel für HTT projiziert.

Power5 fügt zwei grundlegende, aber dringend benötigte Thread-Priorisierungsschemata hinzu. Dynamic Resource Balancing versucht, den reibungslosen Ablauf von Anweisungsströmen aufrechtzuerhalten, indem das Verhalten von Threads analysiert und Code, der einen SMT-Stream verlangsamen könnte, aus dem Verkehr gezogen wird. Beispielsweise können Anweisungen, die nacheinander ausgeführt werden müssen, um ein genaues Ergebnis abzuleiten, diesen Thread für einige Zeit im Prozessor sperren. Power5 versucht dies vorherzusagen und einfachere Anweisungen auszuführen, bis Platz zum Ausführen der Sequenz vorhanden ist, ohne SMT zu verstopfen.

Die anpassbare Thread-Priorität von Power5 bietet Betriebssystemen, Treibern und Anwendungen die Möglichkeit, jedem Thread eine beliebige Prioritätsstufe zuzuweisen. Diese anwendungsdefinierte Thread-Priorität wird in die Berechnungen des dynamischen Ressourcenausgleichs einbezogen und allgemeiner verwendet, um zu bestimmen, wie lange ein Thread in der CPU aktiv bleibt. Außerdem können Betriebssysteme auf einfache Weise die Energieeinsparung steuern.

Wenn viele Threads mit hoher Priorität ausgeführt werden, wird die Box heiß ausgeführt. Wenn das Betriebssystem jedoch die Thread-Prioritäten senkt, führt die CPU mehr Leerlaufzyklen aus und läuft daher kühler. Wenn Sie alle Thread-Prioritäten auf die niedrigste Stufe senken, wechselt die CPU in einen ärmellosen Energiesparmodus. Das ist der einfachste Ansatz für das Power Management, den wir uns vorstellen können.

Schließlich verwendet Power5 das, was es über die von jedem RISC-Befehl benötigten Funktionen weiß, um im Wesentlichen Teile des Chips herunterzufahren, die zu diesem Zeitpunkt nicht benötigt werden. Dies bringt möglicherweise einen neuen Dreh in die berüchtigten Strom- und Wärmeprobleme von Power. Es scheint sicherlich einfacher zu sein als betriebssystemgesteuerte Energieverwaltungsschemata, wie sie von x86-Prozessoren verwendet werden.

Sie werden es vielleicht nie bemerken

Power5 ist allein in Bezug auf die Technologie in der Lage zu regieren. Aber unglaublich, wie es den vielen Itanium 2-Skeptikern erscheinen mag, mit denen sie ihre Meinung teilenDie Mehrheit der Beobachter hat den Itanium 2 / Power5-Wettbewerb bereits zu Gunsten von Intel ausgeschrieben.

Das ist eine merkwürdige Einschätzung, denn in diesem Fall zieht IBM einen Intel auf Intel. RISC besitzt den Unix-Markt, Unix besitzt den Midrange- bis High-End-Markt und Intel macht kein RISC. Es ist draußen in der Kälte auf diesen millionenschweren, eisernen Bestellungen. Intel ist effektiv gesperrt, es sei denn, es kann Käufer davon überzeugen, dass Itanium 2 RISC überholt. Wird Intel einbrechen können? Wir glauben, dass es Jahre dauern wird, bis das Itanium RISC beiseite schiebt, und während es einbricht, werden sich Power und Sparc weiterentwickeln.

Was es schwierig macht, dies zu nennen, ist, dass IBM den Intel-Markt genauso will wie Intel den von IBM. IBM verkauft Power5-Server für 5.000 US-Dollar mit vorinstalliertem Linux. Gehen Sie zurück und scannen Sie die technischen Daten, um zu verstehen, warum ein Power5-Server im Wert von 5.000 US-Dollar möglicherweise hilfreich ist.

Analysten, die Grundsteine ​​für Power setzen, stellen fest, dass das Chipgeschäft von IBM kein Geld verdient. Aber das Systemgeschäft ist es, und jetzt sind diese beiden Einheiten eins. Das ist ein kluger Schachzug: Machen Sie Chips für Systeme, die Sie verkaufen. Bauen Sie Systeme um die Chips, die Sie herstellen. Das Design und die Tools der Öffentlichkeit zugänglich zu machen, ist ebenfalls klug. Jeder offene Lizenznehmer ist ein potenzieller Fertigungskunde, und unbelastetes geistiges Eigentum wird von Genies einfließen, die nicht auf der Gehaltsliste von IBM stehen.

Dies sind gute Strategien, um sich an den Markteintritt zu gewöhnen. Wenn IBM sich nur nicht um Kunden kümmern müsste. Big Blue war noch nie in der Lage, dem unteren Ende seines Katalogs die Markenpolitur und das Kundenvertrauen zu verleihen, die Dell und HP in den Schatten stellen. Die großartige Arbeit der IBM-Ingenieure ist auf das schlechte Marketing des Unternehmens zurückzuführen. Wenn Sie jetzt keine IBM-Ausrüstung verwenden, werden Sie höchstwahrscheinlich nie einen Power5-Server in Betracht ziehen, unabhängig vom Preis.

IBM hat den Erfolg von Power5 absichtlich auf Linux für Einsteiger übertragen. Es ist jedoch schwierig, Mehrwert aus Software zu ziehen, von der die Öffentlichkeit glaubt, dass sie kostenlos heruntergeladen werden kann, und Linux ist ein Betriebssystem, für das Käufer keine neue Hardware kaufen, um es auszuführen. Mit anderen Worten, Linux verkauft keine Power5-Einstiegsserver. Mit 5.000 bis 6.000 US-Dollar ist der kostengünstigste Power5-Server von IBM im Vergleich zu einem spottbilligen Opteron- oder Xeon EM64T-Server (Extended Memory 64 Technology) unter Linux nicht billig genug.

Auf der anderen Seite verkauft sich großes Unix-Eisen von selbst, und Kunden kaufen immer mehr von dem, was sie bereits verwenden. Sie kaufen, was ihre Lösungsberater empfehlen. IBM übertrifft alle anderen in seiner Fähigkeit, sich über Großkunden hinwegzusetzen. Sie können einen Kunden nicht im mittleren Bereich von der IBM-Hardware lösen. Die Gesamtbotschaft zu Power5 wird also für die Presse und die breite Öffentlichkeit verstümmelt, aber die Anzüge vor Ort umgehen das Marketing von IBM. In IBM-zu-Kunden-Beziehungen können Sie IBM nicht schlagen.

Power5 bietet nahezu alles: Geschwindigkeit, Einfachheit, Innovation, nahtlose Abwärtskompatibilität, ein ausgereiftes Entwicklungs-Toolset und die Unterstützung eines Technologieriesen. Es ist eine konkurrenzlose technische Leistung, die von den vielleicht klügsten Ingenieuren der Welt geschaffen wurde. Wenn das Marketing von IBM jemals der Intelligenz seiner Technik entspricht, achten Sie darauf, Intel.