Verzweigungsvorhersage auf einem Funktionszeiger

Question 1

Ich habe eine Schleife, die immer und immer wieder läuft. Die Logik innerhalb dieser Schleife hängt vom Modus ab, in dem sich das Programm befindet. Um die Leistung zu verbessern, dachte ich, dass ein Array von Funktionszeigern initialisiert werden kann, functionPtr[], das würde also nur functionPtrmode aufrufen, das die richtige Logik ausführt. Die Schleife bleibt für viele Zyklen im selben Modus (die Anzahl ist im Voraus unbekannt, aber viele Tausend). Das Programm läuft nur auf einem Intel x64-Rechner und benötigt keine Portabilität.

Ich hatte gehofft, dass die CPU die Verzweigungsvorhersage verwenden würde, aber da meine Verzweigung nicht bedingt ist (auf Assemblyebene), hängt die Position der Verzweigung jedoch von einer Variablen ab (functionPtr+mode). Wird die CPU versuchen, functionPtr+mode zu berechnen und diese Anweisungen in die Pipeline zu ziehen?

Question 2

Aus Die Mikroarchitektur von Intel-, AMD- und VIA-CPUs Ein Optimierungsleitfaden für Assembler-Programmierer und Compiler-Hersteller

http://www.agner.org/optimize/microarchitecture.pdf

Abschnitt 3.7 (für Sandy Bridge, andere Prozessoren befinden sich in anderen Abschnitten) Mustererkennung für indirekte Sprünge und Aufrufe Indirekte Sprünge und indirekte Aufrufe (aber keine Rückkehr) werden unter Verwendung desselben zweistufigen Prädiktors wie Verzweigungsbefehle vorhergesagt.

Ein Zeiger auf eine Funktion ist ein indirekter Aufruf.

Question 3

Ja, relativ neue Prozessoren können (zumindest so etwas wie) eine Verzweigungsvorhersage für indirekte Sprünge durchführen.

Vom Pentium (Intels erstem, der Verzweigungsvorhersagen durchführte) bis zu den ersten Pentium IVs wurde für indirekte Verzweigungen nur der Verzweigungszielpuffer (BTB) verwendet. Dies bedeutete, dass sie solche Verzweigungen korrekt “vorhergesagt” haben, wenn (und nur wenn) das Ziel genau identisch mit dem vorherigen Ziel war – was für Ihren Fall angemessen klingt.

Beginnend mit dem Pentium M/Prescott (dem letzten Pentium IV) verbesserte Intel die Verzweigungsvorhersage für indirekte Sprünge, um einen zweistufigen adaptiven Prädiktor zu verwenden. Wenn ich Ihre Frage richtig verstehe (dh Ihre Schleife wird für viele aufeinanderfolgende Iterationen mit demselben Ziel ausgeführt, und das ist es, was Sie interessiert), wäre sogar nur das BTB für Ihre Zwecke ausreichend. Der zweistufige Prädiktor würde nützlicher, wenn Sie (zum Beispiel) auf dem niedrigstwertigen Bit aufeinanderfolgender Zahlen verzweigen würden, sodass Sie ein vorhersagbares Muster des Springens zu einem Ziel in einer Iteration und zum anderen in der nächsten Iteration hätten. Bei einem Muster wie diesem würde der BTB allein die Verzweigung immer falsch vorhersagen, aber der zweistufige Prädiktor in einem aktuellen Prozessor würde korrekt vorhersagen (nach den ersten paar Iterationen, damit das Muster erkannt werden könnte).

Question 4

Die Verzweigungsvorhersage ist für tatsächliche Verzweigungen, bei denen wir bis zur Auswertung der Verzweigung nicht wissen, was angibt, welche der Anweisungen als nächstes ausgeführt werden soll. Aber da in Ihrem Code die nächste Anweisung je nach Modus bekannt ist, in dem wir uns befinden, ist keine Vorhersage erforderlich, und es wird auch kein Warten in der Pipeline geben.

Da zwischen Moduswechsel und Befehlsoptionen genügend Zeit vergeht, ruft die Pipeline jedes Mal ohne zusätzlichen Aufwand erfolgreich den richtigen Befehl ab.