Es war einmal, als > schneller war als < ... Warte, was?

Question 1

ich lese ein tolles OpenGL-Tutorial. Es ist wirklich toll, vertrau mir. Das Thema, bei dem ich mich gerade befinde, ist Z-Puffer. Abgesehen von der Erklärung, worum es geht, erwähnt der Autor, dass wir benutzerdefinierte Tiefentests wie GL_LESS, GL_ALWAYS usw. durchführen können. Er erklärt auch, dass die tatsächliche Bedeutung von Tiefenwerten (was oben ist und was nicht) auch sein kann angepasst. Ich verstehe soweit. Und dann sagt der Autor etwas Unglaubliches:

Die Reichweite zNah kann größer sein als die Reichweite zFar; wenn dies der Fall ist, werden die Fensterabstandswerte umgekehrt, in Bezug darauf, was am nächsten oder am weitesten vom Betrachter entfernt ist.

Früher wurde gesagt, dass der Fensterraum-Z-Wert von 0 am nächsten und 1 am weitesten ist. Wenn jedoch unsere Clipspace-Z-Werte negiert würden, wäre die Tiefe von 1 der Ansicht am nächsten und die Tiefe von 0 am weitesten entfernt. Wenn wir jedoch die Richtung des Tiefentests umkehren (GL_LESS zu GL_GREATER usw.), erhalten wir genau das gleiche Ergebnis. Es ist also wirklich nur eine Konvention. In der Tat war das Umdrehen des Zeichens von Z und der Tiefentest einst eine wichtige Leistungsoptimierung für viele Spiele.

Wenn ich das richtig verstehe, ist das Umdrehen des Z-Zeichens und der Tiefentest leistungsmäßig nichts anderes als das Ändern von a < Vergleich zu a > Vergleich. Also, wenn ich das richtig verstehe und der Autor nicht lügt oder Dinge erfindet, dann ändert er sich < zu > früher war eine wichtige Optimierung für viele Spiele.

Hat sich der Autor etwas ausgedacht, habe ich etwas falsch verstanden, oder ist das tatsächlich einmal so < war langsamer (lebenswichtigwie der Autor sagt) als >?

Vielen Dank für die Klärung dieser ziemlich merkwürdigen Angelegenheit!

_{Haftungsausschluss: Mir ist vollkommen bewusst, dass die Komplexität von Algorithmen die Hauptquelle für Optimierungen ist. Außerdem vermute ich, dass es heutzutage definitiv keinen Unterschied machen würde, und ich frage dies nicht, um irgendetwas zu optimieren. Ich bin nur extrem, schmerzhaft, vielleicht unerschwinglich neugierig.}

Question 2

Wenn ich das richtig verstehe, ist das Umdrehen des Z-Zeichens und des Tiefentests nichts anderes als das Ändern eines <-Vergleichs in einen >-Vergleich. Also, wenn ich das richtig verstehe und der Autor nicht lügt oder etwas erfindet, dann war das Ändern von < zu > früher eine wichtige Optimierung für viele Spiele.

Ich habe das nicht besonders gut erklärt, weil es nicht wichtig war. Ich hatte nur das Gefühl, dass es eine interessante Trivia war, die ich hinzufügen konnte. Ich wollte nicht speziell auf den Algorithmus eingehen.

Der Kontext ist jedoch entscheidend. Ich habe nie gesagt, dass ein <-Vergleich schneller ist als ein >-Vergleich. Denken Sie daran: Wir sprechen von Tiefentests der Grafikhardware, nicht von Ihrer CPU. Nicht operator<.

Worauf ich mich bezog, war eine bestimmte alte Optimierung, bei der Sie einen Frame verwenden würden GL_LESS mit einer Reihe von [0, 0.5]. Nächstes Bild, mit dem Sie rendern GL_GREATER mit einer Reihe von [1.0, 0.5]. Sie gehen hin und her und “drehen buchstäblich das Zeichen von Z und den Tiefentest um” bei jedem Frame.

Dadurch geht ein bisschen Tiefenpräzision verloren, aber Sie mussten den Tiefenpuffer nicht löschen, was früher eine ziemlich langsame Operation war. Da die Tiefenreinigung heutzutage nicht nur kostenlos, sondern sogar schneller als diese Technik ist, wird sie nicht mehr angewendet.

Question 3

Die Antwort ist mit ziemlicher Sicherheit, dass für welche Inkarnation von Chip + Treiber auch immer das hierarchische Z nur in eine Richtung funktionierte – dies war damals ein ziemlich häufiges Problem. Low-Level-Assemblierung/Verzweigung hat damit nichts zu tun – Z-Pufferung erfolgt in Hardware mit fester Funktion und wird in Pipelines geleitet – es gibt keine Spekulation und daher keine Verzweigungsvorhersage.

Question 4

Es hat mit Flag-Bits in hoch abgestimmter Anordnung zu tun.

x86 hat sowohl jl- als auch jg-Anweisungen, aber die meisten RISC-Prozessoren haben nur jl und jz (kein jg).