Warum ist nicht der gesamte Code positionsunabhängig kompiliert?

Question 1

Beim Kompilieren gemeinsam genutzter Bibliotheken in gcc kompiliert die Option -fPIC den Code positionsunabhängig. Gibt es einen Grund (Leistung oder andere), warum Sie nicht alle Codepositionen unabhängig kompilieren würden?

Question 2

Es fügt eine Indirektion hinzu. Bei positionsunabhängigem Code müssen Sie die Adresse Ihrer Funktion laden und dann dorthin springen. Normalerweise ist die Adresse der Funktion bereits im Befehlsstrom vorhanden.

Question 3

Ja, es gibt Performance-Gründe. Einige Zugriffe befinden sich effektiv unter einer anderen Indirektionsschicht, um die absolute Position im Speicher zu erhalten.

Es gibt auch die GOT (Global Offset Table), die Offsets von globalen Variablen speichert. Für mich sieht das nur wie eine IAT-Fixup-Tabelle aus, die von Wikipedia und einigen anderen Quellen als positionsabhängig eingestuft wird.

http://en.wikipedia.org/wiki/Position_independent_code

Question 4

Zusätzlich zur akzeptierten Antwort. Eine Sache, die die Leistung des PIC-Codes stark beeinträchtigt, ist das Fehlen von “IP-relativer Adressierung” auf x86. Mit “IP-relativer Adressierung” könnten Sie nach Daten fragen, die X Bytes vom aktuellen Befehlszeiger entfernt sind. Dies würde den PIC-Code viel einfacher machen.

Sprünge und Anrufe sind normalerweise EIP-bezogen, also stellen diese kein wirkliches Problem dar. Der Zugriff auf Daten erfordert jedoch ein wenig zusätzliche Trickserei. Manchmal wird ein Register vorübergehend als “Basiszeiger” für Daten reserviert, die der Code benötigt. Eine gängige Technik besteht beispielsweise darin, die Funktionsweise von Anrufen auf x86 zu missbrauchen:

call label_1
.dd 0xdeadbeef
.dd 0xfeedf00d
.dd 0x11223344
label_1:
pop ebp            ; now ebp holds the address of the first dataword
                   ; this works because the call pushes the **next**
                   ; instructions address
                   ; real code follows
mov eax, [ebp + 4] ; for example i'm accessing the '0xfeedf00d' in a PIC way

Diese und andere Techniken fügen den Datenzugriffen eine indirekte Ebene hinzu. Zum Beispiel die GOT (Global Offset Table), die von gcc-Compilern verwendet wird.

x86-64 hat einen “RIP Relative”-Modus hinzugefügt, der die Dinge a viel einfacher.

Question 5

Weil die Implementierung von vollständig positionsunabhängigem Code dem Codegenerator eine Einschränkung hinzufügt, die die Verwendung schnellerer Operationen verhindern kann, oder zusätzliche Schritte hinzufügt, um diese Einschränkung beizubehalten.

Dies könnte ein akzeptabler Kompromiss sein, um Multiprocessing ohne ein virtuelles Speichersystem zu erhalten, bei dem Sie darauf vertrauen, dass Prozesse nicht in den Speicher des anderen eindringen und möglicherweise eine bestimmte Anwendung an einer beliebigen Basisadresse laden müssen.

In vielen modernen Systemen sind die Kompromisse bei der Leistung anders, und ein verlagernder Lader ist oft weniger teuer (es kostet jedes Mal, wenn Code zum ersten Mal geladen wird) als das Beste, was ein Optimierer leisten kann, wenn er freie Hand hat. Außerdem verdeckt die Verfügbarkeit virtueller Adressräume den größten Teil der Motivation für Positionsunabhängigkeit von vornherein.

Question 6

position-independent code hat bei den meisten Architekturen einen Performance-Overhead, da ein zusätzliches Register erforderlich ist.

Dies dient also der Leistung.

Question 7

Außerdem bedeutet virtuelle Speicherhardware in den meisten modernen Prozessoren (die von den meisten modernen Betriebssystemen verwendet werden), dass viele Codes (alle User Space-Apps, abgesehen von der skurrilen Verwendung von mmap oder dergleichen) nicht positionsunabhängig sein müssen. Jedes Programm bekommt seinen eigenen Adressraum, der seiner Meinung nach bei Null beginnt.

Question 8

Heutzutage machen Betriebssystem und Compiler standardmäßig den gesamten Code als positionsunabhängigen Code. Versuchen Sie, ohne das Flag -fPIC zu kompilieren, der Code wird gut kompiliert, aber Sie erhalten nur eine Warnung. Betriebssysteme wie Windows verwenden eine Technik, die als Speicherzuordnung bezeichnet wird, um dies zu erreichen.