i++ weniger effizient als ++i, wie kann man das zeigen?

Question 1

Ich versuche an einem Beispiel zu zeigen, dass das Präfixinkrement effizienter ist als das Postfixinkrement.

Theoretisch ist dies sinnvoll: i++ muss in der Lage sein, den nicht inkrementierten Originalwert zurückzugeben und daher zu speichern, während ++i den inkrementierten Wert zurückgeben kann, ohne den vorherigen Wert zu speichern.

Aber gibt es ein gutes Beispiel, um dies in der Praxis zu zeigen?

Ich habe folgenden Code probiert:

int array[100];

int main()
{
  for(int i = 0; i < sizeof(array)/sizeof(*array); i++)
    array[i] = 1;
}

Ich habe es mit gcc 4.4.0 wie folgt kompiliert:

gcc -Wa,-adhls -O0 myfile.cpp

Ich habe dies erneut getan, wobei das Postfix-Inkrement in ein Präfix-Inkrement geändert wurde:

for(int i = 0; i < sizeof(array)/sizeof(*array); ++i)

Das Ergebnis ist in beiden Fällen identischer Assemblercode.

Dies war etwas unerwartet. Es schien so, als ob ich durch das Ausschalten der Optimierungen (mit -O0) einen Unterschied sehen sollte, um das Konzept zu zeigen. Was vermisse ich? Gibt es ein besseres Beispiel, um dies zu zeigen?

Question 2

Im Allgemeines In diesem Fall führt das Post-Inkrement zu einer Kopie, bei der ein Pre-Increment dies nicht tut. Natürlich wird dies in vielen Fällen wegoptimiert und in den Fällen, in denen dies nicht der Fall ist, wird der Kopiervorgang vernachlässigbar sein (zB für eingebaute Typen).

Hier ist ein kleines Beispiel, das die potenzielle Ineffizienz der Post-Inkrementierung zeigt.

#include <stdio.h>

class foo 
{

public:
    int x;

    foo() : x(0) { 
        printf( "construct foo()n"); 
    };

    foo( foo const& other) { 
        printf( "copy foo()n"); 
        x = other.x; 
    };

    foo& operator=( foo const& rhs) { 
        printf( "assign foo()n"); 
        x = rhs.x;
        return *this; 
    };

    foo& operator++() { 
        printf( "preincrement foon"); 
        ++x; 
        return *this; 
    };

    foo operator++( int) { 
        printf( "postincrement foon"); 
        foo temp( *this);
        ++x;
        return temp; 
    };

};


int main()
{
    foo bar;

    printf( "n" "preinc example: n");
    ++bar;

    printf( "n" "postinc example: n");
    bar++;
}

Die Ergebnisse eines optimierten Builds (der im Post-Increment-Fall aufgrund von RVO tatsächlich einen zweiten Kopiervorgang entfernt):

construct foo()

preinc example: 
preincrement foo

postinc example: 
postincrement foo
copy foo()

Im Allgemeinen, wenn Sie die Semantik des Post-Inkrement nicht benötigen, warum gehen Sie dann das Risiko ein, dass eine unnötige Kopie auftritt?

Natürlich ist es gut zu bedenken, dass ein benutzerdefinierter Operator++() – entweder die Pre- oder die Post-Variante – zurückgeben kann, was immer er will (oder sogar tun, was er will), und ich kann mir vorstellen, dass es einige gibt die nicht den üblichen Regeln folgen. Gelegentlich bin ich auf Implementierungen gestoßen, die “void“, wodurch der übliche semantische Unterschied verschwindet.

Question 3

Bei Ganzzahlen werden Sie keinen Unterschied sehen. Sie müssen Iteratoren oder etwas verwenden, bei dem Post und Präfix wirklich etwas anderes tun. Und Sie müssen alle Optimierungen drehen an, nicht aus!

Question 4

Ich folge gerne der Regel “Sag, was du meinst”.

++i einfach inkrementiert. i++ Schritte und hat ein besonderes, nicht intuitives Bewertungsergebnis. ich benutze nur i++ wenn ich dieses Verhalten ausdrücklich will und verwende ++i in allen anderen Fällen. Wenn Sie diese Praxis befolgen, wenn Sie sehen, i++ im Code ist es offensichtlich, dass das Verhalten nach dem Inkrementieren wirklich beabsichtigt war.

Question 5

Dieser Code und seine Kommentare sollten die Unterschiede zwischen den beiden veranschaulichen.

class a {
    int index;
    some_ridiculously_big_type big;

    //etc...

};

// prefix ++a
void operator++ (a& _a) {
    ++_a.index
}

// postfix a++
void operator++ (a& _a, int b) {
    _a.index++;
}

// now the program
int main (void) {
    a my_a;

    // prefix:
    // 1. updates my_a.index
    // 2. copies my_a.index to b
    int b = (++my_a).index; 

    // postfix
    // 1. creates a copy of my_a, including the *big* member.
    // 2. updates my_a.index
    // 3. copies index out of the **copy** of my_a that was created in step 1
    int c = (my_a++).index; 
}

Sie können sehen, dass das Postfix einen zusätzlichen Schritt (Schritt 1) hat, der das Erstellen eines Kopieren des Objekts. Dies hat sowohl Auswirkungen auf den Speicherverbrauch als auch auf die Laufzeit. Dass Deshalb ist Präfix effizienter als Postfix für Nicht-Grundkenntnisse Typen.

Es hängt davon ab some_ridiculously_big_type Und auch bei allem, was Sie mit dem Ergebnis der Erhöhung tun, können Sie den Unterschied mit oder ohne Optimierungen sehen.

Question 6

Als Antwort auf Mihail ist dies eine etwas portablere Version seines Codes:

#include <cstdio>
#include <ctime>
using namespace std;

#define SOME_BIG_CONSTANT 100000000
#define OUTER 40
int main( int argc, char * argv[] ) {

    int d = 0;
    time_t now = time(0);
    if ( argc == 1 ) {
        for ( int n = 0; n < OUTER; n++ ) {
            int i = 0;
            while(i < SOME_BIG_CONSTANT) {
                d += i++;
            }
        }
    }
    else {
        for ( int n = 0; n < OUTER; n++ ) {
            int i = 0;
            while(i < SOME_BIG_CONSTANT) {
                d += ++i;
            }
        }
    }
    int t = time(0) - now;  
    printf( "%dn", t );
    return d % 2;
}

Die äußeren Schleifen sind dazu da, es mir zu ermöglichen, am Timing herumzufummeln, um etwas Passendes auf meiner Plattform zu finden.

Ich verwende VC++ nicht mehr, also habe ich es (unter Windows) kompiliert mit:

g++ -O3 t.cpp

Ich habe es dann abwechselnd ausgeführt:

a.exe

und

a.exe 1

Meine Timing-Ergebnisse waren in beiden Fällen ungefähr gleich. Manchmal wäre eine Version um bis zu 20 % schneller und manchmal die andere. Ich würde vermuten, dass dies auf andere Prozesse zurückzuführen ist, die auf meinem System ausgeführt werden.

Question 7

Versuchen Sie, while zu verwenden oder etwas mit dem zurückgegebenen Wert zu tun, zB:

#define SOME_BIG_CONSTANT 1000000000

int _tmain(int argc, _TCHAR* argv[])
{
    int i = 1;
    int d = 0;

    DWORD d1 = GetTickCount();
    while(i < SOME_BIG_CONSTANT + 1)
    {
        d += i++;
    }
    DWORD t1 = GetTickCount() - d1;

    printf("%d", d);
    printf("ni++ > %d <n", t1);

    i = 0;
    d = 0;

    d1 = GetTickCount();
    while(i < SOME_BIG_CONSTANT)
    {
        d += ++i;

    }
    t1 = GetTickCount() - d1;

    printf("%d", d);
    printf("n++i > %d <n", t1);

    return 0;
}

Kompiliert mit VS 2005 mit /O2 oder /Ox, auf meinem Desktop und Laptop ausprobiert.

Auf dem Laptop stabil herumkommen, auf dem Desktop sind die Zahlen etwas anders (aber die Rate ist ungefähr gleich):

i++ > 8xx < 
++i > 6xx <

xx bedeutet, dass die Zahlen unterschiedlich sind, z. B. 813 vs. 640 – immer noch etwa 20% schneller.

Und noch ein Punkt – wenn Sie “d +=” durch “d = ” ersetzen, sehen Sie einen schönen Optimierungstrick:

i++ > 935 <
++i > 0 <

Es ist jedoch ziemlich spezifisch. Aber schließlich sehe ich keinen Grund, meine Meinung zu ändern und denke, es gibt keinen Unterschied 🙂

Question 8

Vielleicht könnten Sie nur den theoretischen Unterschied zeigen, indem Sie beide Versionen mit x86-Montageanleitungen schreiben? Wie viele Leute schon früher darauf hingewiesen haben, trifft der Compiler immer seine eigenen Entscheidungen darüber, wie das Programm am besten kompiliert/assembliert wird.

Wenn das Beispiel für Studenten gedacht ist, die mit dem x86-Befehlssatz nicht vertraut sind, könnten Sie die Verwendung des MIPS32-Befehlssatzes in Betracht ziehen – aus irgendeinem seltsamen Grund scheinen viele Leute ihn leichter zu verstehen als x86-Assembly zu finden.