Ich versuche, etwas C++ zu optimieren (RK4) durch die Nutzung
__builtin_prefetch
Ich kann nicht herausfinden, wie eine ganze Struktur vorab abgerufen werden kann.
Ich verstehe nicht, wie viel davon const void *addr
ist gelesen. Ich möchte die nächsten Werte von haben from
und to
geladen.
for (int i = from; i < to; i++)
{
double kv = myLinks[i].kv;
particle* from = con[i].Pfrom;
particle* to = con[i].Pto;
//Prefetch values at con[i++].Pfrom & con[i].Pto;
double pos = to->px- from->px;
double delta = from->r + to->r - pos;
double k1 = axcel(kv, delta, from->mass) * dt; //axcel is an inlined function
double k2 = axcel(kv, delta + 0.5 * k1, from->mass) * dt;
double k3 = axcel(kv, delta + 0.5 * k2, from->mass) * dt;
double k4 = axcel(kv, delta + k3, from->mass) * dt;
#define likely(x) __builtin_expect((x),1)
if (likely(!from->bc))
{
from->x += (( k1 + 2 * k2 + 2 * k3 + k4) / 6);
}
}
Verknüpfung: http://www.ibm.com/developerworks/linux/library/l-gcc-hacks/
Ich glaube nicht, dass eine solche Mikrooptimierung für andere als Lernzwecke viel Sinn macht. Moderne CPUs sind sehr gut im Prefetching von selbst.
– ronag
10. Dezember 2011 um 22:59 Uhr
Wahrscheinlich, aber ich habe eine Funktion, die fast 1 Milliarde Mal aufgerufen wird.
– Michail
10. Dezember 2011 um 23:01 Uhr
Was ist “RK4”?
– Peter Mortensen
7. November 2018 um 19:25 Uhr