C flüchtige Variablen und Cache-Speicher

Question 1

Der Cache wird von der Cache-Hardware transparent für den Prozessor gesteuert. Wenn wir also flüchtige Variablen im C-Programm verwenden, wie wird garantiert, dass mein Programm jedes Mal Daten von der tatsächlich angegebenen Speicheradresse liest, aber nicht vom Cache?

Mein Verständnis ist, dass

Das Schlüsselwort Volatile teilt dem Compiler mit, dass die Variablenreferenzen nicht optimiert und wie im Code programmiert gelesen werden sollten.
Der Cache wird transparent von der Cache-Hardware gesteuert. Wenn der Prozessor eine Adresse ausgibt, weiß er daher nicht, ob die Daten aus dem Cache oder dem Speicher stammen.

Wenn ich also jedes Mal eine Speicheradresse lesen muss, wie kann ich sicherstellen, dass sie nicht vom Cache, sondern von der erforderlichen Adresse stammt?

Irgendwie passen diese beiden Konzepte nicht gut zusammen. Bitte klären Sie, wie es gemacht wird.

(Stellen Sie sich vor, wir haben eine Write-Back-Richtlinie im Cache (falls für die Analyse des Problems erforderlich))

Danke Microkernel 🙂

Question 2

Firmware-Entwickler hier. Dies ist ein Standardproblem in der Embedded-Programmierung und eines, das viele (selbst sehr erfahrene) Entwickler ins Straucheln bringt.

Ich gehe davon aus, dass Sie versuchen, auf ein Hardwareregister zuzugreifen, und dass sich dieser Registerwert im Laufe der Zeit ändern kann (sei es Interrupt-Status, Timer, GPIO-Anzeigen usw.).

Das volatile Schlüsselwort ist nur ein Teil der Lösung und in vielen Fällen möglicherweise nicht erforderlich. Dadurch wird die Variable erneut gelesen Erinnerung jedes Mal, wenn es verwendet wird (im Gegensatz zu einer Optimierung durch den Compiler oder einer Speicherung in einem Prozessorregister über mehrere Verwendungen hinweg), aber ob die “Erinnerung” gelesen wird, ist ein tatsächliches Hardwareregister im Gegensatz zu einem zwischengespeicherten Speicherort, der Ihrem Code unbekannt ist und von dem nicht beeinflusst wird volatile Stichwort. Wenn Ihre Funktion das Register nur einmal liest, können Sie wahrscheinlich aufhören volatileaber als allgemeine Regel schlage ich vor, dass die meisten Hardware-Register als definiert werden sollten volatile.

Das größere Problem ist das Caching und die Cache-Kohärenz. Der einfachste Ansatz besteht hier darin, sicherzustellen, dass sich Ihr Register im nicht zwischengespeicherten Adressraum befindet. Das bedeutet, dass Sie bei jedem Zugriff auf das Register garantiert das tatsächliche Hardwareregister und nicht den Cache-Speicher lesen / schreiben. Ein komplexerer, aber möglicherweise leistungsstärkerer Ansatz besteht darin, zwischengespeicherten Adressraum zu verwenden und Ihren Code Cache-Updates für bestimmte Situationen wie diese manuell zu erzwingen. Wie dies bewerkstelligt wird, ist für beide Ansätze architekturabhängig und geht über den Rahmen der Frage hinaus. Es könnte MTRRs (für x86), MMU, Seitentabellenänderungen usw. beinhalten.

Ich hoffe, das hilft. Wenn ich etwas verpasst habe, lassen Sie es mich wissen und ich werde meine Antwort erweitern.

Question 3

Aus Ihrer Frage geht ein Missverständnis Ihrerseits hervor.
Volatile Das Schlüsselwort bezieht sich nicht auf den Cache, wie Sie ihn beschreiben.

Beim Stichwort volatile für eine Variable angegeben ist, gibt dies dem Compiler einen Hinweis, bestimmte Optimierungen nicht vorzunehmen, da sich diese Variable von anderen Teilen des Programms unerwartet ändern kann.

Gemeint ist hier, dass der Compiler den Wert nicht wiederverwenden soll bereits in ein Register geladenaber greifen Sie erneut auf den Speicher zu, da nicht garantiert ist, dass der Wert im Register mit dem im Speicher gespeicherten Wert übereinstimmt.

Der Rest bezüglich des Cache-Speichers ist nicht direkt mit dem Programmierer verbunden.

Ich meine, die Synchronisierung eines beliebigen Cache-Speichers der CPU mit dem RAM ist ein ganz anderes Thema.

Question 4

Mein Vorschlag ist, die Seite vom virtuellen Speichermanager als nicht zwischengespeichert zu markieren.
Unter Windows erfolgt dies über die Einstellung PAGE_NOCACHE beim Anrufen VirtualProtect.

Für einen etwas anderen Zweck, die SSE2-Anweisungen habe den _mm_stream_xyz Anweisungen zur Vermeidung von Cache-Verschmutzung, obwohl ich glaube, dass sie hier nicht auf Ihren Fall zutreffen.

In beiden Fällen gibt es keine tragbar Art, in C zu tun, was Sie wollen; Sie müssen die Betriebssystemfunktionalität verwenden.

Question 5

Wikipedia hat einen ziemlich guten Artikel über MTRR (Memory Type Range Registers) die für die x86-CPU-Familie gelten.

Zusammenfassend lässt sich sagen, dass ab dem Pentium Pro von Intel (und von AMD kopiert) diese MTR-Register vorhanden waren, die ungecachte, Write-Through-, Write-Combining-, Write-Protect- oder Write-Back-Attribute für Speicherbereiche setzen konnten.

Beginnend mit dem Pentium III, aber meines Wissens nur mit 64-Bit-Prozessoren wirklich nützlich, berücksichtigen sie die MTRRs, können jedoch durch die Seitenattributtabellen überschrieben werden, mit denen die CPU einen Speichertyp für jede Speicherseite festlegen kann.

Eine Hauptverwendung der MTRRs, die ich kenne, ist Grafik-RAM. Es ist viel effizienter, es als Write-Combining zu markieren. Dadurch kann der Cache die Schreibvorgänge speichern und alle Schreibreihenfolgeregeln des Speichers werden gelockert, um Burst-Schreibvorgänge mit sehr hoher Geschwindigkeit auf einer Grafikkarte zu ermöglichen.

Aber für Ihre Zwecke möchten Sie entweder eine MTRR- oder eine PAT-Einstellung von entweder ungecacht oder Write-Through.

Question 6

Wie Sie sagen, ist der Cache für den Programmierer transparent. Das System garantiert, dass Sie immer den zuletzt geschriebenen Wert sehen, wenn Sie auf ein Objekt über dessen Adresse zugreifen. Das “einzige”, was Ihnen passieren kann, wenn sich ein veralteter Wert in Ihrem Cache befindet, ist eine Laufzeitstrafe.

Question 7

volatile stellt sicher, dass Daten jedes Mal gelesen werden, wenn sie benötigt werden, ohne sich um einen Cache zwischen CPU und Speicher zu kümmern. Wenn Sie jedoch tatsächliche Daten aus dem Speicher und keine zwischengespeicherten Daten lesen müssen, haben Sie zwei Möglichkeiten:

Erstellen Sie ein Board, auf dem die Daten nicht zwischengespeichert werden. Dies kann bereits der Fall sein, wenn Sie ein I/O-Gerät adressieren,
Verwenden Sie bestimmte CPU-Anweisungen, die den Cache umgehen. Dies wird verwendet, wenn Sie den Speicher löschen müssen, um mögliche SEU-Fehler zu aktivieren.

Die Details der zweiten Option hängen vom Betriebssystem und/oder der CPU ab.

Question 8

Die Verwendung des Schlüsselworts _Uncached kann in eingebetteten Betriebssystemen wie MQX hilfreich sein

#define MEM_READ(addr)       (*((volatile _Uncached unsigned int *)(addr)))
#define MEM_WRITE(addr,data) (*((volatile _Uncached unsigned int *)(addr)) = data)