Funktionsprinzip von Speicherleckdetektoren

Question 1

Wie funktionieren Speicherleckdetektoren eigentlich? Was sind die zugrunde liegenden Konzepte im Allgemeinen? Kann C++ als Sprache nehmen, um dies zu erklären.

Question 2

Es gibt ein paar verschiedene Möglichkeiten, wie Lecksucher funktionieren. Sie können die Implementierung von ersetzen malloc und free mit solchen, die während der Zuordnung mehr Informationen verfolgen können und sich nicht um die Leistung kümmern. Dies ist ähnlich wie dmalloc funktioniert. Im Allgemeinen jede Adresse, die ist malloc‘ed aber nicht free‘d ist durchgesickert.

Die grundlegende Implementierung ist eigentlich ziemlich einfach. Sie pflegen einfach eine Nachschlagetabelle für jede Zuordnung und ihre Zeilennummer und entfernen den Eintrag, wenn er freigegeben wird. Wenn das Programm fertig ist, können Sie alle Speicherlecks auflisten. Der schwierige Teil besteht darin, zu bestimmen, wann und wo die Zuordnung hätte freigegeben werden sollen. Dies ist noch schwieriger, wenn mehrere Zeiger auf dieselbe Adresse vorhanden sind.

In der Praxis möchten Sie wahrscheinlich mehr als nur die einzelne Zeilennummer, sondern eher einen Stack-Trace für die verlorenen Zuordnungen.

Ein weiterer Ansatz ist das Wie Valgrind arbeitet, das eine vollständige virtuelle Maschine implementiert, um Adressen und Speicherreferenzen und die zugehörige Buchhaltung zu verfolgen. Der Valgrind-Ansatz ist viel teurer, aber auch viel effektiver, da er Sie auch über andere Arten von Speicherfehlern wie Lese- oder Schreibvorgänge außerhalb der Grenzen informieren kann.

Valgrind instrumentiert im Wesentlichen die zugrunde liegenden Anweisungen und kann nachverfolgen, wann eine bestimmte Speicheradresse keine Referenzen mehr hat. Es kann dies tun, indem es die Zuweisung von Adressen verfolgt, und Ihnen so nicht nur sagen, dass ein Teil der Erinnerung verloren gegangen ist, sondern genau Wenn es ging verloren.

C++ macht es für beide Arten von Lecksuchern etwas schwieriger, weil es die new und delete Betreiber. Technisch new kann eine ganz andere Quelle der Erinnerung sein als malloc. In der Praxis werden jedoch viele echte C++-Implementierungen einfach verwendet malloc implementieren new oder haben eine Option zur Verwendung malloc anstelle des alternativen Ansatzes.

Auch höhere Programmiersprachen wie C++ haben tendenziell alternative Möglichkeiten zur Speicherzuweisung auf höherer Ebene, wie z std::vector oder std::list. Ein einfacher Leckdetektor würde die potenziell vielen Zuordnungen, die von den Modi höherer Ebene vorgenommen werden, separat melden. Das ist viel weniger nützlich, als zu sagen, dass der gesamte Container verloren gegangen ist.

Question 3

Hier ist ein veröffentlichtes technisches Papier über die Funktionsweise unseres CheckPointer-Tools.

Grundsätzlich verfolgt es die Lebensdauer aller Werte (Heap und Stack) und ihre Größe entsprechend ihren Typen, wie sie von der Sprache definiert werden. Dadurch kann CheckPointer nicht nur Lecks finden, sondern auch Zugriffe außerhalb des Arrays, selbst für Arrays im Stack, was Valgrind nicht kann.

Insbesondere analysiert es den Quellcode, um alle Verwendungen von Zeigern zu finden. (Dies ist eine ziemliche Aufgabe für sich).

Es verfolgt Zeigermetadaten für jeden Zeiger, bestehend aus

Ein Verweis auf die Objektmetadaten für das Heap-zugeordnete Objekt oder die globale oder lokale Variable oder Funktion, auf die der Zeiger und zeigt

Der Adressbereich des (Unter-)Objekts des Objekts, auf das der Zeiger aktuell zugreifen darf. Dieser kann kleiner sein als der Adressbereich des gesamten Objekts; Wenn Sie beispielsweise die Adresse eines Strukturmitglieds nehmen, erlaubt der instrumentierte Quellcode nur dann den Zugriff auf dieses Mitglied, wenn der resultierende Zeiger verwendet wird.

Es verfolgt auch die Art und den Ort jedes Objekts, dh ob es sich um eine Funktion, eine globale, Thread-lokale oder lokale Variable, einen vom Heap zugewiesenen Speicher oder eine String-Literal-Konstante handelt:

Der Adressbereich des Objekts, auf das sicher zugegriffen werden kann, und

Für jeden Zeiger, der in dem Heap-zugeordneten Objekt oder der Variable gespeichert ist, ein Verweis auf die Zeigermetadaten für diesen Zeiger.

All dieses Verfolgen wird erreicht, indem die ursprüngliche Programmquelle in ein Programm transformiert wird, das das tut, was das ursprüngliche Programm tut, und verschiedene Routinen zum Prüfen oder Aktualisieren von Metadaten verschachtelt. Das resultierende Programm wird kompiliert und ausgeführt. Wenn eine Metadatenprüfung zur Laufzeit fehlschlägt, wird ein Backtrace mit einem Bericht über die Art des Fehlers bereitgestellt (ungültiger Zeiger, Zeiger außerhalb gültiger Grenzen, …).

Question 4

Dies ist mit C und C++ gekennzeichnet und es wird kein Betriebssystem erwähnt. Diese Antwort ist für Windows.

C

Windows hat das Konzept des virtuellen Speichers. Jeder Speicher, den ein Prozess erhalten kann, ist virtueller Speicher. Dies geschieht durch VirtualAlloc() [MSDN]. Sie können sich vorstellen, dass der Lecksucher einen Haltepunkt für diese Funktion setzt, und wann immer er aufgerufen wird, erhält er den Callstack und speichert ihn irgendwo. Dann kann es ähnlich für tun VirtualFree()[MSDN].

Der Unterschied kann dann identifiziert und zusammen mit den gespeicherten Callstacks angezeigt werden.

C++

C++ hat ein anderes Konzept: Es nimmt die großen 64-kb-Blöcke, die es von VirtualAlloc() erhält, und teilt sie in kleinere Teile auf, die Heap genannt werden. Der C++ Heap Manager kommt von Microsoft und bietet neue Methoden HeapAlloc() [MSDN] und HeapFree()[MSDN].

Dann könnten Sie dasselbe tun wie zuvor, aber eigentlich ist diese Funktion bereits integriert. Microsofts GFlags [MSDN] Tool kann das Tracking aktivieren:

In diesem Fall werden bis zu 50 MB Callstack-Informationen für C++-Heap-Manager-Aufrufe gespeichert.

Da diese Einstellungen auch über die Windows-Registrierung aktiviert werden können, kann ein Speicherleckdetektor leicht davon Gebrauch machen.

Allgemeines Konzept

Wie Sie sehen können, besteht das allgemeine Konzept darin, Zuweisungen und Freigaben zu verfolgen, sie zu vergleichen und die Callstacks der Differenz anzuzeigen.