Behält die Umwandlung zwischen vorzeichenbehaftetem und vorzeichenlosem int das genaue Bitmuster der Variablen im Speicher bei?

Question 1

Ich möchte eine 32-Bit-Ganzzahl mit Vorzeichen übergeben x durch eine Steckdose. Damit der Empfänger weiß, welche Byte-Reihenfolge ihn erwartet, rufe ich an htonl(x) vor dem Absenden. htonl erwartet ein uint32_t obwohl und ich möchte sicher sein, was passiert, wenn ich meine werfe int32_t zu einem uint32_t.

int32_t x = something;
uint32_t u = (uint32_t) x;

Ist es immer so, dass die Bytes in x und u jedes wird genau das gleiche sein? Was ist mit dem Zurückwerfen:

uint32_t u = something;
int32_t x = (int32_t) u;

Mir ist klar, dass negative Werte in große unsignierte Werte umgewandelt werden, aber das spielt keine Rolle, da ich nur am anderen Ende zurückwerfe. Wenn der Cast jedoch mit den tatsächlichen Bytes durcheinander kommt, kann ich nicht sicher sein, dass das Zurücksenden denselben Wert zurückgibt.

Question 2

Im Allgemeinen wird das Casting in C in Form von Werten angegeben, nicht von Bitmustern – ersteres wird (wenn möglich) beibehalten, letzteres jedoch nicht unbedingt. Im Falle von Zweierkomplementdarstellungen ohne Padding – was für die Fixed-with-Integer-Typen obligatorisch ist – spielt diese Unterscheidung keine Rolle, und die Umwandlung wird in der Tat ein Noop sein.

Aber selbst wenn die Konvertierung von vorzeichenbehaftet zu vorzeichenlos das Bitmuster geändert hätte, hätte eine erneute Konvertierung den ursprünglichen Wert wiederhergestellt – mit der Einschränkung, dass die Konvertierung von vorzeichenbehaftet zu vorzeichenbehaftet außerhalb des Bereichs implementierungsdefiniert ist und ein Signal auslösen kann auf Überlauf.

Für eine vollständige Portabilität (die wahrscheinlich übertrieben sein wird) müssen Sie Typ-Wortspiel anstelle von Konvertierung verwenden. Dies kann auf zwei Arten erfolgen:

Über Pointer-Casts, dh

uint32_t u = *(uint32_t*)&x;

mit dem Sie vorsichtig sein sollten, da es gegen effektive Typisierungsregeln verstoßen kann (aber für vorzeichenbehaftete/vorzeichenlose Varianten von Integer-Typen in Ordnung ist) oder über Vereinigungen, dh

uint32_t u = ((union { int32_t i; uint32_t u; }){ .i = x }).u;

die auch zum Konvertieren von z. B. verwendet werden können double zu uint64_twas Sie mit Zeigerumwandlungen möglicherweise nicht tun, wenn Sie undefiniertes Verhalten vermeiden möchten.

Question 3

Casts werden in C verwendet, um sowohl “Typkonvertierung” als auch “Typdisambiguierung” zu bedeuten. Wenn Sie so etwas haben

(float) 3

Dann ist es eine Typkonvertierung, und die eigentlichen Bits ändern sich. Wenn du sagst

(float) 3.0

es ist eine Typendisambiguierung.

Unter der Annahme einer 2er-Komplement-Darstellung (siehe Kommentare unten), wenn du an wirfst int zu unsigned int, das Bitmuster wird nicht verändert, nur seine semantische Bedeutung; Wenn Sie es zurückwerfen, wird das Ergebnis immer korrekt sein. Es fällt in den Fall der Typdisambiguierung, da keine Bits geändert werden, sondern nur die Art und Weise, wie der Computer sie interpretiert.

Beachten Sie, dass das 2er-Komplement theoretisch nicht verwendet werden darf, und unsigned und signed können sehr unterschiedliche Darstellungen haben, und das tatsächliche Bitmuster kann sich dabei ändern.

Ab C11 (dem aktuellen C-Standard) ist Ihnen dies jedoch tatsächlich garantiert sizeof(int) == sizeof(unsigned int):

(§6.2.5/6) Für jeden der vorzeichenbehafteten Integer-Typen gibt es einen entsprechenden (aber unterschiedlichen) vorzeichenlosen Integer-Typ (mit dem Schlüsselwort unsigned bezeichnet), der die gleiche Menge an Speicherplatz (einschließlich Vorzeicheninformationen) verwendet und die gleiche hat Ausrichtungsanforderungen […]

Ich würde sagen, dass Sie in der Praxis davon ausgehen können, dass es sicher ist.

Question 4

Dies sollte immer sicher sein, denn die intXX_t Typen stehen garantiert im Zweierkomplement wenn Sie existieren:

7.20.1.1 Ganzzahltypen mit exakter Breite Der Typedef-Name intN_t bezeichnet einen vorzeichenbehafteten Ganzzahltyp mit der Breite N , ohne Füllbits und als Zweierkomplementdarstellung. Int8_t bezeichnet also einen solchen vorzeichenbehafteten Integer-Typ mit einer Breite von genau 8 Bit.

Theoretisch sieht die Rückwandlung aus uint32_t zu int32_t ist die Implementierung definiert, wie für alle unsigned zu signed Konvertierungen. Aber ich kann mir kaum vorstellen, dass eine Plattform anders handeln würde, als Sie erwarten.

Wenn Sie sich dessen wirklich sicher sein wollen, können Sie diese Konvertierung immer noch manuell durchführen. Sie müssten nur einen Wert für testen > INT32_MAX und dann ein bisschen rechnen. Selbst wenn Sie dies systematisch tun, sollte ein anständiger Compiler in der Lage sein, dies zu erkennen und zu optimieren.