Ich muss eine Zeichenfolge bereinigen, die aus verschiedenen Microsoft Office-Suite-Anwendungen (kopiert/eingefügt) stammt (Excel, Zugangund Wort), jede mit ihrem eigenen Codierungssatz.
Ich verwende json_encode für Debugging-Zwecke, um jedes einzelne codierte Zeichen sehen zu können.
Ich kann alles, was ich bisher gefunden habe (\r \n) mit str_replace bereinigen, aber mit \u00a0 habe ich kein Glück.
$string = '[email protected]\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0;[email protected]'; //this is the output from json_encode
$clean = str_replace("\u00a0", "",$string);
kehrt zurück:
[email protected]\u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0 \u00a0;[email protected]
Das ist genau dasselbe; es ignoriert vollständig \u00a0.
Gibt es eine Möglichkeit, dies zu umgehen? Außerdem habe ich das Gefühl, dass ich das Rad neu erfinde. Gibt es eine Funktion/Klasse, die JEDES mögliche Zeichen von JEDER möglichen Codierung vollständig entfernt?
____BEARBEITEN____
Nach den ersten beiden Antworten muss ich klarstellen, dass mein Beispiel funktioniert, weil es die Ausgabe von json_encode ist, nicht die tatsächliche Zeichenfolge!