Unicode-Konverter
Text in Unicode konvertieren oder wiederherstellen
Der Unicode-Konverter wandelt Text in Unicode-Escape-Sequenzen (\uXXXX) oder Hexadezimalcodes um und konvertiert umgekehrt Unicode-Codes zurück in lesbare Zeichen. Das Tool eignet sich hervorragend zum Prüfen von Emoji-Codepunkten, zum Escapen von Nicht-ASCII-Zeichen im Quellcode, zum Debuggen von Zeichenkodierungsproblemen in Internationalisierungsworkflows (i18n) und zum Analysieren unsichtbarer Unicode-Zeichen.
📖 Anleitung
- Geben Sie Text oder Unicode in das Eingabefeld ein
- Klicken Sie auf die gewünschte Konvertierungsrichtung
- Unicode-Escape, HEX-Konvertierung möglich
- Kopieren Sie das Ergebnis zur Verwendung
✨ Funktionen
- ✓Unicode-Escape-Konvertierung
- ✓HEX-Code-Konvertierung
- ✓Bidirektionale Konvertierung
- ✓Emoji-Unicode-Überprüfung
- ✓Unicode-Analyse
💡 Anwendungsfälle
- •Frontend-Entwickler: Nicht-ASCII-Zeichen in JavaScript-Quellcode in \u-Escape-Sequenzen umwandeln, um Kodierungsprobleme über Build-Tools hinweg zu vermeiden.
- •i18n-Ingenieure: Unicode-Codepunkte mehrsprachiger Zeichenketten prüfen, um Kodierungsfehler in Lokalisierungsdateien zu debuggen.
- •Emoji-Forscher: Emoji-Zusammensetzung einschließlich kombinierender Zeichen, Variationsselektoren und ZWJ-Sequenzen analysieren.
- •Datenbankadministratoren: Unsichtbare Zeichen (Nullbreite-Leerzeichen, BOM-Markierungen) in Daten identifizieren, um Integritäts- und Abgleichprobleme zu lösen.
- •Technische Redakteure: Unicode-Codepunkte für Zeichenreferenztabellen nachschlagen und dokumentieren.
🎯 Tipps
- ▸Ein Emoji einfügen, um Surrogatpaare oder ZWJ-Sequenzen zu inspizieren — hilfreich zum Testen der Emoji-Verarbeitungslogik.
- ▸Bei Verdacht auf unsichtbare Zeichen den Text in Unicode umwandeln, um versteckte Nullbreite-Leerzeichen oder BOM-Markierungen aufzudecken.
- ▸Wenn JSON-Dateien Umlaute oder CJK-Text als \uXXXX-Sequenzen zeigen, hier dekodieren, um die Originalzeichen sofort zu lesen.
- ▸Die HEX-Konvertierung ist nützlich für Protokollanalyse und Byte-Level-Dateninspektion.
❓ Häufig gestellte Fragen
Q. Was ist der Unterschied zwischen Unicode und UTF-8?
A. Unicode ist ein Zeichensatz, während UTF-8 eine Methode zur Kodierung von Unicode-Zeichen ist.
Q. Werden Emojis konvertiert?
A. Ja, alle Unicode-Zeichen einschließlich Emojis können konvertiert werden.
Q. Was ist der Unterschied zwischen \uXXXX und \u{XXXXX}?
A. \uXXXX stellt 16-Bit-Codepunkte innerhalb der Basic Multilingual Plane (BMP) dar. Zeichen außerhalb der BMP wie die meisten Emojis erfordern die \u{1F600}-Syntax oder ein Surrogatpaar wie \uD83D\uDE00.
Q. Welchen Unicode-Bereich haben deutsche Sonderzeichen?
A. Deutsche Umlaute (ä, ö, ü, Ä, Ö, Ü) und das ß befinden sich im Bereich Latin-1 Supplement (U+00C0–U+00FF). Sie gehören zur BMP und können mit einer einzigen \uXXXX-Sequenz dargestellt werden.
Q. Was sind Nullbreite-Zeichen?
A. Das sind unsichtbare Unicode-Zeichen, die keinen sichtbaren Platz auf dem Bildschirm einnehmen. Beispiele sind das Nullbreite-Leerzeichen (U+200B), der Nullbreite-Verbinder (U+200D) und das BOM (U+FEFF). Sie können durch Kopieren und Einfügen unbemerkt in Text gelangen und subtile Fehler verursachen.
Q. Warum bestehen einige Emojis aus mehreren Codepunkten?
A. Viele moderne Emojis werden mithilfe von ZWJ-Sequenzen (Zero-Width Joiner) zusammengesetzt. Zum Beispiel kombiniert ein Familien-Emoji einzelne Personen-Emojis, die mit U+200D verbunden sind. Deshalb kann ein sichtbares Emoji viele Codepunkte lang sein.