🦊Foxi Tools
🌐

Unicode-Konverter

Text in Unicode konvertieren oder wiederherstellen

Der Unicode-Konverter wandelt Text in Unicode-Escape-Sequenzen (\uXXXX) oder Hexadezimalcodes um und konvertiert umgekehrt Unicode-Codes zurück in lesbare Zeichen. Das Tool eignet sich hervorragend zum Prüfen von Emoji-Codepunkten, zum Escapen von Nicht-ASCII-Zeichen im Quellcode, zum Debuggen von Zeichenkodierungsproblemen in Internationalisierungsworkflows (i18n) und zum Analysieren unsichtbarer Unicode-Zeichen.

📖 Anleitung

  1. Geben Sie Text oder Unicode in das Eingabefeld ein
  2. Klicken Sie auf die gewünschte Konvertierungsrichtung
  3. Unicode-Escape, HEX-Konvertierung möglich
  4. Kopieren Sie das Ergebnis zur Verwendung

Funktionen

  • Unicode-Escape-Konvertierung
  • HEX-Code-Konvertierung
  • Bidirektionale Konvertierung
  • Emoji-Unicode-Überprüfung
  • Unicode-Analyse

💡 Anwendungsfälle

  • Frontend-Entwickler: Nicht-ASCII-Zeichen in JavaScript-Quellcode in \u-Escape-Sequenzen umwandeln, um Kodierungsprobleme über Build-Tools hinweg zu vermeiden.
  • i18n-Ingenieure: Unicode-Codepunkte mehrsprachiger Zeichenketten prüfen, um Kodierungsfehler in Lokalisierungsdateien zu debuggen.
  • Emoji-Forscher: Emoji-Zusammensetzung einschließlich kombinierender Zeichen, Variationsselektoren und ZWJ-Sequenzen analysieren.
  • Datenbankadministratoren: Unsichtbare Zeichen (Nullbreite-Leerzeichen, BOM-Markierungen) in Daten identifizieren, um Integritäts- und Abgleichprobleme zu lösen.
  • Technische Redakteure: Unicode-Codepunkte für Zeichenreferenztabellen nachschlagen und dokumentieren.

🎯 Tipps

  • Ein Emoji einfügen, um Surrogatpaare oder ZWJ-Sequenzen zu inspizieren — hilfreich zum Testen der Emoji-Verarbeitungslogik.
  • Bei Verdacht auf unsichtbare Zeichen den Text in Unicode umwandeln, um versteckte Nullbreite-Leerzeichen oder BOM-Markierungen aufzudecken.
  • Wenn JSON-Dateien Umlaute oder CJK-Text als \uXXXX-Sequenzen zeigen, hier dekodieren, um die Originalzeichen sofort zu lesen.
  • Die HEX-Konvertierung ist nützlich für Protokollanalyse und Byte-Level-Dateninspektion.

Häufig gestellte Fragen

Q. Was ist der Unterschied zwischen Unicode und UTF-8?

A. Unicode ist ein Zeichensatz, während UTF-8 eine Methode zur Kodierung von Unicode-Zeichen ist.

Q. Werden Emojis konvertiert?

A. Ja, alle Unicode-Zeichen einschließlich Emojis können konvertiert werden.

Q. Was ist der Unterschied zwischen \uXXXX und \u{XXXXX}?

A. \uXXXX stellt 16-Bit-Codepunkte innerhalb der Basic Multilingual Plane (BMP) dar. Zeichen außerhalb der BMP wie die meisten Emojis erfordern die \u{1F600}-Syntax oder ein Surrogatpaar wie \uD83D\uDE00.

Q. Welchen Unicode-Bereich haben deutsche Sonderzeichen?

A. Deutsche Umlaute (ä, ö, ü, Ä, Ö, Ü) und das ß befinden sich im Bereich Latin-1 Supplement (U+00C0–U+00FF). Sie gehören zur BMP und können mit einer einzigen \uXXXX-Sequenz dargestellt werden.

Q. Was sind Nullbreite-Zeichen?

A. Das sind unsichtbare Unicode-Zeichen, die keinen sichtbaren Platz auf dem Bildschirm einnehmen. Beispiele sind das Nullbreite-Leerzeichen (U+200B), der Nullbreite-Verbinder (U+200D) und das BOM (U+FEFF). Sie können durch Kopieren und Einfügen unbemerkt in Text gelangen und subtile Fehler verursachen.

Q. Warum bestehen einige Emojis aus mehreren Codepunkten?

A. Viele moderne Emojis werden mithilfe von ZWJ-Sequenzen (Zero-Width Joiner) zusammengesetzt. Zum Beispiel kombiniert ein Familien-Emoji einzelne Personen-Emojis, die mit U+200D verbunden sind. Deshalb kann ein sichtbares Emoji viele Codepunkte lang sein.

🔗 Verwandte Tools