🦊Foxi Tools
🌐

Unicode转换器

将文本转换为Unicode或还原

Unicode转换器可将文本转换为Unicode转义序列(\uXXXX)或十六进制代码,也可将Unicode代码还原为可读字符。适用于查看表情符号的码位、在源代码中转义非ASCII字符、在国际化(i18n)工作中调试字符编码问题。支持中日韩文字、表情符号等所有Unicode平面的字符。

📖 使用方法

  1. 在输入框中输入文本或Unicode
  2. 点击所需的转换方向按钮
  3. 可进行Unicode转义、HEX转换
  4. 复制结果使用

主要功能

  • Unicode转义转换
  • HEX代码转换
  • 双向转换支持
  • 查看表情符号Unicode
  • 分析中文Unicode

💡 使用场景

  • 前端开发者: 将JavaScript源代码中的非ASCII字符转换为\u转义序列,避免编码问题。
  • 国际化工程师: 查看多语言字符串的Unicode码位,调试本地化文件中的编码错误。
  • 表情符号研究者: 分析表情符号的Unicode码位及组合方式(组合字符、ZWJ序列等)。
  • 数据库管理员: 识别不可见字符(零宽空格等)的Unicode编码,排查数据一致性问题。
  • 技术文档编写者: 查询并记录Unicode字符的码位信息,制作字符参考表。

🎯 使用技巧

  • 输入表情符号可以查看代理对和ZWJ序列,适合测试表情符号处理逻辑。
  • 如果怀疑文本中有隐藏字符,将其转换为Unicode即可发现零宽空格或BOM等不可见字符。
  • 当JSON文件中的中文显示为\uXXXX时,用本工具解码可立即看到原始字符。
  • HEX转换在协议分析和字节级数据处理中非常有用。

常见问题

Q. Unicode和UTF-8有什么区别?

A. Unicode是字符集,UTF-8是Unicode的编码方式之一。

Q. 支持表情符号转换吗?

A. 支持。可以转换包括表情符号在内的所有Unicode字符。

Q. \uXXXX和\u{XXXXX}有什么区别?

A. \uXXXX只能表示基本多语言平面(BMP)中的16位码位。表情符号等BMP之外的字符需要使用\u{1F600}格式或代理对(\uD83D\uDE00)来表示。

Q. 中文的Unicode范围是什么?

A. CJK统一汉字的基本范围是U+4E00至U+9FFF,扩展区域还有更多汉字。加上标点符号和兼容字符,中文相关的Unicode块分布在多个区域。

Q. 什么是零宽字符?

A. 在屏幕上不可见的Unicode字符。包括零宽空格(U+200B)、零宽连接符(U+200D)、BOM(U+FEFF)等。复制粘贴时可能意外混入,导致难以发现的bug。

Q. 为什么有些表情符号由多个码位组成?

A. 许多现代表情符号使用零宽连接符(ZWJ)序列组合而成。例如家庭表情符号是由多个人物表情符号通过U+200D连接组成的。因此一个显示的表情符号可能包含多个码位。

🔗 相关工具