🌐
Unicode转换器
将文本转换为Unicode或还原
Unicode转换器可将文本转换为Unicode转义序列(\uXXXX)或十六进制代码,也可将Unicode代码还原为可读字符。适用于查看表情符号的码位、在源代码中转义非ASCII字符、在国际化(i18n)工作中调试字符编码问题。支持中日韩文字、表情符号等所有Unicode平面的字符。
📖 使用方法
- 在输入框中输入文本或Unicode
- 点击所需的转换方向按钮
- 可进行Unicode转义、HEX转换
- 复制结果使用
✨ 主要功能
- ✓Unicode转义转换
- ✓HEX代码转换
- ✓双向转换支持
- ✓查看表情符号Unicode
- ✓分析中文Unicode
💡 使用场景
- •前端开发者: 将JavaScript源代码中的非ASCII字符转换为\u转义序列,避免编码问题。
- •国际化工程师: 查看多语言字符串的Unicode码位,调试本地化文件中的编码错误。
- •表情符号研究者: 分析表情符号的Unicode码位及组合方式(组合字符、ZWJ序列等)。
- •数据库管理员: 识别不可见字符(零宽空格等)的Unicode编码,排查数据一致性问题。
- •技术文档编写者: 查询并记录Unicode字符的码位信息,制作字符参考表。
🎯 使用技巧
- ▸输入表情符号可以查看代理对和ZWJ序列,适合测试表情符号处理逻辑。
- ▸如果怀疑文本中有隐藏字符,将其转换为Unicode即可发现零宽空格或BOM等不可见字符。
- ▸当JSON文件中的中文显示为\uXXXX时,用本工具解码可立即看到原始字符。
- ▸HEX转换在协议分析和字节级数据处理中非常有用。
❓ 常见问题
Q. Unicode和UTF-8有什么区别?
A. Unicode是字符集,UTF-8是Unicode的编码方式之一。
Q. 支持表情符号转换吗?
A. 支持。可以转换包括表情符号在内的所有Unicode字符。
Q. \uXXXX和\u{XXXXX}有什么区别?
A. \uXXXX只能表示基本多语言平面(BMP)中的16位码位。表情符号等BMP之外的字符需要使用\u{1F600}格式或代理对(\uD83D\uDE00)来表示。
Q. 中文的Unicode范围是什么?
A. CJK统一汉字的基本范围是U+4E00至U+9FFF,扩展区域还有更多汉字。加上标点符号和兼容字符,中文相关的Unicode块分布在多个区域。
Q. 什么是零宽字符?
A. 在屏幕上不可见的Unicode字符。包括零宽空格(U+200B)、零宽连接符(U+200D)、BOM(U+FEFF)等。复制粘贴时可能意外混入,导致难以发现的bug。
Q. 为什么有些表情符号由多个码位组成?
A. 许多现代表情符号使用零宽连接符(ZWJ)序列组合而成。例如家庭表情符号是由多个人物表情符号通过U+200D连接组成的。因此一个显示的表情符号可能包含多个码位。