Conversor Unicode
Converte texto para Unicode ou restaura
O conversor Unicode transforma texto em sequências de escape Unicode (\uXXXX) ou códigos hexadecimais e reverte a conversão para caracteres legíveis. É inestimável para inspecionar pontos de código de emojis, escapar caracteres não ASCII em código-fonte, depurar problemas de codificação em fluxos de internacionalização (i18n) e analisar caracteres Unicode invisíveis. Suporta todos os planos Unicode, incluindo caracteres suplementares.
📖 Como Usar
- Digite texto ou Unicode na caixa de entrada
- Clique no botão da direção de conversão desejada
- Conversão de escape Unicode, HEX disponível
- Copie o resultado para usar
✨ Recursos
- ✓Conversão de escape Unicode
- ✓Conversão de código HEX
- ✓Suporte a conversão bidirecional
- ✓Verificação de Unicode de emojis
- ✓Análise de Unicode de caracteres
💡 Casos de uso
- •Desenvolvedores frontend: Converter caracteres não ASCII para sequências de escape \u em código-fonte JavaScript para evitar problemas de codificação entre ferramentas de build.
- •Engenheiros de i18n: Inspecionar pontos de código Unicode de strings multilíngues para depurar erros de codificação em arquivos de localização.
- •Pesquisadores de emoji: Analisar a composição de emojis, incluindo caracteres combinantes, seletores de variação e sequências ZWJ.
- •Administradores de banco de dados: Identificar caracteres invisíveis (espaços de largura zero, marcas BOM) em dados para resolver problemas de integridade.
- •Redatores técnicos: Consultar e documentar pontos de código Unicode para tabelas de referência de caracteres.
🎯 Dicas
- ▸Cole um emoji para inspecionar seu par substituto ou sequência ZWJ — útil para testar a lógica de tratamento de emojis no seu código.
- ▸Se suspeitar de caracteres invisíveis, converta o texto para Unicode para revelar espaços de largura zero ou marcas BOM ocultos.
- ▸Quando arquivos JSON mostram texto como sequências \uXXXX, decodifique aqui para ler os caracteres originais instantaneamente.
- ▸A conversão HEX é útil para análise de protocolos e inspeção de dados no nível de bytes.
❓ Perguntas Frequentes
Q. Qual é a diferença entre Unicode e UTF-8?
A. Unicode é um conjunto de caracteres, enquanto UTF-8 é uma forma de codificar caracteres Unicode.
Q. Converte emojis?
A. Sim, você pode converter qualquer caractere Unicode incluindo emojis.
Q. Qual é a diferença entre \uXXXX e \u{XXXXX}?
A. \uXXXX representa pontos de código de 16 bits dentro do Plano Multilíngue Básico (BMP). Caracteres fora do BMP, como a maioria dos emojis, requerem a sintaxe \u{1F600} ou um par substituto como \uD83D\uDE00.
Q. Qual é o intervalo Unicode para caracteres do português?
A. As letras acentuadas (á, â, ã, à, é, ê, í, ó, ô, õ, ú) e a cedilha (ç) estão no bloco Latin-1 Supplement (U+00C0–U+00FF). Todos estão no BMP e podem ser representados com uma única sequência \uXXXX.
Q. O que são caracteres de largura zero?
A. São caracteres Unicode invisíveis que não ocupam espaço visível na tela. Exemplos incluem o espaço de largura zero (U+200B), o conector de largura zero (U+200D) e o BOM (U+FEFF). Podem se infiltrar no texto ao copiar e colar, causando bugs sutis.
Q. Por que alguns emojis são compostos por múltiplos pontos de código?
A. Muitos emojis modernos são compostos usando sequências ZWJ (Zero-Width Joiner). Por exemplo, um emoji de família combina emojis individuais de pessoas unidos por U+200D. Por isso, um emoji visível pode conter muitos pontos de código.