ToolPilot

Inspector Unicode

Inspecciona cada carácter Unicode de tu texto: codepoint, nombre, categoría, bytes UTF-8. Detecta caracteres invisibles y compara las normalizaciones NFC/NFD.

Inspector Unicode: analisis completo de cada caracter

¿Por que usar este inspector Unicode?

Unicode incluye mas de 149 000 caracteres en 161 bloques. Algunos son invisibles (espacio de ancho cero, BOM, marcas direccionales) y pueden causar errores de visualizacion, vulnerabilidades de seguridad o comportamientos inesperados en tus aplicaciones. Este inspector revela cada caracter con su codepoint (U+XXXX), nombre oficial, categoria y bytes UTF-8 en hexadecimal.

Todo el procesamiento ocurre en tu navegador. Tu texto nunca se envia a un servidor remoto. Puedes analizar datos sensibles (contrasenas, tokens, contenido confidencial) con total seguridad. La herramienta detecta automaticamente los caracteres invisibles y los senala visualmente en rojo.

El inspector tambien compara las formas de normalizacion NFC (compuesta) y NFD (descompuesta) de tu texto. Esta funcion es esencial para verificar la compatibilidad de cadenas entre sistemas (bases de datos, APIs, sistemas de archivos macOS vs. Linux).

¿Quien usa este inspector Unicode?

Desarrolladores
Depura problemas de codificacion identificando los codepoints exactos de cada caracter. Detecta BOMs parasitos (U+FEFF) al inicio de archivos, espacios de ancho cero (U+200B) en cadenas copiadas y pegadas, o marcas direccionales (LRM/RLM) que alteran el renderizado bidireccional.
Investigadores de seguridad
Detecta ataques de homoglifos comparando los codepoints de caracteres visualmente identicos. La "a" latina (U+0061) y la "a" cirilica (U+0430) se distinguen claramente por sus codepoints y categorias Unicode.
Linguistas
Estudia las marcas diacriticas combinantes (U+0300 a U+036F) y compara las formas NFC/NFD de textos acentuados. Verifica si una "e" es un caracter precompuesto (U+00E9) o una letra base "e" seguida de un acento combinante (U+0065 + U+0301).
Testers QA
Valida el manejo de cadenas Unicode en tus aplicaciones. Verifica que tu sistema procese correctamente los pares sustitutos (surrogate pairs), los caracteres invisibles y las diferentes formas de normalizacion. El contador de unidades UTF-16 vs. codepoints revela las discrepancias.

¿Como funciona el inspector Unicode?

Pega o escribe tu texto en el area de entrada. El inspector analiza cada caracter individualmente usando la iteracion Unicode de JavaScript (que maneja correctamente los pares sustitutos para emojis y caracteres mas alla del Plano Multilingue Basico).

Para cada caracter, la herramienta muestra: el caracter en si (o un badge rojo "INVISIBLE"), su codepoint U+XXXX, su nombre Unicode, su categoria (Lu, Ll, Nd, Po, Cf, etc.) y sus bytes UTF-8 en hexadecimal. Las estadisticas indican el total de codepoints, unidades UTF-16, codepoints unicos y caracteres invisibles.

La seccion NFC/NFD compara las dos formas de normalizacion de tu texto. Si los codepoints difieren entre NFC y NFD, la herramienta lo senala explicitamente. Todo el procesamiento es local: sin peticiones de red, sin datos almacenados.

Preguntas frecuentes

¿Como detecto caracteres invisibles en un texto?
Pega tu texto en el inspector. Cada caracter invisible (espacio de ancho cero, ZWNJ, ZWJ, BOM, marcas direccionales LRM/RLM) se senala en rojo con el badge "INVISIBLE". El contador superior indica el numero total de caracteres invisibles detectados.
¿Cual es la diferencia entre NFC y NFD?
NFC (Normalization Form Composed) combina un caracter base y sus diacriticos en un solo codepoint cuando es posible (ej: e = U+00E9). NFD (Normalization Form Decomposed) separa el caracter base y el diacritico (ej: e + acento = U+0065 U+0301). El inspector muestra ambas formas y sus codepoints para cada texto.
¿Mi texto se envia a un servidor?
No. El analisis Unicode se realiza completamente en tu navegador via JavaScript. Ningun dato se transmite, almacena ni registra. Tu texto permanece privado.
¿Como ayuda esta herramienta a detectar ataques de homoglifos?
El inspector muestra el codepoint exacto (U+XXXX) y el nombre Unicode de cada caracter. Dos caracteres visualmente identicos pero de bloques Unicode diferentes (por ejemplo, la "a" latina U+0061 y la "a" cirilica U+0430) se distinguen claramente por sus codepoints y categorias.