You are on page 1of 2

Códigos alfanuméricos

Permiten codificar caracteres del lenguaje natural en un conjunto de bits.


Al igual que con los números, no existe una única norma para codificar los caracteres
alfanuméricos. Veamos algunas de ellas:
ASCII (ISO 646): ASCII = American Standard Code for Information Interchange. Procede
directamente de la definición de byte: 1B = número de bits necesarios para codificar un
carácter. Utiliza 7 bits para representar cada carácter, y el octavo como bit de paridad para
detectar errores. Las 128 variaciones distintas que se pueden conseguir con 7 bits permiten
incluir en esta codificación las mayúsculas y minúsculas del abecedario inglés, además de
cifras, puntuación, y algunos caracteres de control (por ejemplo, el retorno de carro, que
simbolice el final de una línea y el comienzo de la siguiente), pero el ASCII no incluye ni los
caracteres acentuados ni el comienzo de interrogación que se usa en castellano, ni otros
símbolos necesarios en muchos contextos. Surge así el ASCII-Extendido.

Figura 1. Tabla ASCII original.

ASCII EXTENDIDO (ISO 8859): Utiliza los 8 bits para codificar un carácter. Formado por varias
tablas: ISO 8859-1 Europa occidental, ISO 8859-5 alfabeto cirílico, ISO 8859-6 árabe, ISO
8859-7 griego, ISO 8859-8 Hebreo, ISO 8859-10 Europa occidental con juegos de caracteres
nórdicos, incluyendo el de Islandia, ISO 8859-15 añade el símbolo de Euro y otros a ISO 8859-
1, etc. Se gana en rango de caracteres representables, pero esas 256 variaciones son todavía
insuficientes para codificar todos los alfabetos del mundo en una sola tabla. Surge así
UNICODE.
Figura 2. Tabla ASCII extendida.

UNICODE: Incluye todos los caracteres de uso común en la actualidad. La versión 5.1 contiene
100.713 caracteres. Incluye sistemas de escritura modernos (árabe, braille, cirílico, japonés,
latino…), escrituras históricas poco utilizadas o extinguidas (para propósitos académicos),
como el cuneiforme, griego antiguo, rúnico… Actualmente se está trabajando en la inclusión de
nuevos grupos de símbolos, como los jeroglíficos egipcios y mayas. Otros alfabetos propuestos
han sido descartados por distintas razones, como por ejemplo el alfabeto Klingon.
Formas de codificación UNICODE:
UTF-8  1 a 2 B por carácter
UTF-16  2 a 4 B por carácter
UTF-32  codificación de 4 B de longitud fija.

You might also like