Professional Documents
Culture Documents
Tasca Inicial en Grup - Codificació de Caràcters + Exposició
Tasca Inicial en Grup - Codificació de Caràcters + Exposició
ASCII
● Característiques
El codi ASCII funciona com a enllaç entre el llenguatge de màquina (codi binari) i la
forma utilitzada pels éssers humans per designar instruccions o ingressar text a un
ordinador.
Quan una persona escriu una paraula en un editor de text, l'ordinador no reconeix
cada lletra com un caràcter pròpiament dit, sinó que utilitza el codi ASCII per traduir
el codi binari que rep des del teclat, i mostrar per pantalla caràcter corresponent a
aquesta seqüència binària de 8 bits. Gràcies al codi ASCII els éssers humans poden
“comunicar-se” amb un ordinador mitjançant el seu llenguatge, és a dir, utilitzant
lletres per designar instruccions, ja que el sistema informàtic reconeix les ordres
ingressades al teclat i el tradueix a llenguatge de màquina per mitjà del codi ASCII.
● Tipus
- Caràcters imprimibles: Tots aquells caràcters que, com indica el seu nom,
tenen una representació visual (dígits, lletres, signes de puntuació, una sèrie
de símbols i “l'espai”).
- Caràcters de control: El codi ASCII utilitza els primers 32 codis del sistema
per caràcters de control, és a dir, per donar instruccions o controlar perifèrics
connectats a l'ordinador. Molts dels codis designats per a caràcters de control
han quedat obsolets, però, en aquest grup es troben els famosos caràcters
de salt de línia o “ENTER”, suprimir, borrar i escape (entre d’altres).
● Evolució
● Exemples
Per exemple quan nosaltres escrivim “Hola” cada lletra és un codi diferent.
● H - 72
● o - 111
● l - 108
● a - 97
ANSI
● Característiques
El codi ANSI prové de les sigles American National Standards Institute del que és el
mateix que el codi Nord-americà Estàndard per al llenguatge de programació en C.
Yasmine Fadiss & Jessica Martinez
Va ser creat el 1963 i va néixer per expandir i ordenar tant els símbols com els
caràcters al nostre ordinador.
● Tipus
- C89: es va ratificar com a ANSI X3.159-1989 "Programming Language C." A
aquesta versió de l'estàndard se'l coneix com "ANSI C", o també "C".
UTF 8
● Característiques
Unicode cobreix tots els caràcters de tots els sistemes d'escriptura del món,
moderns i antics. També inclou símbols tècnics, signes de puntuació i molts
altres caràcters que es fan servir per escriure text. Fins i tot els emoji tenen
els seus propis codis
● Tipus
Quan s'ha assignat un codi a un caràcter, es diu que aquest caràcter està codificat.
Perquè aquest número o codi sigui entès per l'ordinador ha d'estar codificat. Hi ha
tres formes de codificació amb el nom UTF (UTF-8, UTF-16 I UTF-32)
UTF-8 permet codificar qualsevol dels més de 120.000 caràcters de Unicode i fer-los
accessibles per als ordinadors. Divideix els caràcters Unicode en diversos grups, en
funció del nombre de bytes necessaris per codificar-los (d'1 a 4 bytes)
○ 1 byte: afecta els 128 caràcters inclosos en US-ASCII (anglès, latino i altres
llengües occidentals).
○ 2 bytes: inclou 1920 caràcters en total, entre els quals es troben els signes
diacrítics, els alfabets grec, hebreu, àrab, etc.
○ 3 bytes: caràcters del pla bàsic multilingüe d'Unicode, incloent els caràcters
del xinès, japonès i coreà.
○ 4 bytes: inclou símbols matemàtics i alfabets clàssics (ús principalment
acadèmic).
● Evolució
Yasmine Fadiss & Jessica Martinez
Va ser presentat en el 1993 i han aparegut altres versions al cap del temps com he
mencionat abans (UTF-16 I UTF-32)
● Exemples
Per exemple quan nosaltres creem una pàgina web amb HTML, utilitzem la
codificació UTF-8, ja que suporta molts idiomes i signes.
<meta charset=”utf-8″>.
● Explicació:
La mida del fitxer UTF-16 és la doble de la mida de UTF-8. A causa d'això, UTF-16
es considera menys eficient. UTF-16 no està orientat a bytes i no és compatible amb
caràcters ASCII.
● Principals Diferències
1. La mida del fitxer UTF-8 és més petita, mentre que, per altra banda, la mida
del fitxer UTF-16 és el doble de la mida del fitxer UTF-8.
2. UTF-8 mostra compatibilitat amb les codificacions de caràcters ASCII, mentre
que, per altra banda, UTF-16 no mostra cap compatibilitat amb els caràcters
ASCII.
5. UTF-8 utilitza almenys un byte (8 bits) mentre que comparativament, per altra
banda, UTF-16 utilitza almenys un o dos bytes (16 bits).
6. UTF-8 implementa al voltant d'1-4 blocs, mentre que, comparativament, per
altra banda, UTF-16 implementa al voltant d'1-2 blocs.
7. UTF-8 és més eficient mentre que, comparativament, per altra banda, UTF-
16 és menys eficient.
8. UTF-8 és més popular a la web, mentre que, comparativament, per altra
banda, UTF-16 no guanya gaire popularitat a la web.
ISO-8859-15
● Característiques
● Tipus
● Evolució
● Exemples