You are on page 1of 6

Yasmine Fadiss & Jessica Martinez

Tasca inicial en grup: codificació de


caràcters + Exposició

ASCII, ANSI, UTF 8 i 16, ISO-8859-15

Cercar característiques, tipus, evolució, exemples de cada codificació de caràcters (en


Parelles - Yasmine i Jessica).

ASCII

● Característiques

El codi ASCII funciona com a enllaç entre el llenguatge de màquina (codi binari) i la
forma utilitzada pels éssers humans per designar instruccions o ingressar text a un
ordinador.

Quan una persona escriu una paraula en un editor de text, l'ordinador no reconeix
cada lletra com un caràcter pròpiament dit, sinó que utilitza el codi ASCII per traduir
el codi binari que rep des del teclat, i mostrar per pantalla caràcter corresponent a
aquesta seqüència binària de 8 bits. Gràcies al codi ASCII els éssers humans poden
“comunicar-se” amb un ordinador mitjançant el seu llenguatge, és a dir, utilitzant
lletres per designar instruccions, ja que el sistema informàtic reconeix les ordres
ingressades al teclat i el tradueix a llenguatge de màquina per mitjà del codi ASCII.

● Tipus

Es classifiquen segons el tipus de caràcters que representin (2 grups)

- Caràcters imprimibles: Tots aquells caràcters que, com indica el seu nom,
tenen una representació visual (dígits, lletres, signes de puntuació, una sèrie
de símbols i “l'espai”).
- Caràcters de control: El codi ASCII utilitza els primers 32 codis del sistema
per caràcters de control, és a dir, per donar instruccions o controlar perifèrics
connectats a l'ordinador. Molts dels codis designats per a caràcters de control
han quedat obsolets, però, en aquest grup es troben els famosos caràcters
de salt de línia o “ENTER”, suprimir, borrar i escape (entre d’altres).

● Evolució

Va ser creat en el 1945 per una companyia estadounidense però no es va convertir


en un codi estàndard fins 20 anys després.
Yasmine Fadiss & Jessica Martinez

Originalment el codi ASCII comptava únicament amb números i lletres majúscules,


però en el 1967 va ser actualitzat per afegir lletres minúscules i diversos símbols.
Des de llavors, ASCII ha rebut diverses revisions i adaptacions que han servit
perquè aquesta codificació sigui actualment, una de les més importants per a la
informàtica i la computació en general.

● Exemples

Per exemple quan nosaltres escrivim “Hola” cada lletra és un codi diferent.

● H - 72
● o - 111
● l - 108
● a - 97

ANSI

● Característiques

El codi ANSI prové de les sigles American National Standards Institute del que és el
mateix que el codi Nord-americà Estàndard per al llenguatge de programació en C.
Yasmine Fadiss & Jessica Martinez

Va ser creat el 1963 i va néixer per expandir i ordenar tant els símbols com els
caràcters al nostre ordinador.

● Tipus
- C89: es va ratificar com a ANSI X3.159-1989 "Programming Language C." A
aquesta versió de l'estàndard se'l coneix com "ANSI C", o també "C".

- C90:l'estàndard ANSI C (amb algunes modificacions menors) va ser adoptat


per la International Organization for Standardization sota la denominació
ISO/IEC 9899:1990. A aquesta versió se'l coneix com a C90, si bé "C89" i
"C90" són, a efectes pràctics, el mateix llenguatge de programació.

- C99: ANSI va adoptar l'estàndard ISO/IEC 9899:1999. Aquest estàndard se'l


coneix com a C99.

- C11: És el nou estàndard per el llenguatge de programació C


● Evolució
● Exemples

UTF 8

● Característiques

UTF-8 és un format de codificació de caràcters Unicode. És el responsable que en el


teu navegador o client de correu et mostri el contingut del text correctament
descodificat, sense errors ni caràcters estranys.

● Unicode (que es?)

Quan el teu ordinador ha de representar qualsevol caràcter, per exemple,


qualsevol lletra de l'abecedari espanyol, el que fa és buscar entre tots els
caràcters que hi ha dins de l'estàndard Unicode i veure quin número té
assignat.
Yasmine Fadiss & Jessica Martinez

Unicode cobreix tots els caràcters de tots els sistemes d'escriptura del món,
moderns i antics. També inclou símbols tècnics, signes de puntuació i molts
altres caràcters que es fan servir per escriure text. Fins i tot els emoji tenen
els seus propis codis

● Tipus

Quan s'ha assignat un codi a un caràcter, es diu que aquest caràcter està codificat.
Perquè aquest número o codi sigui entès per l'ordinador ha d'estar codificat. Hi ha
tres formes de codificació amb el nom UTF (UTF-8, UTF-16 I UTF-32)

UTF-8 permet codificar qualsevol dels més de 120.000 caràcters de Unicode i fer-los
accessibles per als ordinadors. Divideix els caràcters Unicode en diversos grups, en
funció del nombre de bytes necessaris per codificar-los (d'1 a 4 bytes)

○ 1 byte: afecta els 128 caràcters inclosos en US-ASCII (anglès, latino i altres
llengües occidentals).
○ 2 bytes: inclou 1920 caràcters en total, entre els quals es troben els signes
diacrítics, els alfabets grec, hebreu, àrab, etc.
○ 3 bytes: caràcters del pla bàsic multilingüe d'Unicode, incloent els caràcters
del xinès, japonès i coreà.
○ 4 bytes: inclou símbols matemàtics i alfabets clàssics (ús principalment
acadèmic).

● Evolució
Yasmine Fadiss & Jessica Martinez

Va ser presentat en el 1993 i han aparegut altres versions al cap del temps com he
mencionat abans (UTF-16 I UTF-32)

● Exemples

Per exemple quan nosaltres creem una pàgina web amb HTML, utilitzem la
codificació UTF-8, ja que suporta molts idiomes i signes.

<meta charset=”utf-8″>.

UTF 16 (quina diferència hi ha amb el UTF 8)

● Explicació:

La mida del fitxer UTF-16 és la doble de la mida de UTF-8. A causa d'això, UTF-16
es considera menys eficient. UTF-16 no està orientat a bytes i no és compatible amb
caràcters ASCII.

UTF-16 és l'estàndard de codificació més antic al camp de la sèrie Unicode. Les


diverses aplicacions UTF-16 són l'ús a Microsoft Windows, JavaScript i programació
Java.

● Principals Diferències

1. La mida del fitxer UTF-8 és més petita, mentre que, per altra banda, la mida
del fitxer UTF-16 és el doble de la mida del fitxer UTF-8.
2. UTF-8 mostra compatibilitat amb les codificacions de caràcters ASCII, mentre
que, per altra banda, UTF-16 no mostra cap compatibilitat amb els caràcters
ASCII.

3. La codificació UTF-8 està orientada a bytes, mentre que la codificació UTF-


16 no està orientada a bytes.
4. La codificació UTF-8 és força bona per recuperar-se dels errors, mentre que
la codificació UTF-16 no és tan bona per recuperar-se dels errors que hem
fet.
Yasmine Fadiss & Jessica Martinez

5. UTF-8 utilitza almenys un byte (8 bits) mentre que comparativament, per altra
banda, UTF-16 utilitza almenys un o dos bytes (16 bits).
6. UTF-8 implementa al voltant d'1-4 blocs, mentre que, comparativament, per
altra banda, UTF-16 implementa al voltant d'1-2 blocs.
7. UTF-8 és més eficient mentre que, comparativament, per altra banda, UTF-
16 és menys eficient.
8. UTF-8 és més popular a la web, mentre que, comparativament, per altra
banda, UTF-16 no guanya gaire popularitat a la web.

ISO-8859-15

● Característiques

ISO 8859-15 és la part 15 de ISO 8859, un estàndard de codificació de caràcters


definit per l'Organització Internacional per a l'Estandardització. També és conegut
com a Latin-9, i de forma no oficial com a Latin-0 però no com a Latin-15. És similar
a ISO 8859-1, però substitueix alguns símbols poc comuns pel símbol de l'euro i
alguns altres caràcters que faltaven. Codifica els caràcters amb 8 bits i es pot fer
servir per representar l'alfabet i altres caràcters importants per emmagatzemar textos
en anglès, francès, alemany, espanyol i portuguès (entre altres idiomes d'Europa
occidental) en ordinadors.

● Tipus

● Evolució
● Exemples

You might also like