Tasca Inicial en Grup - Codificació de Caràcters + Exposició

Yasmine Fadiss & Jessica Martinez
Tasca inicial en grup: codificació de

caràcters + Exposició
ASCII, ANSI, UTF 8 i 16, ISO-8859-15
Cercar característiques, tipus, evolució, exemples de cada codificació de caràcters (en

Parelles - Yasmine i Jessica).
ASCII
● Característiques
El codi ASCII funciona com a enllaç entre el llenguatge de màquina (codi binari) i la
forma utilitzada pels éssers humans per designar instruccions o ingressar text a un
ordinador.
Quan una persona escriu una paraula en un editor de text, l'ordinador no reconeix
cada lletra com un caràcter pròpiament dit, sinó que utilitza el codi ASCII per traduir
el codi binari que rep des del teclat, i mostrar per pantalla caràcter corresponent a
aquesta seqüència binària de 8 bits. Gràcies al codi ASCII els éssers humans poden
“comunicar-se” amb un ordinador mitjançant el seu llenguatge, és a dir, utilitzant
lletres per designar instruccions, ja que el sistema informàtic reconeix les ordres
ingressades al teclat i el tradueix a llenguatge de màquina per mitjà del codi ASCII.
● Tipus
Es classifiquen segons el tipus de caràcters que representin (2 grups)
- Caràcters imprimibles: Tots aquells caràcters que, com indica el seu nom,
tenen una representació visual (dígits, lletres, signes de puntuació, una sèrie
de símbols i “l'espai”).
- Caràcters de control: El codi ASCII utilitza els primers 32 codis del sistema
per caràcters de control, és a dir, per donar instruccions o controlar perifèrics
connectats a l'ordinador. Molts dels codis designats per a caràcters de control
han quedat obsolets, però, en aquest grup es troben els famosos caràcters
de salt de línia o “ENTER”, suprimir, borrar i escape (entre d’altres).
● Evolució
Va ser creat en el 1945 per una companyia estadounidense però no es va convertir

en un codi estàndard fins 20 anys després.
Originalment el codi ASCII comptava únicament amb números i lletres majúscules,

però en el 1967 va ser actualitzat per afegir lletres minúscules i diversos símbols.
Des de llavors, ASCII ha rebut diverses revisions i adaptacions que han servit
perquè aquesta codificació sigui actualment, una de les més importants per a la
informàtica i la computació en general.
● Exemples
Per exemple quan nosaltres escrivim “Hola” cada lletra és un codi diferent.
● H - 72
● o - 111
● l - 108
● a - 97
ANSI
El codi ANSI prové de les sigles American National Standards Institute del que és el
mateix que el codi Nord-americà Estàndard per al llenguatge de programació en C.
Va ser creat el 1963 i va néixer per expandir i ordenar tant els símbols com els
caràcters al nostre ordinador.
● Tipus
- C89: es va ratificar com a ANSI X3.159-1989 "Programming Language C." A
aquesta versió de l'estàndard se'l coneix com "ANSI C", o també "C".
- C90:l'estàndard ANSI C (amb algunes modificacions menors) va ser adoptat

per la International Organization for Standardization sota la denominació
ISO/IEC 9899:1990. A aquesta versió se'l coneix com a C90, si bé "C89" i
"C90" són, a efectes pràctics, el mateix llenguatge de programació.
- C99: ANSI va adoptar l'estàndard ISO/IEC 9899:1999. Aquest estàndard se'l

coneix com a C99.
- C11: És el nou estàndard per el llenguatge de programació C

● Evolució
● Exemples
UTF 8
UTF-8 és un format de codificació de caràcters Unicode. És el responsable que en el

teu navegador o client de correu et mostri el contingut del text correctament
descodificat, sense errors ni caràcters estranys.
● Unicode (que es?)
Quan el teu ordinador ha de representar qualsevol caràcter, per exemple,

qualsevol lletra de l'abecedari espanyol, el que fa és buscar entre tots els
caràcters que hi ha dins de l'estàndard Unicode i veure quin número té
assignat.
Unicode cobreix tots els caràcters de tots els sistemes d'escriptura del món,
moderns i antics. També inclou símbols tècnics, signes de puntuació i molts
altres caràcters que es fan servir per escriure text. Fins i tot els emoji tenen
els seus propis codis
● Tipus
Quan s'ha assignat un codi a un caràcter, es diu que aquest caràcter està codificat.
Perquè aquest número o codi sigui entès per l'ordinador ha d'estar codificat. Hi ha
tres formes de codificació amb el nom UTF (UTF-8, UTF-16 I UTF-32)
UTF-8 permet codificar qualsevol dels més de 120.000 caràcters de Unicode i fer-los
accessibles per als ordinadors. Divideix els caràcters Unicode en diversos grups, en
funció del nombre de bytes necessaris per codificar-los (d'1 a 4 bytes)
○ 1 byte: afecta els 128 caràcters inclosos en US-ASCII (anglès, latino i altres
llengües occidentals).
○ 2 bytes: inclou 1920 caràcters en total, entre els quals es troben els signes
diacrítics, els alfabets grec, hebreu, àrab, etc.
○ 3 bytes: caràcters del pla bàsic multilingüe d'Unicode, incloent els caràcters
del xinès, japonès i coreà.
○ 4 bytes: inclou símbols matemàtics i alfabets clàssics (ús principalment
acadèmic).
● Evolució
Va ser presentat en el 1993 i han aparegut altres versions al cap del temps com he
mencionat abans (UTF-16 I UTF-32)
● Exemples
Per exemple quan nosaltres creem una pàgina web amb HTML, utilitzem la
codificació UTF-8, ja que suporta molts idiomes i signes.
<meta charset=”utf-8″>.
UTF 16 (quina diferència hi ha amb el UTF 8)
● Explicació:
La mida del fitxer UTF-16 és la doble de la mida de UTF-8. A causa d'això, UTF-16
es considera menys eficient. UTF-16 no està orientat a bytes i no és compatible amb
caràcters ASCII.
UTF-16 és l'estàndard de codificació més antic al camp de la sèrie Unicode. Les

diverses aplicacions UTF-16 són l'ús a Microsoft Windows, JavaScript i programació
Java.
● Principals Diferències
1. La mida del fitxer UTF-8 és més petita, mentre que, per altra banda, la mida
del fitxer UTF-16 és el doble de la mida del fitxer UTF-8.
2. UTF-8 mostra compatibilitat amb les codificacions de caràcters ASCII, mentre
que, per altra banda, UTF-16 no mostra cap compatibilitat amb els caràcters
ASCII.
3. La codificació UTF-8 està orientada a bytes, mentre que la codificació UTF-

16 no està orientada a bytes.
4. La codificació UTF-8 és força bona per recuperar-se dels errors, mentre que
la codificació UTF-16 no és tan bona per recuperar-se dels errors que hem
fet.
5. UTF-8 utilitza almenys un byte (8 bits) mentre que comparativament, per altra
banda, UTF-16 utilitza almenys un o dos bytes (16 bits).
6. UTF-8 implementa al voltant d'1-4 blocs, mentre que, comparativament, per
altra banda, UTF-16 implementa al voltant d'1-2 blocs.
7. UTF-8 és més eficient mentre que, comparativament, per altra banda, UTF-
16 és menys eficient.
8. UTF-8 és més popular a la web, mentre que, comparativament, per altra
banda, UTF-16 no guanya gaire popularitat a la web.
ISO-8859-15
ISO 8859-15 és la part 15 de ISO 8859, un estàndard de codificació de caràcters

definit per l'Organització Internacional per a l'Estandardització. També és conegut
com a Latin-9, i de forma no oficial com a Latin-0 però no com a Latin-15. És similar
a ISO 8859-1, però substitueix alguns símbols poc comuns pel símbol de l'euro i
alguns altres caràcters que faltaven. Codifica els caràcters amb 8 bits i es pot fer
servir per representar l'alfabet i altres caràcters importants per emmagatzemar textos
en anglès, francès, alemany, espanyol i portuguès (entre altres idiomes d'Europa
occidental) en ordinadors.
● Tipus
● Evolució
● Exemples

Tasca Inicial en Grup - Codificació de Caràcters + Exposició

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Tasca Inicial en Grup - Codificació de Caràcters + Exposició

Uploaded by

Copyright:

Available Formats

Yasmine Fadiss & Jessica Martinez

Tasca inicial en grup: codificació de

ASCII, ANSI, UTF 8 i 16, ISO-8859-15

Cercar característiques, tipus, evolució, exemples de cada codificació de caràcters (en

Es classifiquen segons el tipus de caràcters que representin (2 grups)

Va ser creat en el 1945 per una companyia estadounidense però no es va convertir

Originalment el codi ASCII comptava únicament amb números i lletres majúscules,

- C90:l'estàndard ANSI C (amb algunes modificacions menors) va ser adoptat

- C99: ANSI va adoptar l'estàndard ISO/IEC 9899:1999. Aquest estàndard se'l

- C11: És el nou estàndard per el llenguatge de programació C

UTF-8 és un format de codificació de caràcters Unicode. És el responsable que en el

● Unicode (que es?)

Quan el teu ordinador ha de representar qualsevol caràcter, per exemple,

UTF 16 (quina diferència hi ha amb el UTF 8)

UTF-16 és l'estàndard de codificació més antic al camp de la sèrie Unicode. Les

3. La codificació UTF-8 està orientada a bytes, mentre que la codificació UTF-

ISO 8859-15 és la part 15 de ISO 8859, un estàndard de codificació de caràcters

You might also like