You are on page 1of 12

UNIVERSITAS ISLAM NEGERI

MULTIMEDIA DATA TEKNOLOGI


Yang diampuh oleh M.Ridha,ST

Judul : Perbandingan ASCII Character Sets,


Extended Charakter Sets, Unicode.

FITRIANDINI (10751000174)
( v3_andien@yahoo.com )

TEKNIK INFORMATIKA
SAINS DAN TEKNOLOGI
UIN SULTAN SYARIF QASIM
2009
Sejarah Text
Text atau simbol telah dikenal sebagai alat komunikasi sejak 6000
tahun yang lalu di Mesopotamia, Mesir, Sumeria dan Babilonia.
Perkembangan yang paling fenomenal dari text adalah saat digunakan
pada internet sebagai bagian yang menentukan tampilan pada layar
monitor. Bahkan saat ini perkembangan HTML (Hypertext Markup
Language) telah menjadi unsur penting dalam pembuatan presentasi
apalagi yang berbasis multimedia.

Huruf, angka dan karakteristik-karakteristik khusus pada komputer


direpresentasikan dengan skema pengkodean biner artinya, nilai off/on
0 dan 1 disusun dengan cara tertentu agar bisa merepresentasikan
karakter, digit atau bentuk-bentuk lain.

Terdapat beberapa karakter yang saat ini digunakan pada komputer


yaitu ASCII, Extended character sets dan Unicode. Kode ASCII
merupakan suatu standard internasional yang dibuat oleh American
National Standars Institute (ANSI) untuk mendefinisikan bagaimana
komputer menulis dan membaca karakter (Seperti karakter untuk
menandai akhir baris) Setiap karakter dipresentasikan dengan angka.
ASCII lebih bersifat universal. Kode ASCII selalu digunakan pada
komputer dan alat komunikasi lain untuk menunjukkan teks.

Keunggulan Unicode (16 bit) dari ASCII (8 bit) adalah kemampuanya


untuk menyimpan symbol / karakter yang jauh lebih besar. Himpunan
256 karakter pertama dari Unicode merupakan pemetaan karakter
ASCII 8 bit sehingga Unicode tetap kompatibel dengan ASCII. Selain
mempresentasikan seluruh karakter ASCII, Unicode dapat
mempresentasikan berbagai macam simbol diluar ASCII, seperti huruf
Arab, Kanji, Hiragana, Katakana dan lain-lain.

Berikut merupakan penulisan karakter pada komputer.

ASCII ( red : ask-ee)

ASCII (American Standard Code for Information Interchange) adalah


kode biner yang secara luas dipakai pada mikrokomputer. ASCII
mempresentasikan setiap karakter sebagai 8 bit dimulai dari 0000
0000 hingga 1111 1111 maka total kombinasi yang dihasilkan
sebanyak 256. Kode 0 hingga 255 dalam sistem bilangan desimal
untuk menuliskan huruf, angka dan tanda baca standard dalam bahasa
Inggris. ASCII versi baru bernama Extended ASCII yang bisa mencakup
karakter semacam simbol matematis dan huruf-huruf Yunani. Namun,
256 huruf ASCII tidak akan cukup untuk menangani bahasa-bahasa lain
semacam bahasa Cina atau Jepang yang memiliki ribuan karakter.

Terdapat dua macam ASCII yang mempergunakan yaitu 7 bit dan 8 bit.
Pada ASCII yang mempergunakan 7 bit, terdapat dua kelompok
karakter, yaitu
1. Karakter Kontrol, digunakan untuk mengontrol pengiriman atau
transmisi data
2. Karakter Informasi, merupakan karakter yang mewakili data

Tabel Karakter ASCII


Karakter ASCII-8 Karakter ASCII-8
A 0100 0001 N 0100 1110
B 0100 0010 O 0100 1111
C 0100 0011 P 0101 0000
D 0100 0100 Q 0101 0001
E 0100 0101 R 0101 0010
F 0100 0110 S 0101 0011
G 0100 0111 T 0101 0100
H 0100 1000 U 0101 0101
I 0100 1001 V 0101 0110
J 0100 1010 W 0101 0111
K 0100 1011 X 0101 1000
L 0100 1100 Y 0101 1001
M 0100 1101 Z 0101 1010

0 0011 0000 5 0011 0101


1 0011 0001 6 0011 0110
2 0011 0010 7 0011 0111
3 0011 0011 8 0011 1000
4 0011 0100 9 0011 1001
! 0010 0001 ; 0011 1011

EXTENDED Character Sets

Tampilan karakter yang digunakan dalam berbagai abjad (Eropa dan


Asia) dan simbol-simbol khusus. Untuk menampilkan salah satu
karakter gunakan &#n; , dimana n adalah angka yang sesuai.
Sejumlah bahasa mengunakan karakter yang lebih besar daripada
kisaranyanya. Contoh nilai tipe char Jepang dan Cina. GNU C Library
berisi dukungan untuk 2 mekanisme menangani rangkaian karakter
diperpanjang yaitu multibyte dan karakter lebar. Berikut merupakan
karakter extended HTML.

Tabel Karakter Extended Character Sets


ASCII char ASCII char ASCII Char ASCII char
257 ā 258 Sebuah 259 Sebuah 260 Sebuah
261 sebuah 262 C 263 Ć 264 C
265 C 266 C 267 C 268 Č
269 č 270 D 271 D 272 ©
273 đ 274 E 275 E 276 E
277 E 278 E 279 E 280 E
281 ę 282 E 283 E 284 G
285 G 286 Ğ 287 Ğ 288 G
289 G 290 Ģ 291 Ģ 292 H
293 h 294 H 295 H 296 Ĩ
297 Ĩ 298 Ī 299 Ī 300 Aku
301 Aku 302 Į 303 Į 304 Aku
305 ı 306 IJ 307 IJ 308 J
309 J 310 Ķ 311 Ķ 312 ĸ
313 L 314 L 315 L 316 ļ
317 L 318 L 319 L 320 L
321 Ł 322 Ł 323 N 324 N
325 Ņ 326 Ņ 327 N 328 N
329 ʼn 330 Ŋ 331 Ŋ 332 O
333 ō 334 O 335 O 336 O
337 o 338 Π339 Π340 R
341 ŕ 342 R 343 R 344 R
345 R 346 S 347 Ś 348 S
349 s 350 Ş 351 Ş 352 Š
353 š 354 T 355 Ţ 356 T
357 ť 358 Ŧ 359 Ŧ 360 U
361 ũ 362 U 363 Ū 364 U
365 U 366 U 367 U 368 Ű
369 ű 370 U 371 U 372 W
373 w 374 Y 375 Y 376 Ÿ
377 Z 378 Z 379 Z 380 Z
381 Ž 382 ž 383 ſ 384 ƀ
385 Ɓ 386 Ƃ 387 Ƃ 388 Ƅ
389 ƅ 390 Ɔ 391 Ƈ 392 ƈ
393 Ɖ 394 Ɗ 395 Ƌ 396 ƌ
397 ƍ 398 Ǝ 399 Ə 400 Ɛ
401 Ƒ 402 ƒ 403 Ɠ 404 Ɣ
405 ƕ 406 Ɩ 407 Ɨ 408 Ƙ
409 ƙ 410 ƚ 411 ƛ 412 Ɯ
413 Ɲ 414 ƞ 415 Ɵ 416 O
417 o 418 Ƣ 419 Ƣ 420 Ƥ
421 ƥ 422 Ʀ 423 Ƨ 424 ƨ
425 Σ 426 ƪ 427 ƫ 428 Ƭ
429 ƭ 430 Ʈ 431 U 432 U
433 Ʊ 434 Ʋ 435 Ƴ 436 ƴ
437 Z 438 Z 439 Ʒ 440 Ƹ
441 ƹ 442 ƺ 443 ƻ 444 Ƽ
445 ƽ 446 ƾ 447 Ƿ 448 |
449 ǁ 450 ǂ 451 ! 452 DŽ
453 DŽ 454 dž 455 LJ 456 LJ
457 lj 458 NJ 459 NJ 460 nj
461 Ǎ 462 ǎ 463 Ǐ 464 ǐ
465 Ǒ 466 ǒ 467 Ǔ 468 ǔ
469 Ǖ 470 ǖ 471 Ǘ 472 ǘ
473 Ǚ 474 ǚ 475 Ǜ 476 ǜ
477 ǝ 478 Ǟ 479 Ǟ 480 Ǡ
481 ǡ 482 Ǣ 483 Ǣ 484 Penilai
485 penilai 486 Ǧ 487 Ǧ 488 Ǩ
489 ǩ 490 Ǫ 491 Ǫ 492 Ǭ
493 ǭ 494 Ǯ 495 Ǯ 496 ǰ
497 DZ 498 DZ 499 dz 500 Dibolehkan
501 dibolehkan 502 Ƕ 503 Ƿ 504 Ǹ
505 ǹ 506 Ǻ 507 ǻ 508 Ǽ
509 ǽ 510 Ǿ 511 ǿ 512 Ȁ
513 ȁ 514 Ȃ 515 ȃ 516 Ȅ
517 ȅ 518 Ȇ 519 ȇ 520 Ȉ
521 ȉ 522 Ȋ 523 ȋ 524 Ȍ
525 ȍ 526 Ȏ 527 ȏ 528 Ȑ
529 ȑ 530 Ȓ 531 ȓ 532 Ȕ
533 ȕ 534 Ȗ 535 ȗ 536 Ş
537 ş 538 T 539 Ţ 540 Ȝ
541 ȝ 542 Ȟ 543 ȟ 544 Ƞ
545 ȡ 546 Ȣ 547 ȣ 548 Ȥ
549 ȥ 550 Ȧ 551 ȧ 552 Ȩ
553 Ȩ 554 Ȫ 555 ȫ 556 Ȭ
Nomor ini nomor ini
557 ȭ 558 sesuai 559 sesuai 560 Ȱ
dengan dengan
561 Ȱ 562 Á 563 ȳ 564 ȴ

UNICODE

Dikembangkan pada awal tahun 1990. Diciptakan oleh konsorsium


perusahaan seperti Apple, Microsoft, HP, Digital dan IBM kemudian
digabungkan dengan standar ISO-10646 untuk menghasilkan satu
standar pada tahun 1993. Unicode memakai 2 byte (16bit) untuk
mempresentasika karakter, tidak hanya sekedar 1 byte (8 bit). Dengan
Demikan, banyak karakter yang dapat dipresentasikan adalah 216 atau
65.536 karakter.

Unicode dirancang untuk mencakupi bahasa/teks yang ada dunia


termasuk simbol-simbol ilmiah dan bahasa-bahasa pada subjek ilmiah.
Ini meghilangkan kerumitan multibyte rangkaian karakter yang sedang
digunakan pada UNIX dan Windows untuk mendukung bahasa Asia.
Unicode sudah merupakan dasar untuk satu sistem operasi Windows /
NT.

Unicode merupakan paket karakter standar yang digunakan pada NTFS


dan menggantikan karakter older-single byte ASCII. Setiap karakter
pada kebanyakan bahasa yang natural adalah direpresentasikan
dengan double-byte number dalam paket karakter Unicode.

Set karakter Unicode disusun dalam urutan abjad dari nama referensi
entitas terkait. Kita dapat menggunakan karakter seperti "β" secara
langsung (dengan menyalin dan menyisipkan karakter) atau dapat
memilih untuk referensi mereka dengan entitas referensi
sebagai “β” dalam elemen token presentasi.

Tabel karakter Unicode


Aku
Iacute Í ic icirc î Icirc Î Dingin И dingin и
dingin и Idot Aku iecy е IEcy Е iexcl ¡ IFF ⇔
Ifr ℑ Igrave Ì igrave ì iiint ∭ iiota ℩ IJlig IJ
ijlig ij Im ℑ Imacr Ī imacr ī gambar ℑ imagline ℐ
Menyi
imagpart ℑ imath ı imof ⊷ ⇒ di ∈ incare ℅
ratkan
infin ∞ inodot ı int ∫ Int ∬ intcal ⊺ bilangan ℤ
Persim
intlarh InvisibleC
Integral ∫ intercal ⊺ panga ⋂ ⨗ IOcy Ё
k omma
n
sedikit
iocy ё Iogon Į iogon į ι iquest ¿ Iscr ℐ
pun
isin ∈ isindot ⋵ isinE ⋹ isins ⋴ isinv ∈ Itilde Ĩ
Itilde Ĩ itilde Ĩ iukcy і Iukcy І Iuml Ï iuml ï
J
jcirc J jcy й jsercy ј Jsercy Ј Jukcy Є jukcy є
K
kappa κ kappav κ Kcedil Ķ kcedil ķ Kcy К kcy к
kgreen ĸ khcy х KHcy Х KJcy Ќ kjcy ќ kcy к
L
laempt
lacute L Lacute L ⦴ lagran ℒ lAarr ⇚ Lambda Λ
yv
pangkua
lambda λ Lang " lang < langd ⦴ langle < ≲
n
Laplacetrf ℒ laquo « larr ← Larr ↞ lArr ⇐ lArr ⇐
larrb ⇤ larrbfs ⤟ larrfs ⤝ larrhk ↩ larrlp ↫ larrb ⇐
larrtl ↢ lbbrk 〔 lbrace ( lbrack [ lbrke ⦴ lcaron L
lcaron L Lcaron L Lcedil L lcedil ļ lceil ⌈ lcub (
Lcy Л lcy л ldquo " ldquor " le ≤ le ≦
LeftArro
LeftAngle Leftarro Leftarr Leftar LeftArrow
< ⇐ ← ← ⇤ wRightA ⇆
Bracket w ow row Bar
rrow
LeftD LeftD
LeftDow
leftarrowta LeftCeil ouble ownT LeftDown
↢ ⌈ [ ⥡ ⇃ nVector ⥙
il ing Bracke eeVec Vector
Bar
t tor
leftharp lefthar leftleft
Leftrightar leftrighta
LeftFloor ⌊ oondow ↽ poonu ↼ arrow ⇇ ⇔ ↔
row rrow
n p s
leftharp lefthar leftleft leftrights
leftrighthar
LeftFloor ⌊ oondow ↽ poonu ↼ arrow ⇇ ⇋ quigarro ↭
poons
n p s w
leftright LeftRi
leftrighthar LeftT LeftTeeArr LeftTee
⇋ squigarr ↭ ghtVe ⥎ ⊣ ↤ ⥚
poons ee ow Vector
ow ctor
leftthreeti ⋋ LeftTria ⊲ LeftTr ⧏ LeftTr ⊴ LeftUpDo ⥑ LeftUpV ↿
mes ngle iangle iangle wnVector ector
Bar Equal
kaki ⋚ kaki ⋚ leq ≤ leqq ≦ lessapprox ≲ lessdot ⋖
LessE LessF
lesseqqg LessGreate
lesseqgtr ⋚ ⋚ qualGr ⋚ ullEqu ≦ ≶ lessgtr ≶
tr r
eater al
LessTi
lessgtr ≶ lesssim ≲ ≲ lfloor ⌊ lg ≶ lhard ↽
lde
lharu ↼ ljcy љ LJcy Љ LL ⋘ ll « llarr ⇇
Lleftarr Lmido
llcorner ⌞ ⇚ llhard ⥫ L lmidot L lmoust ⎰
ow t
lne ≨ lnE ≨ lneq ≨ lneqq ≨ lnsim ⋦ lobrk [
LowerRi
looparrowl looparro lowba LowerLeft
↫ ↬ lopar 〘 _ ↙ ghtArro ↘
eft wright r Arrow
w
lrcorn
Loz ◊ lpar ( lrarr ⇆ ⌟ lrhar ⇋ lrtri ⊿
er
lscr ℓ Lscr ℒ lsh ↰ Lsh ↰ lsim ≲ lsqb [
lsquo ' lsquor , lstrok Ł Lstrok Ł Lt « lt <
ltdot ⋖ lthree ⋋ ltimes ⋉ ltri ◃ ltrie ⊴ ltrif ◂
M
Malte
macr ¯ laki-laki ♂ malt ✠ ✠ peta ↦ mapsto ↦
se
mapstodo mapstol mapst marke
↧ ↤ ↥ ▮ MCv М mcomma ⦴
wn eft oup r
measu
mDDo MediumSp
MCv м mdash -- ∺ redan ∡   Mellintrf ℳ
t ace
gle
pertengaha
Mfr � mfr ⦴ mho ℧ mikro μ | midast *
n
minus
midcir ⦴ middot · minus -- ⊟ minusd ∸ minusdu ⦴
b
mnplu
MinusPlus ∓ mldr ... ∓ model ⊧ mp ∓ Mscr ℳ
s
Multi muma
mstpos ∾ mu μ ⊸ ⊸
map p
N
nabla ∇ nacute N Nacute N nang ∠ ̸ tidur ≉ tengkuk ⦴ ̸
nappro
napid ≋ ̸ napos ʼn ≉ natur ♮ alam ♮ alami ℕ
x
nbump
nbsp nbump ≎ ̸ ≏ ̸ ncap ⦴ Ncaron N ncaron N
e
ncong
Ncedil Ņ ncedil Ņ ncong ≇ ⦴ ̸ ncup ⦴ ncy н
dot
Ncy Н ndash -- ne ≠ nearh ⤤ neArr ⇗ nearr ↗
k
NestedG
nearrow ↗ nedot ≠ ⦴ nequiv ≢ nesear ⤨ nesim ≂ ̸ reaterGre »
ater
NestedLes nexist
« Newline nexist ∄ ∄ nge ≱ ngeqq ≱
sLess s
ngeqslant ≱ nges ≱ ngsim ≵ NGT ≯ NGT »̸ ngtr ≯
nharr ↮ nhArr ⇎ ni ∋ NIV ∋ njcy њ NJcy Њ
nLeftarro
nlArr ⇍ nlarr ↚ nldr ‥ nlE ≰ nleftarrow ↚ ⇍
w
nLeftrighta nleftrigh ≰
⇎ ↮ nleq nleqq ≰ nleqslant ≰ nles ≰
rrow tarrow ⦴
nless ≮ nlsim ≴ NLT ≮ nltri ⋪ nltrie ⋬ nmid ∤
NonBre
NotCongru NotCup
NoBreak akingSp Nopf ℕ tidak ¬ ≢ ≭
ent Cap
ace
NotDouble NotGreat
NotEle NotEq NotEx
VerticalBa ∦ ∉ ≠ ∄ NotGreater ≯ erFullEq ≰
ment ual ists
r ual
NotGrea NotGr NotLeftT
NotGreater NotLeftTri
≹ terSlant ≱ eaterTi ≵ notin ∉ ⋪ riangleE ⋬
Less angle
Equal lde qual
NotLe NotLe
NotLess
NotLess ≮ ≸ ssSlant ≰ ssTild ≴ notni ∌ notniva ∌
Greater
Equal e
NotPrec NotRe NotRi NotRightT NotSqua
NotPreced
⊀ edesSla ⋠ verseE ∌ ghtTri ⋫ riangleEqu ⋭ reSubset ⋢
es
ntEqual lement angle al Equal
NotSquare NotRe NotSu NotSucc
NotSubs NotSuccee
SupersetEq ⋣ ⊄ verseE ∌ bsetE ⊈ ⊁ eedsSlan ⋡
et ds
ual lement qual tEqual
NotSupe NotTil
NotSupers NotTil NotTildeTi NotVerti
⊅ rsetEqua ⊉ ≁ deEqu ≄ ≉ ∤
et de lde calBar
l al
nprcu
npar ∦ nparallel ∦ NPR ⊀ ⋠ nprec ⊀ nrarr ↛
e
nrightarr nRight
nrArr ⇏ ↛ ⇏ nrtri ⋫ nrtrie ⋭ nsc ⊁
ow arrow
nsime
nsccue ⋡ nsim ≁ nsime ≄ ≄ nsqsube ⋢ nsqsupe ⋣
q
nsubs nsubsete
nsub ⊄ nsubE ⊈ nsube ⊈ ⊄ nsubseteq ⊈ ⊈
et qq
nsupsete
nsucc ⊁ nsup ⊅ nsupE ⊉ nsupe ⊉ nsupset ⊅ ⊉
q
ntriangle
nsupseteqq ⊉ ntgl ≹ Ntilde Ñ ntilde ñ ntlg ≸ ⋪
left
ntriang
ntrianglele ntriangl
⋬ ⋫ leright ⋭ nu ν num # numero №
fteq eright
eq
nVdas nvDas
numsp   nVDash ⊯ ⊮ ⊭ nvdash ⊬ nvge ≱
h h
nvgt ≯ nvHarr ⇎ nvlArr ⇍ nvle ≰ nvlt ≮ nvrArr ⇏
nwarro
nwarr ↖ nwArr ⇖ ↖ nvle ≰ nvlt ≮ nvrArr ⇏
w
O
Oacute Ó oacute ó oast ⊛ ocir ⊚ ocirc ô Ocirc Ô
Ocy О ocy о odash ⊝ odblac o Odblac O odot ⊙
ograv
OElig Œ oelig œ ogon ˛ ò Ograve Ò ohm Ω
e
Omac
sendi ∮ olarr ↺ omacr ō O Omega Ω omega ω
r
OpenCu OpenC
ominus ⊖ rlyDoub " urlyQu ' oplus ⊕ atau ∨ orarr ↻
leQuote ote
urutan ℴ orderof ℴ ordf ª ordm º origof ⊶ oS Ⓢ
oscr ℴ Oslash Ø oslash ø osol ⊘ Otilde Õ otilde õ
OverBra
otimes ⊗ Ouml Ö ouml ö ovbar ⌽ OverBar ¯ (
ce
OverP
OverBra
OverBar ¯ ( arenth (
ce
esis
P
par ∥ para ¶ paralel ∥ bagian ∂ PartialD ∂ pcy п
period
Pcy П percnt % . permil ‰ pelaku ⊥ pertenk ‱
e
pertenk ‱Phi Φ phi φphiv φ phmmat ℳ telepon ☎
Pi Π pi π garpu ⋔ PIV π planckh ℎ plankv ℏ
ditam PlusMin
PIV π planckh ℎ plankv ℏ + plusb ⊞ ±
bah us
Poinca
plusmn ± pm ± replan ℌ Popf ℙ pon £ pr ≺
e
precap preccurlye Mendahu
Prap ≾ prcue ≼ prec ≺ ≾ ≼ ≺
prox q lui
Preced
PrecedesSl precnap precns
≼ ⋨ esTild ≾ ⋨ precsim ≾ Perdana "
antEqual prox im
e
perdana ' prima ℙ prnap ⋨ prnE ⪵ prnsim ⋨ prod Π
proflin profsu
Produk Π profalar ⌮ ⌒ ⌮ prop Α Proporsi ∷
e rf
Proporsion
Α propto Α prsim ≾ prurel ⊰ psi ψ Psi Ψ
al
Q
Qfr ⦴ qfr ⦴ qint ⨌Qopf ℚ qopf � qprime ⁗
quaterni pencar
Qscr ⦴ ℍ quatint ⨖ ? questeq ≟ quot "
ons ian

Unicode memiliki cara untuk mensintesis sebuah karakter beraksen


dengan cara menggabungkan aksen simbol dan karakter dasar.
Misalnya, menggabungkan 'a' dan '~' membuat 'seorang' dengan tilde.
Lebih dari dua aksen simbol dapat ditambahkan ke karakter dasar.

Bahasa seperti Thailand perlu mengkombinasikan karakter.


Menggabungkan karakter adalah satu-satunya metode untuk
mengekspresikan karakter dalam bahasa-bahasa. Namun, beberapa
masalah muncul.
Gandakan Encoding
Ada beberapa cara untuk mengekspresikan karakter yang sama.
Sebagai contoh, u dengan umlaut dapat dinyatakan sebagai u 00 fc
dan juga sebagai u 0.075 + U 0.308.

Kelebihan Unicode character set dibandingkan dengan character set


yang propietary:
 Menyusun character set sendiri, harus membujuk-membujuk
vendor operating system untuk mensupportnya.
 Dengan Unicode, operating system pasti mensupportnya, tinggal
supply file font dan keyboard driver.
 Untuk di-golive-kan ke Internet Unicode juga bisa, Internet
menggunakan UTF-8 (suatu varian Unicode) untuk pertukaran
data.
REFERENSI

www.google.com/translate

http://www.unicode.org

www.baliunicode-ufaq.com

www.wordpress.com/SukadiBlog

Suhanto@geeks.”ASCII.ANSI,ISO-8859-1,dan UTP-8”.20/10/2008

www.syopian.net

You might also like