Dosya Sikistirma
Icerik
Dosya shstime edi?
Dosya sikistimma yontemleri nelerdir?
= Rundengh Kodiamas
= Hutfman Kodamasi
Dosya Sikistirma
Dosya sikistimaya niin itiyag duyulmustur?
Minimum alana maksmum veri sigdirmake
Dana nai aktarm sagiamak, eng siresini azatmak
= Sradizensel verieri daha hz igeyebiimet
‘Sabit wuniuklu alanlar dosya skigtimada en iyi adaylardir
Dahs yogun bir gisterimie temsil alan bitlerin sayie! szaltimaktedir.
Dezavantajlen
+ Irsanler terafircan anlasiabilr dedi.
= Kodlama igi ekstra maliyet gerektrir.
= Kad gozme modblierine gereksinim vardir. Bu da karmasihig arte.
Run-Length Kodlama Algoritmasi
Ayni byte dailernin sikckullaniidig cosyalar ign uygundur.
Bir dizideki aymi deger birden fazla kez ortaye gikarsa 3 byte ile yer
epistirr. Bu 3 byte
= Oza) bireseape taraitor! Run.Lengih kodu bolted FF»)
= Telsar econ deger
= Degerin takrar te sikighOrnek
Asabidaki veri seti bu dgoritmaya gore kadlayalim,
22 23 2 mM 2 24 2 74 24 25 Veri Seti
225 28 25 2 26 2 24
Kodlama sonucunde:
22 23 FF 24 07 25 FF 26 06 25 m4 eeecil
Veri setinin teyutu kodlama sonucunda 18 byte'tan 11 byte'a dismistir
Bu kodlema, bein bir mikter alan kazenmay! geranti etmez.
Bazi durumiarda, sikgtivlan veri seti, ofinal veri setinden daha oiylk
olabilmektedt.
Mors Kodlamasi
En eski ve yeygin olarak kullanilan kedlamadir
Her bir karakter ile 2 gesit sembol iigkiencirilmtr.
Baz degerier, cgerlerinden daha fazia sayica kullanr
a
BHuffman Kodlamasi
EE Hutrenccienes,taypse skstma algortnase
Bu todlema degigken uzunlukta bir kodlama olup bu kodlama mors
odlamasinin ersine veri setindeki keakterierin fekansina baGlidr
BFF Soorims. bir veri setinde daha cok rastanan bir semboll daha diisik
tzunluktaki fodla, éahe az rstianan sembold ise éaha blyik uzunluttaki
todla femal ecimesine dayenmaktad
eri setindeki sembol sayisina ve bu sembollern tekrarlama sayisina bagit
darak %10 le %90 arasinda detigen oranlarda bir skistima elde
editbilir.
{EE utinan winignds senboteriarakierer) ASCIIGe oldugu gb sabi
rlutal! olan kulenmacier rer br sen! degen saya
vaurlutiaki kad le Koda
FT Bier omerinististrabinek cin tu Kime gersndelisenbolern
tekrar etme sikliklerinin blinmesi gerekmektedir. Her sembolln ne
kadar sikikta wkrar ettigini gisteren tebloya frekans tablosu cenir.
Huffman Kodlamasi (Islem Adimlart)
FE oterek, ver stn et tokens ebiony olugrir
Ardindan, hangi karakterin hangi btlerle temsil edilecegini gésteren
Huffman agact olustiruer
Ornek 1
Ver setine aitfrekane blosu agagicaki gbi olsun.
‘Sembol Frekans
A 60
8 40
c 25
D 20
E 70