You are on page 1of 5

3.1.5.

Az adatkezels eszkzei - Tmrts, kicsomagols, archivls, adatvdelem

LLOMNYOK TMRTSE S KICSOMAGOLSA. A TMRTS FONTOSABB TPUSAI

A tmrts

A szmtgpek httrtrainak vges kapacitsa s a szmtgpes hlzatok


megjelense indokoltt tette olyan eljrsok kifejlesztst, amelyekkel adataink
eredeti mretknl kisebb terjedelmek lehetnek az eredeti informcitartalom
megrzse mellett. A kisebb terjedelem ltal a httrtrunkon kevesebb helyett
foglalnak el a tmrtett llomnyok s a hlzati adattvitelnl pedig kevsb
terhelik a kommunikcis csatornt.

Rviden: A tmrts egy olyan eljrs, amelynek segtsgvel egy fjlbl egy
kisebb fjl llthat el.

A tmrts elvei mr az 1950-es vekben megfogalmazdtak (Shannon s Fano).


Az els adattmrt algoritmusok az 1970-es vek vgn jelentek meg (Ziv s
Lempel).

Alapveten ktfle adattmrtsi megolds ltezik:

Ha a tmrtett fjlbl teljes mrtkben visszanyerhet az eredeti fjl (``bitrl


bitre''), nincs informciveszts, akkor vesztesgmentes tmrtsi eljrsrl
beszlhetnk.

Az adatok mrete cskken amellett, hogy annak minsge brmilyen mdon


vltozna; adatveszts nem kvetkezik be. Az eljrsok kztt azok jobbak, melyek
nagyobb tmrtst rnek el. A vesztesgmentesen elrhet mretcskkens
jelentsen kisebb, mint a vesztesgesen elrhet, tipikus mrtke 15%50%. A
tmrtett adatbl ksbb egy fordtott eljrssal pontosan visszanyerhet az eredeti
adat. Az olyan adatoknl, mint pldul a szveges dokumentumok kvetelmny a
vesztesgmentes tmrts, hiszen akr egyetlen bit vltozs is megvltoztathatja a
szveg jelentst. ltalnosan alkalmazhat, minden fjltpusra. Legelterjedtebb
tpusai: ZIP, RAR, ARJ

Ha a tmrtett fjlbl nem teljes mrtkben visszanyerhet az eredeti fjl, akkor


vesztesges tmrtsi eljrsrl beszlnk.
2015.01.16. 1/5
3.1.5. Az adatkezels eszkzei - Tmrts, kicsomagols, archivls, adatvdelem
Csak akkor alkalmazhat, ha kis eltrsek nem szmtanak, pl. kp- hang- s
videfjlok esetn. Ilyen esetekben csekly, a felhasznl szmra nem szrevehet
vesztesg megengedhet. Ezen gyakorta jelentkez esetek a tmrts hatsossgra
szles vlasztkot knlnak a felhasznlnak, attl fggen, hogy inkbb kevss
tmrtett j minsg vagy jobban tmrtett, de nagyobb vesztesget hagy
tmrtsi eljrst kvn alkalmazni. A kpek vagy hangok tmrtsnl egyttal az
emberi rzkszervek rzkenysge hatrozhatja meg az adattmrts mdjt, hisz
megengedhet olyan vesztesg, amely szmunkra nem szrevehet vltozst okoz
csupn. Legelterjedtebb tpusai: JPG, JPEG (kp), MP3 (hang), MPG, MPEG, AVI,
MKV (film)

Tmrthetsg, srlkenysg, hibaellenrzs, javts

A szmtgpen hasznlt llomnyok szinte mindig tbb jelet tartalmaznak, mint


amennyi az ltaluk hordozott informci megjelentshez szksges lenne, azaz
szinte mindig redundnsak. Ha egy llomnyban nagymrtk az ismtlds
(redundancia), akkor jl tmrthetv vlik (pl szvegfjlok, dokumentumok). Az
eleve tmrtett - teht redundancia mentes llomnyok mr nem lesznek jl
tmrthetek (pl. vesztesges tmrtvel ksztett multimdiafjlok).
A redundancia hasznos is lehet, ha szndkosan alaktottk vagy nveltk a
redundancit (pl. hibajavt kd alkalmazsa). Ebben az esetben llomnyaink
valamennyire vdettek a srlssel szemben, mert az ellenrz kdok lehetv
tehetik az eredeti llapot visszalltst.
A tmrtett llomny redundancija minimlis, hibs llapotnak felismerse,
javtsa teht problms. Ezrt szoks a tmrtett jelsorozatrl specilis matematikai
algoritmussal ellenrz sszeget kszteni. Az algoritmus a titkostsban,
hitelestsben is hasznlatos. Az algoritmus egy tetszleges nagy jelsorozatrl
lland, kismret jelsorozatot generl. Az eredeti jelsorozat apr vltozsa az
ellenrz sszeget is megvltoztatja s elvileg kizrt azonos ellenrz sszeg kt,
klnbz jelsorozathoz. A legismertebb ellenrz algoritmus a CRC (Cyclic
Redundancy Checking). A CRC csak hibaellenrzsre val. Lteznek hibajavt
megoldsok is, de ezek termszetknl fogva ismt csak nvelik a redundancit, s
ezzel cskkentik a tmrts hatkonysgt!

2015.01.16. 2/5
3.1.5. Az adatkezels eszkzei - Tmrts, kicsomagols, archivls, adatvdelem
Tmrtsi eljrsok

Blokkmret kihasznlsa: A trolterlet helyfoglalst cskkenti. Az


adatllomnyaink kttt hosszsg trolterletegysgekben kerlnek rgztsre,
ezek a blokkok. Egy blokkban csak egy llomny (egy llomnynak a rsze) lehet.
Ha pl. 512 bjt a blokkmret, az ennl kisebb llomnyok (vagy azok, melyek bjtban
mrt hosszt a blokkmrettel osztva maradkot adnak) felhasznlatlan bjtokat
hagynak. Amennyiben tbb llomnyt sszefogunk", akkor a trols folyamatoss,
felhasznlatlan bjtoktl mentess tehet. A TAR tmrts ezen az elven mkdik.

RLE (Run Length Encoding), futamhossz kdols: Azonos jelekbl ll


sorozatokat tartalmaz adatsorozat tmrtsnek egyszer mdszere. Ez a tmrts
egy-egy jelsorozatot kt jellel helyettest: az egyik jel a sorozatot alkotja, a msik az
ismtlds szma. A kdols akkor eredmnyez tmrtst, ha az ismtld
jelsorozat kettnl tbb (azonos) jelbl ll. Vesztesgmentes tmrts. Problmt
jelent, hogy a tmrtett llomnyban/llapotban meg kell klnbztetni az adatot s
az ismtldst jelz szmot. Erre ltalban specilis jelet hasznlnak (ez azonban
tovbb rontja a tmrts hatsfokt). Ennek alapjn tbb vltozata is hasznlatos az
RLE algoritmusnak.

Huffman-kdols: A mdszer alaptlete az, hogy a tmrtend jelsorozatban


lehetsges jelek nem mindegyike bukkan fel azonos gyakorisggal. Amennyiben a
gyakoribb jeleket rvidebb binris jelsorozattal brzoljuk, akkor ez tmrtst
eredmnyezhet mg akkor is, ha ezrt cserbe a ritkbban felbukkan jeleket az
alaprtelmezettnl hosszabb jellel kell brzolni. Szoks az ilyen tmrtket
statisztikai tmrtnek is nevezni. Ezek is vesztesgmentes tmrtsi eljrsok.

Els lpsben a tmrtend jelek gyakorisgt kell megllaptani. A kvetkez


lpsben binris fa kszl. Fontos, hogy egy tmrtend jelsorozathoz csak egyetlen
binris fa rajzolhat, ez a kitmrts egyrtelmsgnek kulcsa. A harmadik
2015.01.16. 3/5
3.1.5. Az adatkezels eszkzei - Tmrts, kicsomagols, archivls, adatvdelem
lpsben a fa minden lhez 0 vagy 1 lesz hozzrendelve. A negyedik, befejez
lpsben minden levl kdjt kpezzk gy, hogy a gykrtl a levlig sorba tesszk
a 0-s s 1-es jeleket. Az gy kialakul n. kdszavakat hasznlva az eredeti
jelsorozatnl a tmrtett kisebb lehet.

Tmrtett fjlformtumok

JPEG: Kpek tmrtsre hasznlatos vesztesges tmrts. A kpek


sznvltozsnak adataibl hagy el rtket, mivel az emberi szem a
fnyessgvltozsra rzkenyebb. A 8x8-as blokkokban hajt vgre transzformcit,
majd az gy kapott rtkeket rendezi s Huffman-kdolssal tmrti. (A blokkokra
bonts miatt, nagy tmrtsi arny esetn jelentkezik a kpek kocksodsa".)

MP3: Vesztesges, hangok tmrtsre alkalmazott mdszer. 1992ben fejlesztette


ki a Fraunhofer Institute. Igen jl tmrt, a hanghatst kevss rontja. Az emberi
halls szelektivitsra pt, azaz bizonyos hangok ms hangok elnyomst (kzeli
frekvencikon csak az intenzvebb hangot rzkeljk) kihasznlva hagy ki a
tmrtend jelsorozatbl jeleket. A tmrts fontos - de nem kizrlagos jellemzje
- a bitsrsg, azaz annak megadsa, hogy msodpercenknt hny binris szmjegy
troldik. Minl nagyon ez az rtk, annl jobb a hangzsminsg. Korbban ez egy
zeneszmra lland volt, jabban dinamikusan vltoztatjk a tmrtk.

WMA (Windows Media Audio): A Microsoft ltal hangok tmrtsre


kidolgozott vesztesges tmrt eljrs. Jobban tmrt, mint az MP3, de ksbb
jelent meg, ezrt tmogatottsga nem annyira elterjedt.

MPEG (Motion Picture Experts Group): Vesztesges, mozgkpek tmrtsre


kidolgozott szabvnycsald. Tbb vltozatbl az 1998ban kzreadott MPEG4 a
legelterjedtebb.

ZIP: igen elterjedt, vesztesgmentesen tmrtett llomnytpus. Szmtalan


program hasznlja, pl. Windows alatt WwinZIP

ARJ: Robert K. Jung ltal ksztett azonos nev programmal kszthet


tmrtvny, vesztesgmentes tmrtst valst meg. Igen sok opcija van a
tmrtvny ltrehozatalhoz.
2015.01.16. 4/5
3.1.5. Az adatkezels eszkzei - Tmrts, kicsomagols, archivls, adatvdelem
RAR: Eugene Roshal hasonl nev programjnak llomnytpusa,
vesztesgmentes tmrtst tartalmaz. A RAR formtumot tbb-kevesebb
korltozssal tbb ms tmrt is kezeli.

A legelterjedtebb tmrt programok

Napjainkban szmos tmrt program kzl vlaszthatunk. Ezek kzl a


legismertebbek a WinZip, s a WinRar. Mindegyik ltalnos jellemzje, hogy a sajt
maguk ltal alkalmazott tmrtsi szabvnyon kvl kpesek ms tmrtsi
szabvnnyal kszlt archv fjlok kibontsra s bizonyos esetekben akr mg azok
ltrehozsra is. A legtbb tmrt programot a hagyomnyos vsrlsi mdon kvl
az internetrl is beszerezhetjk. Az elbb emltett programokat pldul az albbi
cmekrl tlthetjk le:
WinZip: www.winzip.com
WinRar: www.rarlab.com, www.winrar.hu

A megadott cmekrl ltalban a programok kiprbl vltozata tlthet le, amely


30 napon keresztl teljes rtk programknt mkdik, ezt kveten azonban a
tovbbi hasznlathoz meg kell vsrolnunk.

A WinRar hasznlata
Megkeressk a mappt, kijelljk a tmrteni kvnt fjlokat.
Az Add (hozzad) eszkzre kattintva a dialgusablakban berjuk a helyet s a
tmrtett(archv) llomny nevt.
Kivlasztjuk a tmrts tpust (zip, rar).
A kicsomagols hasonlan, de az Extract to (Kicsomagols) ikonnal trtnik.

2015.01.16. 5/5

You might also like