You are on page 1of 10

AUDIO KOMPRESIJA

Digitalna audio kompresija omoguava efikasno skladitenje i prenos audio


sadraja. Audio kompresija se moe podijeliti u dvije grupe:
kompresija bez gubitaka (lossless compression)
kompresija sa gubitkom (lossy compression)
Danas mnogo ega iz domena AV kvaliteta ne bi bilo ukoliko ne bi bilo
mogunosti kompresije.
Kompresija audio zapisa je bazirana na:
osobinama ljudskog uha,
odnosno injenici da neke frekvencije ujemo dosta slabije od drugih, a
neke ak i ne ujemo.

Tehnologija kompresije zvuka je poslednjih godina prilino unapreena i,
ukoliko se ne zahteva stepen kompresije (vei od 10:1)
skoro da je nemogue primetiti razliku izmeu orginalnog i zvunog
zapisa nad kojim je izvrena kompresija.


Kompresija bez gubitaka
Kompresija bez gubitaka kompresuje audio sadraj na
takav nain da se prilikom njegove dekompresije dobija
signal koji je potpuno identian poetnom signalu. Iako
ima svojih prednosti, ova vrsta kompresije nije postigla
veu popularnost u digitalnoj audio kompresiji,
prvenstveno zbog malog stepena kompresije koji se za
zvuk CD kvaliteta (16 bita, 44.1 KHz) kree izmeu 30% i
50%. Tehnike kompresije bez gubitaka se uglavnom
razlikuju po brzini audio kompresije i dekompresije dok
kvalitet kompresovanog sadraja nema nikakvu ulogu.
Kompresija sa gubicima
Zvuk koji se smatra manje vanim je kodiran sa smanjenom
preciznou ili nije u opte kodiran, zbog toga kompresija sa gubitkom
smanjuje taj shvatljivi viak. Da bi se odredilo koje informacije u
audio signalu su manje vane, veina algoritama kompresije sa
gubitkom koriste transformacije kao to je modifikovana diskretna
kosinusna transformacija (MDCT) da konvertuje vremenski domen
semplovanog zvuka u domen frekvencije. Komponentama frekvencija
mogu se alocirati bitovi na osnovu njihove zvunosti.
Zvunost frekvencijske komponente se definie tako to se prvo
izraunava prag maskiranja ispod koje se pretpostavlja da je zvuk
izvan limita ljudske percepcije (psiho-akustini model). Takoe neki
algoritmi kompresije sa gubitkom koriste LPC (Linear Perceptive
Coding) da konvertuju vremenski domen semplovanog zvuka.
Poto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio
zvuka, ova kompresija se smatra neodgovarajuom kod profesionalnih
audio ininjerskih aplikacija kao to je editiranje zvuka i multitrack
snimanja zvuka. Meutim, ova kompresija je veoma pogodna za
prenos i skladitenje audio podataka.
MP3
MP3 ili MPEG-1 Audio Layer 3 je najraireniji audio
format zapisa fajla u kome je primenjena kompresija sa
gubitkom, koji se razvio kao audio komponenta
MPEG video zapisa i vrlo brzo samostalno postao
najkorieniji oblik audio zapisa.

MP3 omoguava kompresiju zvuka CD kvaliteta bez
ikakvih vidljivih gubitaka uz stepen kompresije oko 10:1.

Na slici je dat grafiki prikaz procesa kompresije i
dekompresije zvuka

MPEG audio kompresija / MPEG-1
Layer-3 (MP3)
The Motion Picture Experts Group (MPEG) radna grupa je osnovana
1988. godine i definisala je standarde za video i audio kompresiju.
Objavljen 1993. godine od strane International Standards Organization
/ International Electrotechnical Commission (ISO/IEC), MPEG-1,
ISO/IEC 11172 standard ukljuuje specifikacije za 1-2 Mbps video
kompresiju i tri sloja za audio kompresiju.
Termin MP3 je obino koriten kao referenca za MPEG-1 Layer-3
specifikaciju za audio kodovanje. MP3 standard definie procese
dekodovanja, format niza bita i strategiju kodovanja audio sadraja.
Samo jezgro algoritama i teoriju su prvobitno razvili na Fraunhofer
Institutu, koji ima nekoliko patenata vezanih za ovaj metod kodovanja.
MPEG audio istraivai su izvrili obiman subjektivan slualaki test
kroz razvoj ovog standarda.
Test je pokazao da ak pri kompresiji 6:1 i pri optimalnim uslovima za
sluanje, slualaki experti nisu bili u stanju da razlikuju kodirani i
originalni audio klip.
Karakteristike mp3 kompresije
MPEG standard za audio kompresiju prihvata audio sadraj snimljen
na 32 kHz, 44.1 kHz i 48 kHz. Standardni digitalni Compact Disk
(CD) sadri dva kanala nekompresovanih 16-bitnih PCM (Pulse
Code Modulation) podataka odmjerenih na 44.1 kHz. U ovom
formatu, svaki odmjerak predstavlja odreeni napon u jednom
trenutku vremena. Rezultujui niz bita zahtjeva prolaz podataka od
1.411 Mbps da bi se obavio prenos ovog audio sadraja. Dobro
kodovan MP3 sadraj moe dostii priblian CD kvalitet audio
reprodukcije pri brzini podataka od 128 Kbps.

Budui da su karakteristike ljudskog vida i sluha veoma razliite, za
kompresiju zvuka se koriste potpuno drugaiji algoritmi kompresije.
Uho ima puno vei dinamiki opseg i rezoluciju ali je "sporije".
Zasto mp3
U potrazi za razlozima zato koristiti MP3 a ne neku drugu tehnologiju
za kompresiju, MP3 se namee kao glavni alat za isporuku audio sadraja
preko Interneta i to iz sljedeih razloga:
Otvoreni standard
MPEG je definisan kao otvoreni standard. Specifikacija je na
raspolaganju (besplatno) svima koji su zainteresovani za
implementaciju ovog standarda. Iako postoje brojni patenti koji
pokrivaju MPEG audio kodovanje i dekodovanje, svi vlasnici patenata su
se obavezali da ce dozvoliti upotrebu patenata svima pod razumnim
uslovima.
Podravajue tehnologije
im je audio kompresija uoena kao glavna tehnologija, dolo je do
naglog irenja zvunih kartica, raunari su postali dovoljno brzi da bi
obavili kodovanje i dekodovanje, zvuni zapisi se naglo prebacuju sa
normalnog audio formata na MP3 (razlog za to je uteda memorije),...
Ukratko, MP3 je bila prava tehnologija u pravo vrijeme.

Ukratko o MP3 kompresiji
MP3 (i slicne kompresije) se zasnivaju na uklanjanju "suvinih" harmonika (poto
ovjek uje samo odreen mali broj). Na osnovu toga, programi poput auCDtect-a
lako detektuju da li je pjesma "original studio recording" ili "decoded MPEG". Algoritmi
uklanjaju i suvine dijelove iz bunijih dionica koje ovjek takoe ne moe da utvrdi.
MP3 kompresija spada u grupu perceptualnih kodera i jedan od principa, tanije
primarni princip na kome se zasniva su psihoakustini efekti. Jedan od njih je
maskiranje frekvencija. Moe biti frekvencijsko i vremensko maskiranje. Frekvencijsko
je kada postoje dva signala bliska po frekvenciji od kojih je jedan jai, tako da uho ne
moe da uje ovaj slabiji, a to se tie vremenskog, stvar je u tome da ak i kad taj
jai signal prestane, treba da protekne jedan odreeni dio vremena dok uho ne
"uhvati" taj slabiji signal.
Uklanjanjem tih "nepotrebnih" signala (koje uho ne uje) smanjuje se i veliina fajla.
Dakle algoritam u enkoderu ima za cilj da napravi to bolji psihoakustini model, sa
to manje gubitaka u kvalitetu zvuka i to primeni na sam zvuni zapis.

You might also like