Digitalna audio kompresija omoguava efikasno skladitenje i prenos audio
sadraja. Audio kompresija se moe podijeliti u dvije grupe: kompresija bez gubitaka (lossless compression) kompresija sa gubitkom (lossy compression) Danas mnogo ega iz domena AV kvaliteta ne bi bilo ukoliko ne bi bilo mogunosti kompresije. Kompresija audio zapisa je bazirana na: osobinama ljudskog uha, odnosno injenici da neke frekvencije ujemo dosta slabije od drugih, a neke ak i ne ujemo.
Tehnologija kompresije zvuka je poslednjih godina prilino unapreena i, ukoliko se ne zahteva stepen kompresije (vei od 10:1) skoro da je nemogue primetiti razliku izmeu orginalnog i zvunog zapisa nad kojim je izvrena kompresija.
Kompresija bez gubitaka Kompresija bez gubitaka kompresuje audio sadraj na takav nain da se prilikom njegove dekompresije dobija signal koji je potpuno identian poetnom signalu. Iako ima svojih prednosti, ova vrsta kompresije nije postigla veu popularnost u digitalnoj audio kompresiji, prvenstveno zbog malog stepena kompresije koji se za zvuk CD kvaliteta (16 bita, 44.1 KHz) kree izmeu 30% i 50%. Tehnike kompresije bez gubitaka se uglavnom razlikuju po brzini audio kompresije i dekompresije dok kvalitet kompresovanog sadraja nema nikakvu ulogu. Kompresija sa gubicima Zvuk koji se smatra manje vanim je kodiran sa smanjenom preciznou ili nije u opte kodiran, zbog toga kompresija sa gubitkom smanjuje taj shvatljivi viak. Da bi se odredilo koje informacije u audio signalu su manje vane, veina algoritama kompresije sa gubitkom koriste transformacije kao to je modifikovana diskretna kosinusna transformacija (MDCT) da konvertuje vremenski domen semplovanog zvuka u domen frekvencije. Komponentama frekvencija mogu se alocirati bitovi na osnovu njihove zvunosti. Zvunost frekvencijske komponente se definie tako to se prvo izraunava prag maskiranja ispod koje se pretpostavlja da je zvuk izvan limita ljudske percepcije (psiho-akustini model). Takoe neki algoritmi kompresije sa gubitkom koriste LPC (Linear Perceptive Coding) da konvertuju vremenski domen semplovanog zvuka. Poto kod kompresije sa gubitkom dolazi do opadanja kvaliteta audio zvuka, ova kompresija se smatra neodgovarajuom kod profesionalnih audio ininjerskih aplikacija kao to je editiranje zvuka i multitrack snimanja zvuka. Meutim, ova kompresija je veoma pogodna za prenos i skladitenje audio podataka. MP3 MP3 ili MPEG-1 Audio Layer 3 je najraireniji audio format zapisa fajla u kome je primenjena kompresija sa gubitkom, koji se razvio kao audio komponenta MPEG video zapisa i vrlo brzo samostalno postao najkorieniji oblik audio zapisa.
MP3 omoguava kompresiju zvuka CD kvaliteta bez ikakvih vidljivih gubitaka uz stepen kompresije oko 10:1.
Na slici je dat grafiki prikaz procesa kompresije i dekompresije zvuka
MPEG audio kompresija / MPEG-1 Layer-3 (MP3) The Motion Picture Experts Group (MPEG) radna grupa je osnovana 1988. godine i definisala je standarde za video i audio kompresiju. Objavljen 1993. godine od strane International Standards Organization / International Electrotechnical Commission (ISO/IEC), MPEG-1, ISO/IEC 11172 standard ukljuuje specifikacije za 1-2 Mbps video kompresiju i tri sloja za audio kompresiju. Termin MP3 je obino koriten kao referenca za MPEG-1 Layer-3 specifikaciju za audio kodovanje. MP3 standard definie procese dekodovanja, format niza bita i strategiju kodovanja audio sadraja. Samo jezgro algoritama i teoriju su prvobitno razvili na Fraunhofer Institutu, koji ima nekoliko patenata vezanih za ovaj metod kodovanja. MPEG audio istraivai su izvrili obiman subjektivan slualaki test kroz razvoj ovog standarda. Test je pokazao da ak pri kompresiji 6:1 i pri optimalnim uslovima za sluanje, slualaki experti nisu bili u stanju da razlikuju kodirani i originalni audio klip. Karakteristike mp3 kompresije MPEG standard za audio kompresiju prihvata audio sadraj snimljen na 32 kHz, 44.1 kHz i 48 kHz. Standardni digitalni Compact Disk (CD) sadri dva kanala nekompresovanih 16-bitnih PCM (Pulse Code Modulation) podataka odmjerenih na 44.1 kHz. U ovom formatu, svaki odmjerak predstavlja odreeni napon u jednom trenutku vremena. Rezultujui niz bita zahtjeva prolaz podataka od 1.411 Mbps da bi se obavio prenos ovog audio sadraja. Dobro kodovan MP3 sadraj moe dostii priblian CD kvalitet audio reprodukcije pri brzini podataka od 128 Kbps.
Budui da su karakteristike ljudskog vida i sluha veoma razliite, za kompresiju zvuka se koriste potpuno drugaiji algoritmi kompresije. Uho ima puno vei dinamiki opseg i rezoluciju ali je "sporije". Zasto mp3 U potrazi za razlozima zato koristiti MP3 a ne neku drugu tehnologiju za kompresiju, MP3 se namee kao glavni alat za isporuku audio sadraja preko Interneta i to iz sljedeih razloga: Otvoreni standard MPEG je definisan kao otvoreni standard. Specifikacija je na raspolaganju (besplatno) svima koji su zainteresovani za implementaciju ovog standarda. Iako postoje brojni patenti koji pokrivaju MPEG audio kodovanje i dekodovanje, svi vlasnici patenata su se obavezali da ce dozvoliti upotrebu patenata svima pod razumnim uslovima. Podravajue tehnologije im je audio kompresija uoena kao glavna tehnologija, dolo je do naglog irenja zvunih kartica, raunari su postali dovoljno brzi da bi obavili kodovanje i dekodovanje, zvuni zapisi se naglo prebacuju sa normalnog audio formata na MP3 (razlog za to je uteda memorije),... Ukratko, MP3 je bila prava tehnologija u pravo vrijeme.
Ukratko o MP3 kompresiji MP3 (i slicne kompresije) se zasnivaju na uklanjanju "suvinih" harmonika (poto ovjek uje samo odreen mali broj). Na osnovu toga, programi poput auCDtect-a lako detektuju da li je pjesma "original studio recording" ili "decoded MPEG". Algoritmi uklanjaju i suvine dijelove iz bunijih dionica koje ovjek takoe ne moe da utvrdi. MP3 kompresija spada u grupu perceptualnih kodera i jedan od principa, tanije primarni princip na kome se zasniva su psihoakustini efekti. Jedan od njih je maskiranje frekvencija. Moe biti frekvencijsko i vremensko maskiranje. Frekvencijsko je kada postoje dva signala bliska po frekvenciji od kojih je jedan jai, tako da uho ne moe da uje ovaj slabiji, a to se tie vremenskog, stvar je u tome da ak i kad taj jai signal prestane, treba da protekne jedan odreeni dio vremena dok uho ne "uhvati" taj slabiji signal. Uklanjanjem tih "nepotrebnih" signala (koje uho ne uje) smanjuje se i veliina fajla. Dakle algoritam u enkoderu ima za cilj da napravi to bolji psihoakustini model, sa to manje gubitaka u kvalitetu zvuka i to primeni na sam zvuni zapis.