You are on page 1of 21

Формати аудіо

Цифрові аудіоформати
Цифровий аудіоформат - формат подання звукових даних, використовуваний при цифрового
звукозапису, а також для подальшого зберігання записаного матеріалу на комп'ютері та інших
електронних носіях інформації.

Бітове розташування аудіоданих (за винятком метаданих) називається форматом аудіокодування та


може бути стисненим або стисненим для зменшення розміру файлу, часто використовуючи стиснення
з втратами. Дані можуть бути необробленим потоком бітів у форматі аудіокодування, але зазвичай
вони вбудовуються у формат контейнера або формат аудіоданих із визначеним рівнем зберігання.

Аудіофайл (файл, який містить звукозапис) - комп'ютерний файл, що складається з інформації про
амплітуду і частоту звуку, збереженої для подальшого відтворення на комп'ютері або програвачі.
Перший цифровий носій аудіо
Перша презентація компакт-диска Philips 9 березня 1979 року

У 1978-1979 роках і Sony і Philips довели свої проекти до


стадії прототипів, які вже можна було показувати журналістам.
Перший компакт диск
А 17 серпня 1982 року відбулася прем'єра нового носія інформації

Першим у продажу буде не він, а випущений Sony Music Entertainment альбом Billy Joel "52nd Street",
який з 1 жовтня стане доступний на японському ринку.
Перший компакт диск програвач
Перший програвач компакт дисків Sony CDP-101

Європейський і американський ринки отримали нові продукти в березні 1983 року. Саме цей рік став
"проривним" для нового формату: до кінця року вже було доступно близько тисячі найменувань
дисків.
Першим європейським програвачем став Philips CD100
Діаграма продажу носіїв аудіо
Цифрові аудіоформати
Формат файлу визначає структуру та особливості представлення звукових даних при зберіганні на
ПК. Для вивчення результатів аудіоданих використовуються аудіокодеки, за допомогою яких
виробляється зв’язок аудіоданних.

Виділяють три групи звукових форматів файлів:

аудіоформати без стиснення - такі як WAV, AIFF


аудіоформати з стисненням без втрати якості (APE, FLAC)
аудіоформати з стисненням із втратою якості (MP3, Ogg)

Особливістю стоять модульні музичні формати файлів, створені синтетично або із семплів заздалегіть
записаних живих інструментів. Вони в основному служать для створення сучасної електронної
музики (MOD). Також сюди можна віднести формат MIDI, який не є звукозаписом, але за допомогою
секвенсора дозволяє записувати та відтворювати музику, використовуючи визначений набір команд у
текстовому вигляді.
Аудіоформати без стиснення
Waveform Audio File Format (WAVE, WAV, від англ. Waveform - «в формі хвилі») - формат файлу-
контейнера для зберігання запису оцифрованого аудіопотоку.

Цей контейнер, як правило, використовується для зберігання нестислого звуку в імпульсно-кодової


модуляції. Однак контейнер не накладає жодних обмежень на використовуваний алгоритм кодування.

Формат AIFF створений компанією Apple як альтернатива WAV; і хоча AIFF-файли менш поширені,
вони забезпечують більш повну підтримку метаданих, дозволяючи зберігати обкладинки альбомів,
назви пісень і тому подібну інформацію.

Недолік цих форматів - вимога гігантських обсягів пам'яті. Файли CD-якості (16 біт, 44,1 кГц)
займають близько 10 МБ дискового простору на хвилину звучання
Аудіоформати без стиснення
DSD розшифровується як Direct Stream Digital. Він бере свій початок в лабораторіях фірм Sony і
Philips. DSD це однобітний потік з дуже високою, в порівнянні з PCM, частотою дискретизації. Також
в DSD використовується інший вид модуляції, PDM (Pulse Density Modulation) - плотностно-
імпульсна модуляція. Запис звуку в такому форматі проводиться однобітний аналого-цифровим
перетворювачем, зараз такі АЦП на основі сигма-дельта-модуляції використовуються повсюдно.
Процес запису виглядає приблизно так: поки амплітуда хвилі зростає, на виході АЦП логічна
одиниця, коли амплітуда падає, на виході логічний нуль, середнього значення бути не може.
Порівнюється з попереднім значенням амплітуди хвилі.
Аудіоформати без стиснення
DSD дозволяє досягти важливих переваг у порівнянні з PCM:

точніше промальовування хвилі;


вище стійкість перед перешкодами;
простіший спосіб комутації та передачі цифрового потоку;
теоретично є можливість зменшити вартість, спростивши схему ЦАП, але через зворотної сумісності
зі старими форматами виробники навряд чи підуть на це.

Спочатку на SACD-дисках використовувався формат DSD x64 c частотою дискретизації 2822,4 кГц.
За основу взяли частоту дискретизації Audio CD 44,1 кГц, збільшену в 64 рази, звідси назва x64.
Сьогодні реально використовуються наступні DSD:

x64 = 2822,4 кГц;


x128 = 5644,8 кГц;
x256 = 11 289,6 кГц;
x512 = 22 579,2 кГц;
заявлений DSD x1024.
Аудіоформати без стиснення
Існує якийсь проміжний формат між PCM і DSD під назвою DXD - Digital eXtreme Definition. Це, по
суті, PCM з високою роздільною здатністю - 352,8 кГц або 384 кГц з розрядністю квантування 24 або
32 біта. Він застосовується в студіях для обробки і подальшого відомості матеріалів.

Але такий підхід ущербна: по-перше, він не дозволяє задіяти всі переваги DSD, по-друге, розмір
файлів виходить більше, ніж в DSD. На поточний момент флагманські ЦАП на вході I2S приймають
потік даних PCM з частотою дискретизації до 768 кГц і розрядністю до 32 біт. Страшно навіть
вважати, який обсяг на жорсткому диску буде займати один альбом в такому дозволі.
Аудіоформати без стиснення

формат розширення файлу Розрядність Частота Кількість Bitrate


квантування, каналів на канал
кГц Мбіт/с
AIFF .aiff .aif 8; 16; 24; 32 11,025; 22,05; 1; 2; 3; 4; 6 До 6,144
24; 32; 44,1; 48;
96; 192
WAVE .wav 8; 16; 24; 32 Будь-яка 1; 2; 3; 4; 6 До 6,144

DSD .dff .dsf 1 2822,4 2; 5.1 2822,4


5644,8 5644,8
11289,6 11289,6

DXD .dxd 24; 32 352,8 2; 5.1 8,4672


11,2896
Аудіоформати з стисненням
без втрати якості
Формат без втрат, файли у FLAC (Free Lossless Audio Codec, безкоштовний аудіокодек без втрат) за
розміром майже вдвічі менше, ніж в WAV або AIFF без стиснення з еквівалентної частотою
дискретизації, однак в плані звучання ніяких втрат якості не помітно. FLAC також підтримує більш
високу роздільну здатність в порівнянні з CD-якістю - до 32 біт і 192 кГц.
 
Крім FLAC, є й інші формати без втрат - ALAC (Apple Lossless) і WMA Lossless (Windows Media
Audio). Перший являє собою відмінну альтернативу для iOS і iTunes, хоча розмір файлів трохи вище,
ніж у FLAC. Не всі смартфони та планшети підтримують його.
Аудіоформати з стисненням
з втрати якості
MP3 (точніше, англ. MPEG-1/2 / 2.5 Layer 3; але не MPEG-3) - це розроблений командою MPEG
формат файлу для зберігання аудіоінформації. Формат був ліцензованих, але 23 квітня 2017 року
термін дії всіх патентів закінчився і ліцензійні збори припинені.
 У форматі MP3 використовується алгоритм стиснення з втратами, розроблений для істотного
зменшення розміру даних, необхідних для відтворення запису і забезпечення якості відтворення
звуку, що точно відповідає оригінальному (на думку більшості слухачів), але з відчутними втратами
якості при прослуховуванні на якісної звукової системи. Принцип стиснення полягає в зниженні
точності деяких частин звукового потоку, що практично невиразно для слуху на повсюдно
поширеною апаратурі низької точності відтворення звуку (наприклад, домінуюча більшість
портативних пристроїв, звукових карт, музичних центрів, автомагнітол та інших не спеціальної
апаратури), а також для людей старшого віку, у зв'язку з природними віковими змінами слухового
апарату, проте в більшості випадків чітко помітні на аудіотехніки високої точності відтворення. Даний
метод називають перцепційне кодуванням.
Аудіоформат MP3
При цьому на першому етапі будується діаграма звуку у вигляді послідовності коротких проміжків
часу, потім на ній видаляється інформація, що не помітна людським вухом, а решта інформація
зберігається в компактному вигляді. Даний підхід схожий на метод стиснення, який використовується
при стисненні картинок в формат JPEG. При створенні MP3 із середнім бітрейтом 128 кбіт / с в
результаті виходить файл, розмір якого приблизно дорівнює 1/11 від оригінального файлу з CD-Audio
(саме по собі нестиснене аудіо формату CD-Audio має бітрейт 1411,2 кбіт / с). MP3-файли можуть
створюватися з високим або низьким бітрейтом, що впливає на якість файлу-результату.
Аудіоформат MP3
При цьому на першому етапі будується діаграма звуку у вигляді послідовності коротких проміжків
часу, потім на ній видаляється інформація, що не помітна людським вухом, а решта інформація
зберігається в компактному вигляді. Даний підхід схожий на метод стиснення, який використовується
при стисненні картинок в формат JPEG. При створенні MP3 із середнім бітрейтом 128 кбіт / с в
результаті виходить файл, розмір якого приблизно дорівнює 1/11 від оригінального файлу з CD-Audio
(саме по собі нестиснене аудіо формату CD-Audio має бітрейт 1411,2 кбіт / с). MP3-файли можуть
створюватися з високим або низьким бітрейтом, що впливає на якість файлу-результату.
Аудіоформат MP3

Існує три версії MP3 формату для різних потреб: MPEG-1, MPEG-2 і MPEG-2.5. Відрізняються вони
можливими діапазонами бітрейту і частоти дискретизації:

32-320 кбіт / c при частотах дискретизації 32000 Гц, 44100 Гц і 48000 Гц для MPEG-1 Layer 3;

16-160 кбіт / c при частотах дискретизації 16000 Гц, 22050 Гц і 24000 Гц для MPEG-2 Layer 3;

8-160 кбіт / c при частотах дискретизації 8000 Гц і 11025 Гц для MPEG-2.5 Layer 3.
Аудіоформати MP3

CBR розшифровується як Constant Bit Rate, тобто постійний бітрейт, який задається користувачем і не
змінюється при кодуванні твору. Таким чином, кожній секунді твору відповідає однакова кількість
закодованих біт даних (навіть при кодуванні тиші). CBR може бути корисний для потоків мультимедіа-
даних по обмеженому каналу; в такому випадку кодування використовує всі можливості каналу даних.
Для зберігання даний режим кодування не є оптимальним, тому що він не може виділити достатньо
місця для складних відрізків вихідного твори, при цьому марно витрачаючи місце на простих відрізках.
Підвищені бітрейти (вище 256 кбіт / c) можуть вирішити дану проблему, виділивши більше місця для
даних, але зате і пропорційно збільшуючи розмір файлу.
Аудіоформати MP3

VBR розшифровується як Variable Bit Rate, тобто змінюється бітрейт або змінний бітрейт, який
динамічно змінюється програмою-кодером при кодуванні в залежності від насиченості кодованого
аудіоматеріалу і встановленого користувачем якості кодування (наприклад, тиша закодується з
мінімальним бітрейтом). Цей метод MP3-кодування є найпрогресивнішим і до сих пір розвивається і
поліпшується, так як аудіоматеріал різної насиченості може бути закодований з певним якістю, яке
зазвичай вище, ніж при установці середнього значення в методі CBR. Плюс до того, розмір файлу
зменшується за рахунок фрагментів, які не потребують високої бітрейта. Мінусом даного методу
кодування є складність передбачення розміру вихідного файлу. Але цей недолік VBR-кодування
незначний в порівнянні з його достоїнствами. Також мінусом є те, що VBR вважає «незначною»
звуковою інформацією тихіші фрагменти, таким чином виходить, що якщо слухати дуже голосно, то ці
фрагменти будуть неякісними, в той час як CBR робить з однаковим бітрейтом і тихі, і гучні фрагменти.
Аудіоформати MP3

ABR розшифровується як Average Bit Rate, тобто усереднений бітрейт, який є гібридом VBR і CBR:
бітрейт в кбіт / c задається користувачем, а програма варіює його, постійно підганяючи під заданий
бітрейт. Таким чином, кодек буде з обережністю використовувати максимально і мінімально можливі
значення бітрейта, оскільки ризикує не вписатися в заданий користувачем бітрейт. Це є явним мінусом
даного методу, оскільки позначається на якості вихідного файлу, яке буде трохи краще, ніж при
використанні CBR, але гірше, ніж при використанні VBR. З іншого боку, цей метод дозволяє найбільш
гнучко задавати бітрейт (може бути будь-яким числом між 8 і 320, проти виключно кратних 16 чисел
методу CBR) і обчислювати розмір вихідного файлу.
Аудіоформати MP3
Якість CD – без стиснення .wav

Якість CD – без стиснення .aiif

320 kB/s – constant bitrate .mp3

128 kB/s – constant bitrate .mp3

64 kB/s – constant bitrate .mp3

32 kB/s – constant bitrate .mp3

16 kB/s – constant bitrate .mp3

8 kB/s – constant bitrate .mp3

You might also like