Аудиоинформация в мультимедійних технологіях
- Файли з оцифрованих звуком
- Основні поняття, терміни та інші дані, пов'язані з оцифруванням звуку
- Файли з заголовком
- Перелік і області застосування найбільш поширених форматів звукових файлів без заголовка
- Файли з нотним записом
- Перелік стандартів і форматів звукових файлів з нотним записом
Наше деловое партнерство www.banwar.org
Звукова інформація (аудіоінформація) в мультимедійних системах технологічно зазвичай представляється у вигляді аудіоряду, тобто послідовності значень амплітуди звукового тиску, записаних у цифровій формі.
Аудиоряд може включати мова, музику, ефекти (звуки типу шуму, грому, скрипу і т.д.). Файли, що містять цифрову запис звукових даних (голосу, музичних творів або їх фрагментів та інших звуків будь-якої природи).
Існують два основних типи звукових файлів: з оцифрованих звуком і нотним записом.
Файли з оцифрованих звуком
Звукові файли, в яких вихідна безперервна ( "аналогова") форма сигналу записана у вигляді послідовності коротких дискретних значень амплітуд звукового сигналу, виміряних ( "обраних") через однакові проміжки часу і мають між собою досить малий інтервал. Процес заміни безперервного сигналу послідовністю його значень називають дискретизацією, а таку форму запису - через сигнал PCM, ІКМ (англ. Pulse Code Modulation - PCM). Апаратна реалізація обробки оцифрованого звуку полягає в тому, що АЦП перетворює аналоговий сигнал в безліч цифрових вимірів, а при відтворенні ЦАП здійснює зворотний процес - перетворення цифрового сигналу в аналоговий. Файли з оцифрованих звуком бувають двох видів: з заголовком і без заголовка.
Основні поняття, терміни та інші дані, пов'язані з оцифруванням звуку
вибірка
, Відлік (звукового сигналу) - дискретне ( "миттєве") значення, відповідне мінімального фрагменту вихідного звукового сигналу. Вибірка характеризує амплітуду звукового сигналу і звичайно являє собою ціле число (8 або 16 біт). Може здійснюватися по одному каналу (моно), двом (стерео) або більшій кількості каналів. Процес поділу сигналу на вибірки називається квантуванням.
Розрядність дискретизації - величина, що визначає кількість біт на один канал. Чим вище розрядність дискретизації, то краща якість запису і відтворення звуку.
Частота дискретизації - величина, яка визначає, скільки разів в секунду проводиться зчитування вибірок з аналогового сигналу. При цифровому записі звуків частота дискретизації вимірюється в герцах і кілогерцах. Чим більша їх кількість, тим вище якість звуку.
Деякі формати звукових файлів підтримують довільну частоту дискретизації (наприклад,
VOC
- файли в діапазоні від 5000 до 44100 Гц); інші - тільки певні частоти дискретизації (WAV-файли можуть бути оцифровані з частотами 11 025, 22050, 44100 Гц). Тому конвертація (перетворення) файлу одного формату в інший не завжди можливо.
Файли з заголовком
У заголовку вказуються параметри, які характеризують оцифрований звук, включаючи: частоту дискретизації; кількість бітів на відлік (8 або 16); кількість каналів - моно (1) або стерео (2); ASCII-символ, що описують тип файлу; довжину записаних даних в байтах; номер версії формату; метод компресії; величину зміщення блоку даних щодо початку файлу і ін.
Перелік і області застосування найбільш поширених форматів звукових файлів з заголовком:
розширення
Короткі відомості про форматах
* .Aiff, * .aif
AIF, AIFF [Audio Interchange File Format] - даний формат поширений в системах Apple Macintosh і Silicon Graphics;
AIFC, A IFF-С [Audio Interchange File Format-Compressed] - той же AIFF, тільки з заданими параметрами стиснення (компресії); використовуються в ПК фірми Apple.
* .au
* .snd
AU - звуковий формат призначений для роботи зі звуком у робочих системах SUN, NeXT, DEC, Linux і FreeBSD; забезпечує економію пам'яті, завдяки чому знайшов широке поширення в Інтернеті.
* .iff
IFF [Interchange File Format] - формат, який має схожість з RIFF [Resource Interchange File Format], що є універсальним для запису будь-яких структурованих даних. Основна відмінність полягає в підтримці їм так званої програмно-семплерной емуляції музичних інструментів. Звук в файлі ділиться на дві частини: те, що має звучати спочатку, і елемент того, що йде за началом. В результаті друга частина звукового фрагмента повторюється за початковою стільки раз, скільки потрібно користувачеві і нота може звучати як завгодно довго. Використовується в системах типу IFF / 8SVX на комп'ютерах фірми Amiga.
* .mp3
MР3
- формат, в якому використані параметри стиснення, що мають схожість з форматом jpeg для зображень. Коефіцієнт стиснення складає 10 - 12 разів, однак фахівцями він вважається досить складним і не забезпечує високу якість звуку.
* .voc
VOC [Voice File] - 8-бітний моно-формат сімейства звукових карт SoundBlaster фірми Creative Labs. Широко використовується в старих немузикальних програмах.
HСОМ - те ж саме, що і VOC (8 біт, моно), але тільки для ПК фірми Apple Macintosh.
* .wav
WAVE [Waveform Audio File] - формат, розроблений фірмою Microsoft і зарекомендував себе одним з найпростіших для запису і зберігання дискретних даних. Відноситься до одного з варіантів файлів сімейства RIFF [Resource Interchange File Format] і є жорстко структурованою. У заголовку крім звичайних значень (в тому числі розрядність, рівні гучності і т.п.) в wav можуть бути вказані і багато інших параметрів, наприклад, мітки позицій для синхронізації, загальна кількість дискретних значень, порядок відтворення різних частин звукового файлу, а також текстова інформація.
Перелік і області застосування найбільш поширених форматів звукових файлів без заголовка
розширення
Короткі відомості про форматах
* .pcm
PCM * [Pulse Code Modulation] - буквально: "імпульсний-кодова модуляція - ІКМ". Хоча файли з таким розширенням зустрічаються рідко (в основному на аудіо-CD), ІКМ є основоположною для всіх звукових файлів. Метод запису і зберігання аудіоінформації в цьому форматі неощадливий, однак обсяги сучасних пристроїв зовнішньої пам'яті (в тому числі вінчестерів і оптичних дисків) дозволяють його використовувати не дивлячись на пов'язані з цим втрати, які можуть становити десятки мегабайт.
* .dpcm
DPCM * [Difference Pulse Code Modulation] - варіант формату PCM, в якому з метою підвищення економії зберігання звукових даних на диску використаний метод стиснення запису, який отримав найменування "різницевих РСМ". Дана схема стиснення з фіксованою швидкістю перетворює послідовність вимірювань, зберігаючи тільки різницю між наступним і попереднім значеннями сигналів. Збереження дискового простору відбувається за рахунок того, що значення різниці менше самих вимірювань
* .adpcm
ADPCM [Adaptive DPCM] - "Адаптивний DPCM": формат DPCM, доповнений використанням так званого коефіцієнта масштабованості. Необхідність цього заходу обумовлена вимогою виключення спотворень звуку, викликаних помилками вимірювання різниці амплітуд сигналів, які пов'язані зі значними перепадами гучності окремих складових звуку.
Формати сімейства PCM використовуються не тільки для запису звуку, але і сейсмограмм, де неприйнятні способи стиснення за часом, що не дають можливість здійснити прецизионную службу часу (точність записи по часовій шкалі).
Файли з нотним записом
Звукові файли, які містять послідовність команд, які повідомляють яку ноту і яким інструментом і як довго потрібно відтворювати в той чи інший момент часу. Формат може передбачати одночасну гру кількох музичних інструментів, в цьому випадку говорять про відповідній кількості голосів. Наприклад, плата Sound Blaster 16 підтримує 20-голосний синтез.
При відтворенні файлів з нотним записом можуть використовуватися такі види синтезу звуку:
FM-синтез
- синтез з використанням частотної модуляції, при якій формується частота звучання відповідної ноти. Даний метод дозволяє успішно імітувати реальні музичні інструменти (піаніно, гітару і т.п.);
wavetable-синтез - "Табличний синтез": використовує оцифровку нот реальних інструментів. Отримання необхідної ноти проводиться шляхом оцифровки однієї ноти реального інструменту. Вихідні оцифровки містяться в файлі з нотним записом або в окремому файлі (такі файли одночасно є файлами з нотним записом і містять оцифрований звук).
Перелік стандартів і форматів звукових файлів з нотним записом
розширення
Область застосування / фірма розробник
* .mid
MID - формат файлу, який містить повідомлення про MIDI-системі, встановленої на ПК або в пристрої. Має такі різновиди:
Roland LA (розроблений фірмою Roland Corporation);
GM (General MIDI) - стандарт MIDI-повідомлень. Визначає відповідність 128 номерів патчів звукового банку даних конкретним інструментам. Для ударних інструментів зарезервований 10-й MIDI-канал. Стандартизує також номери основних контролерів.
Використовує всі 16 каналів. Перевага обміну файлами MIDI в порівнянні з файлами оцифрованого звуку полягає в тому, що файли MIDI набагато менше за розміром, так як вони зберігають ноти, а не детальну запис звуку.
Basic MIDI - використовує канали з 13-го по 16-й;
Extended MIDI - використовує канали з 1-го по 10-й;
GS (General Sound) - розширена версія стандарту GM, розроблена фірмою Roland; допускається використання ієрархії багатьох звукових банків даних; передбачено до десяти перемикаються наборів ударних інструментів; розширений список контролерів;
XG - найбільш розвинений станом на 1999 р стандарт MIDI-повідомлень, запропонований фірмою Yamaha.
* .mod
MOD - формат, який підтримуючи "понотний підхід" зберігання даних, насправді зберігає зразки звуку. Спочатку використовувався програмами SoundTracker, NoiseTracker (ПК Amiga). Підтримується багатьма програмами IBM-сумісних ПК (4 канали, є варіанти до 32 каналів). Файли з нотним записом .mod і аналогічні (з оцифровки інструментів) можна послухати за допомогою різноманітних програм-програвачів, які зазвичай дозволяють відтворювати один формат файлів. В цьому одна з його переваг по відношенню до формату MIDI.
Чи знаєте Ви,
що будь-яка розумна людина скаже, що не може бути посмішки без кота і диму без вогню, щось там, в космосі, мабуть, тепле, яке випромінює ЕМ-хвилі, який відповідає температурі 2.7ºК. Дійсно, спостерігається космічне мікрохвильове випромінювання (CMB) є теплове випромінювання частинок ефіру, що мають температуру 2.7ºK. Ще на початку ХХ століття великі хіміки і фізики Д. І. Менделєєв і Вальтер Нернст передбачили, що таке випромінювання (температура) має виявлятися в космосі. У 1933 році проф. Еріх регенера з Штуттгарта за допомогою стратосферних зондів виміряв цю температуру . Його вимірювання дали 2.8ºK - практично точне сучасне значення. Детальніше читайте в FAQ по ефірної фізиці .