logo
Трев_Lecture

5.2. Звукові формати

Цифровий інтерфейс і формат MIDI-даних. Musical Instrument Digital Interface (MIDI) - цифровий інтерфейс музичних інструментів - був створений у 1982 р. провідними виробниками електронних музичних інструментів. Спочатку цей формат призначався для заміни прийнятих у той час аналогових способів керування музичними інструментами. Згодом він став стандартом де-факто в області електронних музичних інструментів і відтворення музики в комп'ютерних аудіосистемах.

MIDI являє собою подійно-орієнтований протокол зв'язку між інструментами і комп'ютерними системами. Цифрове MIDI-повідомлення може включати інформацію про будь-які дії виконавця і його впливі на органи керування музичним інструментом.

Потік MIDI-повідомлень представляє собою ніби зліпок з дій виконавця, зберігаючи притаманний йому стиль виконання - динаміку, технічні прийоми і т.п. При записі на пристрої збереження інформації MIDI-повідомлення забезпечуються тимчасовими мітками, створюючи своєрідний спосіб представлення партитури. При відтворенні по цих мітках цілком і однозначно відновлюється вихідний MIDI-потік.

MIDI-специфікація складається з апаратної специфікації власне інтерфейсу і специфікації формату даних з описом системи повідомлень, що передаються.

Відповідно розрізняються апаратний MIDI-інтерфейс і формат MIDI-даних (так звана MIDI-партитура). Інтерфейс використовується для фізичного з'єднання джерела і приймача повідомлень, формат даних - для створення, збереження і передачі MIDI-повідомлень.

В даний час ці поняття стали самостійними і зазвичай використовуються окремо один від одного: по MIDI-інтерфейсу можуть передаватися дані будь-якого іншого формату, а MIDI-формат може використовуватися для створення, збереження, передачі й обробки партитур.

Основне застосування MIDI - збереження і передача музичної інформації. Це керування електронними музичними інструментами в реальному масштабі часу, запис MIDI-потоку, що форматується при грі виконавця, на носій даних із наступним редагуванням і відтворенням (так називаний MIDI-секвенсоp), синхронізація різної апаратури (синтезатори, pитм-машини, магнітофони, блоки обробки звуку, світлова апаратура, димогенеpатоpи і т.п.). Пристрої, призначені тільки для створення звуку по MIDI-командах, що не мають власних виконавських органів, називаються тон-генеpатоpами. Багато тон-генераторів мають панель керування й індикації для встановлення основних режимів роботи і спостереження за ними, однак створення звуку йде під керуванням MIDI-команд, що надходять.

Для збереження MIDI-партитур на носіях даних розроблені формати SMF (Standard MIDI File - стандартний MIDI-файл) трьох типів:

В основному застосовується формат 1, що дає змогу зберігати один доробок у файлі.

Крім MIDI-подій файл містить також «фіктивні події» (Meta Events), які використовуються тільки для оформлення файлу і не передаються по інтерфейсу. До них відносять інформацію про метрику і темп, опис твору, назви партій, слова пісні і т.п.

Характерною рисою цього формату є нотна система опису аудіоінформації. Номер ноти задається абсолютним номером півтону в діапазоні 0-127. Наприклад, центральній фортепіанній клавіші - ноті «до» першої октави - відповідає десятковий номер 60.

Види MIDI-повідомлень. MIDI-повідомлення поділяються на:

Кодування MIDI-повідомлень здійснюється в шістнадцятковій системі числення. Символ n у першому байті позначає номер каналу.

Канальні повідомлення мають наступний вид:

Системні повідомлення:

Hа основі MIDI був розроблений стандарт GM (General MIDI), що встановлює умови обов'язкової сумісності інструментів і інтерпретації номерів програм і контролерів, а потім і інші стандарти (GS, XG), що розширюють функціональні можливості GM. Однак спільність інструментів всередині кожного стандарту має на увазі тільки основні звукові характеристики. «Однакові» тембри на різних інструментах майже завжди мають різне забарвлення, динаміку, голосність (за замовчуванням) та інші особливості, а «синтетичні» тембри можуть зовсім відрізнятися друг від друга.

Інструменти, що підтримують стандарти GM і GS, майже завжди мають додаткові засоби керування синтезом і обробкою звуку, що розширюють рамки стандарту. При цьому використовувані способи керування, як правило, зберігаються усередині однієї лінії інструментів і всередині інструментів одного виробника.

Формат МР3. МР3 (MPEG Layer III), часто іменований MPEG-3, є форматом збереження аудіоданих. Він використовує алгоритми МРЕG-1, MPEG-2 та його модифікацію MPEG-2.5 і забезпечує стиснення від 8 до 320 Кбіт/с (в залежності від використаного алгоритму). У форматі МР3 передбачено три види стиснення двоканальної аудіоінформації: «об'єднане стерео», «стерео» і «подвійний канал» (join stereo, stereo, dual channel). При використанні режиму об'єднаного стерео канали аудіоінформації стискуються спільно (крім низьких частот), що забезпечує найбільше стиснення при визначеній втраті якості стереоефекта. Режим стерео має на увазі незалежні канали, однак кількість бітів, що відводяться тому чи іншому каналу, може змінюватися. Режим подвійного каналу створює два абсолютно незалежно один від одного канали, що поділяють навпіл загальну кількість бітів, що використовується для запису однієї секунди аудіоролика.

Формат звукових файлів WAV. Цей термін застосовується в двох різних значеннях. Перше значення - «цифровий неупакований звук». Іноді при посиланні на WAV мають на увазі, що це звуковий файл чи потік, що не використовує упакування або використовує нескладне упакування без втрати якості сигналу. У цьому змісті WAV може позначати не тільки файли з розширенням .wav, але і, наприклад, .au.

Друге значення - конкретний формат звукового файлу, застосовуваний в основному в додатках операційного середовища Windows. Зазвичай такий файл містить неупакований звук. На практиці в WAV-файлі може міститися звукова інформація, стиснута, наприклад, алгоритмом MPEG. Більш того, якщо в аудіосистемі встановлено відповідний декодер, такий WAV-MPEG-файл буде читатися будь-якою звуковою програмою, що використовує стандартні системні механізми декодування.

Формат RealMedia G2.

Формат RealAudio був розроблений фірмою RealNetworks для збереження стиснутих голосових аудіоданих (мови), але з виходом версії 3 став стандартом де-факто для трансляції відео- і аудіоінформації в мережі.

Остання, 6-я версія формату називається RealMedia G2.

Технологія трансляції мультимедійних даних RealMedia полягає в тому, що сервер, кодуючи «свіжооцифровані» дані чи, зчитуючи заздалегідь підготовлений звуковий файл, що зберігається, передає аудіоінформацію по мережі, використовуючи особливий протокол у вигляді потоку даних, що декодуються програвачем (клієнтом).

Остання версія даного формату (RealServer) забезпечує збереження в одному файлі аудіо- і відеоданих, стиснутих із різною можливістю. Коефіцієнт стиснення, що зручний для користувача, вибирається з врахуванням швидкості передачі даних від сервера до клієнта. Таким чином, той самий файл звучить з різною якістю в залежності від пропускної здатності використовуваного каналу зв'язку. Трансляція може здійснюватися із звичайних Web-серверів (по протоколу HTTP). Однак при цьому зменшуються якість і функціональність трансляції.

Формат SoundVQ. Цей формат з'явився біля двох років тому. Формат був розроблений компанією Yamaha. Друга його назва - VQF. Буквене сполучення використовується як розширення звукового файлу. Цей формат використовує алгоритм стиснення TwinVQ (Transform-domain Weighted Interleave Vector Quantization), розроблений у лабораторії Nippon Telephone Telegraph Human Laboratories.

Формат забезпечує більш сильне, ніж МР3, стиснення при високій якості результату.

По якості при силі стиснення 96 Кбіт/с VQF, за результатами тестування, що проводилося, не поступається МР3. Вважається, що в області низькоякісної аудіоінформації і сильного стиснення формат перевершує всі аналоги.

Разом з тим конвертування аудіоданих у формат VQF відбувається значно повільніше, ніж у формат МР3. Формат SoundVQ не передбачає миттєвого переходу в будь-яке місце запису. Крім того, вимоги до апаратури, що використовується (зокрема, до продуктивності процесора), у формату SoundVQ вище, ніж у МР3.

Формат Windows Media Technology. Формат WMT4 (називаний також MS Audio 4.0 і має абревіатуру ASF -Advanced Streaming Format) був представлений фірмою-розроблювачем Microsoft як аналог RealAudio і МР3. На думку творців, WMT4 перевершує обидва формати і забезпечує аналогічну МР3 якість при двічі меншому розмірі результуючого файлу. Фактично формат підтримує потокову передачу даних у Internet і має прогресивну систему стиснення аудіо- і відеоданих, що базується на алгоритмах MPEG -4 (використовуючи, у тому числі, кодеки Microsoft Audio).

Формат QuickTime. Формат QuickTime фірми Apple був розроблений для використання в мультимедійних додатках на комп'ютерах Macintosh, але згодом придбав величезну популярність на ПК і, до речі, був обраний «оболонкою» для формату MPEG-4.

QuickTime підтримує потокову передачу даних через Internet і протоколи RTP (Real Time Protocol) і RTSP (Real Time Streaming Protocol). Компанія Apple відкрила вихідні коди свого потокового Internet -сервера по моделі Open Source.

QuickTime - універсальний формат, його можна використовувати для збереження відео, аудіо, векторної графіки й анімації (інтеграція з Macintosh), MIDI-музики, 3D-об'єктів, нерухомої графіки і навіть панорамних зображень.