Возьми музыку в дорогу. Часть 1. Введение

Возьми музыку в дорогу. Часть 1. Введение

MPEG-3

Разработан компанией Panasonic и предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG-Audio Layer-3.

MP3

Это звуковые файлы с компрессией по технологии MPEG (1.0, 2.0 и 2.5, MP3, MPEG 1 Layer 3, Audio MPEG), позволяющей обеспечить наилучшее качество звука при минимальном объеме файла. Это достигается учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом предыдущего фрейма, вызывающего временное понижение чувствительности уха к сигналу текущего фрейма (попросту, удаляются второстепенные звуки, которые не слышатся человеческим ухом из-за наличия в данный/предыдущий момент другого — более громкого). Также, учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов. Данный процесс называется адаптивным кодированием и позволяет экономить на наименее значимых, с точки зрения восприятия человеком, деталях звучания. Степень сжатия (следовательно и качество), определяются не форматом, а шириной потока данных при кодировании в MP3.

Аудиоинфоpмация, сжатая по данной схеме, может пеpедаваться потоком (streaming), а может храниться в файлах формата MP3 или WAV MP3. Отличие второго от первого состоит в наличии дополнительного заголовка WAV-файла, что позволяет при наличии MP3 кодека в системе использовать для работы с таким файлом стандартные средства Windows. Параметры компрессии при кодировании файла можно варьировать в широких пределах. Так, например, хорошее качество, почти неотличимое от качества CD, достигается при скорости передачи (bitrate) 112-128 kbps(обеспечиваемой ISDN-модемами), при этом сжатие составляет примерно 14:1 относительно исходного объема (вспомним: на 650 Mb компакт-диска помещается всего 74 минуты звука, т.е. 1 минута «стоит» почти 9 Mb!). Для Интернет, впрочем, и такие объемы великоваты, поэтому чаще используется кодирование с качеством «Подобно УКВ-вещанию» (MPEG 1.0, bitrate 56 kb/s, 44.1 sampling frequency, bandwidth 11 kHz, stereo, 1 min=415 kb, при котором воспроизведение в реальном масштабе времени может быть обеспечено 56К-модемами. Что же касается классического рок-н-ролла, то для него, поскольку он изначально записывался в моно режиме и с неширокой полосой частот, оптимальным можно считать кодирование с качеством «Лучше ДВ/СВ радио» (MPEG 2.0, bitrate 32 kb/s 22.05 sampling frequency,bandwidth 7.5,mono 1 min 237 kb.

Принципиальной особенностью MPEG-кодирования является компрессия с потерями. После упаковки и распаковки вукового файла методом MP3 результат не идентичен оригиналу «бит в бит». Напротив, упаковка целенаправленно исключает из упаковываемого сигнала несущественные компоненты, что приводит к резвычайному возрастанию коэффициента сжатия. В зависимости от необходимого качества звука метод MP3 способен сжать звук в десять и более раз (См. Степень сжатия и качество)Приемущества MP3.MP3 на сегодня имеет два огромных преимущества перед другими доступными форматами. Правда, MicroSoft пытается потеснить MP3 со своим новым форматом WMA, а также есть альтернативные форматы VQF и AAC, но они еще не получили должного распространения, хотя качество WMA, если судить по отзывам, несколько лучше. Однако WMA пока, фактически, закрыт для свободного использования, поэтому у него есть проблемы с различным софтом для кодирования / прослушивания / обслуживания (хотя, кто же сомневается в мобилизационных возможностях MicroSoft :-). Первое преимущество состоит в том, что ни про один из существующих подобных форматов нельзя пока сказать, что он полностью гарантирует устойчивое сохранение качества звучания на достаточно высоких битрейтах, кроме MP3, который достойно выдержал проверку временем. Второе, не менее важное преимущество — на ближайшие годы, а возможно, и на все

 

десятилетие, MP3 стал стандартом де факто, поскольку много сделано в него вложений пользующимися им сторонами, в том числе и цифровыми радиостанциями. Для MP3 также написано

множество удобного программного обеспечения. Сейчас уже налажено производство аппаратных MP3 плееров, и карманных, и для автомобилей. Таким образом, MP3 стал первым массово признанным форматом хранения аудио после CD-Audio (пусть, часто и нелегальным).


Степень сжатия и качество

128 kbps

В принципе, нормальный формат, если Вы имеете обычную аудиотехнику и рядовой слух. Но, чтобы быть уверенным, лучше кодировать на 160 kbps, т.к. это даст запас (весьма существенный) по сравнению с 128 kbps на тот случай, если улучшится качество аппаратуры. А если хотите быть совсем уверены в том, что Ваша музыка ничего не потеряет от кодирования, то берите 192 kbps. 128 kbps (11:1) Самый популярный на сегодня битрейт. Степень сжатия 11:1 — это, конечно, аргумент, особенно для Интернета, где каждый килобайт на счету. Однако при этом не очень хорошо сохраняются высокие частоты и имеют место некоторые искажения звука.

При этом можно точно сказать, что на обычной аппаратуре, например используя обычную звуковую карту, компьютерные колонки, пусть и неплохого качества, разницы не будет заметно, если только Вы не эксперт по звуку. Однако на качественных колонках отсутствие высоких частот проявляется довольно заметным образом — музыка звучит приглушенно. На 128 кб/с лучше себя ведут кодеры от Fraunhofer-IIS — они оставляют больше высоких частот, чем кодеры ISO и, тем более, Xing. Все ISO кодеры как один добавляют характерный звон, наличие которого связано с

особенностью психоаккустических фильтров ISO. На этом битрейте отлично себя показал MP3 Producer, специально оптимизированный под низкие битрейты. 160 kbps (8:1) Лучше, чем 128 кб/с. На неплохой (хорошей непрофессиональной) аппаратуре разницы уже не заметно. Но все равно присутствует недостаток высоких частот. На этом битрейте себя лучше проявили кодеры от Fraunhofer, т.к. ISO кодеры продолжают «звенеть», хотя и меньше. Выбирать приходится между кодерами от Fraunhofer, поэтому неплохой выбор — новый MP3 Producer. 192 kbps (7:1) Последнее время, с ростом пропускной способности каналов Интернета, этот битрейт становится более популярным на его просторах. Заметная часть новых записей оцифровавается именно в 192 kbps, во всяком случае теми, кто занимается MP3 серьезно. Кодеры от Fraunhofer убирают высоких больше, чем кодеры ISO, которые уже не «звенят». На этом битрейте кодеры от ISO чуть-чуть опережают Fraunhofer. Но ISO-оптимизированные — гораздо быстрее. 256 kbps (5:1)

Вот тут практически все совсем перестают ощущать разницу между записью с CD и MP3-файлами, даже на очень качественной аппаратуре, при кодировании ISO-кодерами. Все ISO-кодеры

обеспечивают на слух одинаковое качество, которое выше, чем у других кодеков.Используя стерео эффекты и ограничивая ширину полосы звуковых частот, кодирование схем может достигнуть приемлемого надежного качества в более низких частотах. Некоторые типичные данные для MPEG Layer-3:

 

 

Качество звука

Частота

тип

bitrate

Уровень помех

Телефон

2.5 kHz

mono

8 kbps *

96:1

КВ радио

4.5 kHz

mono

16 kbps

48:1

AM радио

7.5 kHz

mono

32 kbps

24:1

FM радио

11 kHz

stereo

56…64 kbps

26…24:1

Приближенное к CD

15 kHz

stereo

96 kbps

16:1

CD

>15 kHz

stereo

112..128kbps

14..12:1

 

Во всех международных тестах слушания, MPEG Layer-3 впечатляюще доказывал высокое исполнение, поддерживая исходное качество при сжатии данных 1:12 (около 64 kbit/s ). Если материал допускает ограниченную ширину полосы частот около 10 kHz, разумное надежное качество для стерео сигналов может быть достигнуто при сжатии 1:24.

 

1:4

Layer 1 ( 384 kbps стерео сигнал),

1:6…1:8

Layer 2 (256..192 kbps стерео сигнал),

1:10…1:12

Layer 3 (128..112 kbps стерео сигнал),

 

Способы кодирования СТЕРЕО в сигнале

В рамках MP3 кодирование стереосигнала допустимо четырьмя различными методами: Dual Channel — Каждый канал получает ровно половину потока и кодируется отдельно как моно сигнал. Рекомендуется главным образом в случаях, когда разные каналы содержат принципиально разный сигнал — скажем, текст на разных языках. Stereo — Каждый канал кодируется отдельно, но кодер может принять решение отдать одному каналу больше места, чем другому. Это может быть полезно в том случае, когда после отброса части сигнала, лежащей ниже порога слышимости или полностью аскируемой, оказалось, что код не полностью заполняет выделенный для данного канала объем, и кодер имеет возможность использовать это место для кодирования другого канала. Этим, например, збегается кодирование «тишины» в одном канале, когда в другом есть сигнал. Данный режим выставлен по умолчанию в большинстве ISO-based кодеров, а также используется продукцией FhG IIS на битрейтах выше 192kbs. Применим и на более низких битрейтах порядка 128kbs… 160kbs. Joint Stereo (MS Stereo) — Стереосигнал раскладывается на средний между каналами и разностный. При этом второй кодируется с меньшим битрейтом. Это позволяет несколько увеличить качество кодирования в обычной ситуации, когда каналы по фазе совпадают. Но приводит и к резкому его ухудшению, если кодируются сигналы, по фазе не совпадающие. В частности, фазовый сдвиг практически всегда присутствует в записях, оцифрованных с аудиокассет, но встречается и на CD, особенно если CD сам был записан в свое время с аудиоленты. Но эта проблема, опять же, нам не сильно важна, т.к. нас интересует, прежде всего, кодирование полноценных Audio CD. Режим выставлен по умолчанию продукцией FhG IIS, а также кодером Lame, для битрейтов от 112kbs до 192kbs. Joint Stereo (MS/IS Stereo) — Вводит еще один метод упрощения стереосигнала, повышающий качество кодирования на особо низких битрейтах. Состоит в том, что для некоторых частотных диапазонов оставляется уже даже не разностный сигнал, а только отношение мощностей сигнала в разных каналах.

Словарь

Кодер (англ. coder, encoder)
Программа и/или устройство, используемые для преобразования информации из одного вида в другой (кодирование). Мы рассматриваем программы, которые преобразуют аудио-данные из формата PCM WAV в ISO MPEG Audio Layer-3 (MP3).

Декодер (англ. decoder)
По сути то же, что и кодер, но осуществляет преобразование в обратном направлении.

Кодек (англ. codec)
Кодер и декодер в одном блоке.

Степень сжатия
Отношение размера входного (некодированного) файла к размеру выходного (кодированного) файла. Например, степень сжатия 11:1 означает, что закодированный файл в 11 раз меньше оригинала.

Битрейт (англ. bitrate)
Количество бит, отведенное для записи единицы времени аудио-информации. Измеряют обычно в кбит/с, то есть килобит в секунду (англ. kb/s или kbps). Степень сжатия (следовательно и качество), определяется шириной потока (bitrate) про кодировании сигнала. Термин битрейт в общем случае обозначает общую величину потока, количество передаваемой за единицу времени информации, и поэтому не связан с внутренними тонкостями строения потока, его смысл не зависит от того, содержит ли поток моно или стерео, или пятиканальное аудио с текстом на разных языках, или что-либо еще. Bitrate может варьировать в широких пределах от наибольшего, 320кбит/с до 96кбит/с и ниже.

Децибелл (англ. decibell, обознач. дБ, dB)
Единица измерения каких-либо величин. По опрелению значение величины в децибеллах равно десяти логарифмам отношения величины в обычных единицах к некой опорной величине в обычных единицах. В звукотехнике обычно используется для измерения слышимости звукового сигнала, при этом в качестве опорной величины берется максимальный уровень звука. Дело в том, что человеческое ухо воспринимает силу звукового потока нелинейно. Особенность слуха в том, что звук в -40 дБ кажется в 2 раза тише, чем звук в -20 дБ, хотя очевидно, что величина U40, описывающая этот звук (в данном случае — мощность звукового потока), в 100 раз меньше величины U20. Получается что «ухо слышит в децибеллах».

Логарифмическая шкала
Шкала, в которой величины, соответствующие соседним отметкам, различаются не на одинаковую величину (как это делается обычно — линейная шкала), а в одинаковое число раз.
АЧХ (амплитудно-частотная характеристика, англ. AFG, amptitude to frequency graph)
Зависимость уровня сигнала от частоты сигнала. Из-за того, что уровень может измеряться и в единицах мощности звукового потока, и в единицах электрического напряжения (по отношению к электрическому представлению этого же сигнала в схемах, скажем, усилителя), и много чего еще; а также учитывая особенности человеческого слуха (см. Децибелл), уровень сигнала часто измеряют в дБ и не конкретизируют, об уровне чего (громкости, напряжения) идет речь. АЧХ можно построить в виде графика.

MPEG Layer 1/2/3
В MPEG Layer3 основной упор делается на оптимизацию качества звучания (кодируется с частотой 44,1 kHz, как и на обычном CD Audio). Что касается MPEG Layer2, например, то там осуществляется понижение частоты дискретизации до 22,5 kHz, что заметно ухудшает восприятие звука, зато в два раза уменьшает объем файла (потока). Этот формат часто используют для передачи аудио в реальном времени по сетевым каналам (Интернет). Правда, в этом секторе более распространен формат RealAudio, т.к. он имеет встроенную защиту. Более подробно это здесь рассматриваться не будет, т.к. этот обзор построен вокруг и около процесса качественного кодирования CD Audio.

Frame
Кодирование данных происходит посредством выделения независимых отдельных блоков данных — фреймов. Для этого исходный сигнал при кодировании разбивается на равные по продолжительности участки, именуемые фреймами и кодируемые отдельно. При декодировании сигнал формируется из последовательности декодированных фреймов.

VBR
В районе конца 98 — начала 99 года XingTech первая использовала технологию переменного битрейта, VBR. Если в случае постоянного битрейта кодер выбирает наиболее значащие частотные составляющие фрейма, убирающиеся в выделенный битрейт, то в случае VBR задается максимальный допустимый уровень потерь, а кодер выбирает еще и минимальный битрейт, достаточный для выполнения поставленной задачи. Стоящие рядом в конечном потоке фреймы могут оказаться в итоге закодированы с совершенно разными параметрами (как вы помните, фреймы кодируются отдельно). Сейчас VBR можно использовать в LAME-кодеке. Единственная проблема кодирования в VBR — значительное падение скорости (в 2-3 раза). Используя сжатие по методу MPEG, можно молучить уменьшение объема данных, все еще поддерживая исходное качество CD.

Поделиться этой статьей