MP3-формат: описание, программы для конвертирования. Чем открыть файл.MP3? Волновое представление файлов MP3 в аудиоредакторах

  • 12.08.2023

З вуки самой разной природы окружают человека с момента его рождения. Согласитесь, если бы не они, наша жизнь потеряла многое. Только представьте себе, что в мире в одночасье исчезли задорный щебет птиц, завораживающий шум морского прибоя, заразительный смех ребёнка, да и вообще - человеческий голос. Тоска смертная! То-то мы и не мыслим своё существование без звука во всех его проявлениях, в музыкальном - прежде всего.

Ч тобы убедиться в сказанном, достаточно вспомнить, к примеру, своё ежедневное пребывание перед экраном включенного монитора. Как часто при этом вы слушаете музыку? Практически всегда, если не сказать постоянно. При этом мало кто задумывается о том, что стоит за музыкой в , на жёстком диске ПК или планшета, карманного музыкального проигрывателя и прочих гаджетов. А ведь это вездесущий формат MP3 - ключевой в современном цифровом мире формат файлов для хранения звука. Он-то и станет героем сегодняшнего рассказа.


MP3 - что такое и как работает?

Г оворя языком профессионалов, MP3 представляет собой кодек третьего уровня (полное название с англ. - MPEG-1 Layer 3 ), созданный для кодирования и хранения звука с небольшими для человеческого восприятия потерями. Алгоритм сжатия, применяемый в формате MP3, позволяет существенно уменьшить размер аудиоданных (по некоторым оценкам, до 12 раз), если сравнивать с файлом Audio CD. При этом качество воспроизведения звука в формате MP3 практически ничем не отличается от оригинала. По крайней мере, в этом убеждено подавляющее большинство рядовых слушателей.

К ак при таком многократном сжатии качество звука остаётся неизменным? Всё довольно просто. В процессе цифровой обработки (кодирования в формат MP3) исходного аудиофайла из него удаляются определённые части звукового потока, которые человеческий слух не различает. Информация, оставшаяся в результате такой отфильтровки, записывается, а затем воспроизводится в урезанном виде. Такова суть работы формата MP3, если выражаться языком дилетантов.

Б лагодаря компактности, формат MP3 стал незаменимым атрибутом эпохи цифровых технологий. Без него сегодня немыслима передача и хранение большей части аудиоконтента в . Его различают все популярные операционные системы, а также поддерживают все без исключения портативные и стационарные аудиоустройства. Словом, MP3 всему голова!

О ткуда растут ноги у этой головы? Узнаем дальше.

Во всём «виноваты» немцы

В Интернете довольно распространено мнение о том, что история формата MP3 началась во второй половине 80-х годов прошлого века. На самом деле её истоки следует искать десятилетием ранее.

В начале 1970-х в университете Эрлангена-Нюрнберга (Германия) собирается коллектив студентов-единомышленников под предводительством профессора Дитера Зайтцера . Цель группы - решить проблему высокоточной передачи человеческой речи посредством традиционных линий телефонной связи.

Д оподлинно неизвестно, чего добились на этой стезе исследователи, ибо во второй половине 70-х их первоначальная цель казалась уже не столь актуальной. Дело в том, что именно тогда в телекоммуникационной отрасли произошла настоящая революция - мир узнал про оптико-волоконный кабель и цифровую сеть связи (ISDN). Эксплуатация подобных новшеств оставляла группу Зайтцера с её задачей не у дел.

В прочем, отчаиваться ребята не стали, переключив своё внимание на решение другой проблемы, связанной с эффективным кодированием (компрессией) музыкальных сигналов.

В 1979 году целеустремлённость учёных дала первые плоды. Зайтцер и Ко разработали первый в мире цифровой алгоритм, предназначенный для сжатия аудиоинформации. В ходе работы над его созданием особо усердствовал студент по имени , впоследствии ставший «отцом» формата MP3. Именно он оказался тем человеком, который впервые обратил внимание своих коллег на то, что оптимальное сжатие аудиоконтента невозможно без учёта особенностей устройства слухового аппарата человека.

В дальнейшем под руководством Зайтцера Бранденбург и остальные члены команды добились значительного улучшения алгоритмов сжатия цифрового звука. Вместе с тем необходимо отметить, что на тот момент результаты их исследований носили скорее теоретический, нежели прикладной характер. В массы их изыскания не пошли. Пока не пошли.


Эра CD-дисков, или Отсроченный триумф MP3

Г рянул 1981 год, когда миру явился компактный диск (англ. - Compact disc ) или просто CD . Его появление, с одной стороны, знаменовало собой новую эру в записи, хранении и воспроизведении цифрового звука, а с другой - отход в тень исследований Бранденбурга.

Э йфория, которая началась после старта в 1982 году массового производства CD-дисков, заметно остудила интерес широкой публики к проблеме компрессии цифровой аудиоинформации. И в самом деле - зачем забивать голову такими мелочами, если Audio CD позволяет хранить и воспроизводить довольно объёмный и при этом очень качественный аудиоконтент?! Ну и что, что не в сжатом виде?! Кого это волнует?!

Т огда не волновало. Но прошло несколько лет, и бум цифровых технологий вновь актуализировал вопрос необходимости компрессии цифрового звука. Причин для этого было несколько. И главные из них сводились к следующему:

  • ~ во-первых, в условиях ограниченности дискового пространства большинства ПК того времени (до 1000 MB) при одновременном росте цифрового нужно было придумать, как сэкономить это самое пространство;

  • ~ во-вторых, скорость передачи цифровых данных оставляла желать лучшего, поэтому необходимо было найти решение, как её повысить;

  • ~ в-третьих, нужно было создать новый формат записи звука, который благодаря своему удобству (небольшой размер плюс высокая скорость передачи) стал бы общепринятым для популярного в те времена программного обеспечения.

И вот тут на сцену снова выходят наши старые знакомые - немецкие учёные. Которые с 70-х годов вели исследования в нужном направлении.

Формат MP3: постепенный восход

Д альнейшие события, связанные с MP3, если отбросить некоторые детали, развивались лавинообразно. Убедиться в этом позволяет следующая хронология.

  • 1987 год - между университетом Эрлангена-Нюрнберга и институтом Фраунгофера в рамках европейского агентства координации исследований создается исследовательский альянс. Последний получил кодовое название Project EU147 . Project EU147 сосредоточился над решением проблемы цифровой трансляции аудиоконтента (англ. - Digital Audio Broadcasting). К слову, компанию немцев разбавили американцы и канадцы - исследовательские подразделения AT&T Bell Labs и Thomson. Во главе Проекта на сей раз стал Карлхайнц Бранденбург.

  • 1988 год - создаются первые рабочие прототипы формата MP3. В январе этого же года под эгидой Международной организации по стандартизации (ISO) формируется орган, ответственный за разработку и внедрение международных стандартов сжатия и передачи цифрового видео- и аудиоконтента. Имя данной организации соответствовало её призванию - Экспертная группа по движущемуся изображению (англ. - Moving Picture Experts Group ). В миру же - просто MPEG .

  • В апреле 1989 года - институт Фраунгофера получает немецкий патент на MP3. Любопытно, но файлов такого формата ещё не существует в природе.

  • 1991 год - Экспертная группа для нового стандарта компрессии цифровой информации MPEG-1 получает 14 различных предложений по сжатию аудиоконтента. Среди них имеется и экспериментальный кодек ASPEC (англ. - Adaptive Spectral Perceptual Entropy Coding), разработанный упомянутым выше альянсом.
    В конце концов (1992 год), выбор MPEG был сделан в пользу ASPEC, который, после определённых доработок и смены названия, стал базовым кодеком третьего уровня MPEG-1. Благодаря своим прогрессивным качествам этот кодек аудиосжатия вскоре стал использоваться отдельно от семейства MPEG-1 для хранения музыки на небольшом дисковом пространстве, а также для передачи аудиофайлов через Интернет. Но это было потом, а пока…

  • …наступил 1994 год, и институт Фраунгофера представил новаторский программный продукт L3enc - первый в мире кодировщик в формат MP3.

  • 1995 год - файлы данного формата получают расширение.mp3. До этого времени в условиях исследований для их обозначения использовалось расширение.bit. Таким образом, этот год считается днём официального рождения названия MP3.

  • В сентябре произошло ещё одно знаковое событие - на свет появился первый в мире операционный MP3-плеер по имени WinPlay3 . С его помощью миллионы людей в разных уголках планеты отныне могли сперва создавать, а затем проигрывать MP3-файлы на своих ПК. Началась эра MP3!

Мировое господство mp3

П оследующая история формата MP3 является констатацией его тотальной экспансии в мире.

  • 1996 год - формат MP3 патентуется в США. Кроме того, популярная в те годы спутниковая радиосеть Worldspace Radio одной из первых объявляет об использовании формата MP3 для кодирования аудиоинформации.

  • 1997 год - в Сети стартует портал mp3.com . Изначально на своих страницах он аккумулировал самую актуальную информацию, касающуюся нового формата (данные о кодировщиках, плеерах и т.д.). Спустя некоторое время ресурс превратился в крупнейший на планете легальный архив музыкальных MP3-файлов. В принципе, таким он остаётся и по сей день.

  • 1998 год - появление на прилавках магазинов портативных MP3-плееров. Первыми стали «Rio 100 » в США и «MPMAN » в Южной Корее. Время дисковых проигрывателей «Walkman » от Sony и их аналогов неумолимо близилось к концу.
    Этот год также знаменателен тем, что институт Фраунгофера (после ошеломительного успеха Winamp ) стал требовать от всех, кто так или иначе пытался коммерчески эксплуатировать ( на mp3) запатентованные им алгоритмы сжатия, покупку соответствующей лицензии. MP3-халява приказала долго жить!

  • 1999 год - рекординговая компания SubPop первой в мире отважилась распространять музыкальные треки в формате MP3.

  • 2000 год - в Штатах разразился настоящий бум продаж устройств, поддерживающих новый формат. С этого момента в США ежегодно реализуют миллионы единиц техники, ориентированной на поддержку MP3. А по всему миру, словно грибы после дождя, начинают появляться компании, специализирующиеся на производстве всевозможных mp3-устройств. Всё это доказывало, что данный формат постепенно превращается в культурный феномен нового тысячелетия.

  • 2004 год - пресловутые немецкие разработчики работают над дальнейшим усовершенствованием алгоритмов сжатия аудиоконтента и, как итог, представляют на суд общественности обновленный формат - MP3 surround . Теперь проигрывание mp3-файлов позволяет добиться стереозвучания!

  • 2007 год запомнился помпезным празднованием двадцатилетия успешной работы, в первую очередь немецких исследователей, на поприще развития алгоритмов аудиокодировки цифровой информации.

  • После бурной гулянки работа в указанном направлении продолжилась. Это же немцы, ребята! В 2009 году институт Фраунгофера совместно с Technicolor явил миру MP3 HD . Обновлённый формат позволяет добиться оптимального сжатия, гарантируя при этом максимальное качество звучания без малейших потерь в оригинальном звуковом потоке.

Любопытный эпилог

Р ассказывать о золушке по имени MP3 можно нескончаемо долго, однако рамки одного материала этого просто не выдержат. Посему в завершении хотелось бы выразить благодарность умным немцам, благодаря которым наша жизнь и звук стали воистину неразделимы!

К стати, практичные немцы признают далеко не только абстрактную благодарность. По последним оценкам, развитие технологий, связанных с MP3, обеспечивает в Германии свыше 10 тысяч рабочих мест. Налоги, которые получает немецкая казна в результате коммерческой эксплуатации алгоритмов MP3, превышают 300 млн. евро в год. А сами немцы ежегодно тратят свыше 1,5 млрд. евро на mp3-плееры и сопутствующие аксессуары. Прекрасный бонус к всеобщей благодарности:)

(Описание популярного формата аудиосжатия MP3)

Вступление

Этот самый популярный на сегодняшний день цифровой формат аудиосжатия, был разработан несколько лет назад небольшой немецкой фирмой Fraunhofer IIS. Европейская корпорация THOMSON активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. В частности при ее поддержке новичок стал одним из стандартов аудиосжатия семейства MPEG1, MPEG2 и получил название MPEG Layer3 или более привычное нам MP3.

Революция звука

Появление этого формата на свет уместнее всего назвать тихой революцией. Революцией – потому что до MP3 ни один формат звуковых файлов не мог обеспечить такое качество при таком относительно небольшом размере. Единственный на тот момент сетевой формат.RA (real audio) иначе чем издевательством над слухом не назовешь. MPEG Layer3 задумывался именно как "убийца" этого убогого монополиста, великана на глиняных ногах. MP3 – это формат, разработанный специально для сети Internet, для быстрой пересылки качественного звука куда угодно. Именно поэтому MP3 является потоковым форматом, что это значит будет рассмотрено в дальнейшем. Способность этого алгоритма сжатия уменьшать размер звуковых файлов практически без потери качества, выглядела по тем временам совершенно фантастически. Ведь даже при кодировании с максимальной шириной потока (bitrate) равной 320 kbs (килобит в секунду), а это качество звука практически неотличимое от оригинального, размер исходного WAV файла уменьшается в четыре раза!

Да, это была революция, но очень странная революция. Ведь этот уникальный алгоритм в начале своего существования висел буквально на волоске. Полное отсутствие рекламы, никаких проигрывателей музыки данного формата, кроме фирменного от Fraunhofer IIS, который отличался крайней убогостью дизайна, жутким управлением и непомерными системными требованиями. Прибавьте еще и колоссальные аппетиты самих разработчиков, которые хотели за свои кодеки (CODEC – COder/DECoder) довольно немалые суммы (схожая ситуация сейчас с некоторыми форматами семейства AAC) и отсутствие музыки как таковой, в отличие от солидных залежей музыки в формате RA. Эти факторы вполне могли загубить новорожденного сразу же после родов. И все любители хорошей музыки должны сказать огромное спасибо тем известным и безымянным разработчикам freeware MP3 CODEC, которые не дали создателю этого формата фирме Fraunhofer IIS из-за своей маркетинговой глупости и жадности погубить гениальное творение.

Так же следует отметить ту важную роль которую сыграл популярный проигрыватель WinAMP в распространении формата MP3. Этот плеер первым предоставил то удобство, которого так не хватало фирменным проигрывателям. Потом, как я уже говорил, этот формат заметила компания THOMSON, и с этого начался победный марш MP3 по всему миру.

МР3 изнутри: психофизиология звука

Данный формат использует крайне сложный алгоритм кодирования. В отличие от обычных архиваторов, которым нужно ухитрится сжать информацию таким образом, чтобы после извлечения из архива в ней не изменилось ни одного бита, MP3 преследует несколько иные цели. Помимо математических алгоритмов сжатия, в этом формате присутствует так же сложнейший алгоритм удаления ненужной звуковой информации, основанный на психолого-физиологических особенностях организма человека. Попытаюсь остановится на данном моменте несколько подробнее.

Как уже говорилось, MP3 является потоковым форматом. Это означает, что звуковая информация при кодировании разбивается на равные по продолжительности участки, которые называются фреймами. Все фреймы взаимно независимы. Каждый из этих фреймов кодируется отдельно со своими параметрами и имеет заголовок, в котором эти параметры описаны. При воспроизведении последовательность декодированных фреймов и порождает непрерывное звучание записанного звука.
Какие преимущества дает данный подход? Во-первых, возможность перемотки, так как возможен легкий переход к произвольному фрейму, и воспроизведение звука именно с этого места. Во-вторых, именно эта структурная особенность и делает MP3 по настоящему сетевым форматом. Загрузив первые несколько фреймов в оперативную память или дисковый кэш, проигрыватель начинает их воспроизводить, при этом одновременно подгружая новые фреймы, чем достигается непрерывность воспроизведения. И наконец, если вы не смогли целиком скачать MP3 файл из сети Internet, то ничего страшного, музыку все равно можно будет слушать, просто проигрыватель дойдет до того места, на котором оборвалась связь и остановится.

Так вот вернемся к нашим фреймам. При высоком качестве MP3, а это bitrate ~ 320 кbs, для кодирования фреймов применяются только математические алгоритмы сжатия. Качество при этом совершенно не страдает, но и размер уменьшается всего в четыре раза, то есть коэффициент сжатия такой, какой бы дал обычный архиватор; именно поэтому файлы формата МР3 практически не ужимаются обычными архиваторами. При уменьшении полосы пропускания (bitrate) до 256 kbs и ниже, в дело вступают те самые алгоритмы удаления "ненужных" звуков, которые основаны на особенностях восприятия звука человеческим ухом, так называемая "психоакустическая модель". Процессы удаления "ненужных" звуков называются квантованием . Чем меньше bitrate, тем жестче идет квантование.

По каким же критериям оценивается "нужность" и "ненужность" звуков? Подавляющее число кодеков выбрасывает звуки, которые считаются выходящими за порог слышимости человека. При этом за значение порога, так сказать de fakto, принимается величина равная 16kHz. Несмотря на то, что этот порог признан азбучной величиной и вписан во все учебники по физике, этот подход неверен. Люди весьма разнообразны по своим физиологическим особенностям. Кроме того, нужно учитывать, что у молодежи слуховой порог гораздо выше, чем у пожилых людей, и запросто может превышать эту среднестатистическую величину. Так же многое зависит от интенсивности сигнала. Следовательно, удаление частот выше 16kHz абсолютно неприемлемо для высоких битрейтов претендующих на CD качество, но вполне уместно для низких битрейтов, где качество приносится в жертву размеру.

Другим критерием, по которому оценивается "ненужность" звука, является условие основанное на такой особенности человеческого слуха, как неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, причем этот уровень различен для разных частотных диапазонов. При использовании психоакустической модели кодирования MP3 CODEC автоматически выбрасывает маломощные, неслышимые частоты. К сожалению, опять таки, люди не одинаковы и те, кто в состоянии различить именно эти частоты, часто жалуются на потерю качества звучания при кодировании, тогда как среднестатистическое большинство этого не замечает.

Но самой главной особенностью психоакустической модели кодирования MP3 является так называемый эффект маскирования. Именно благодаря этому эффекту удается так сильно сжимать исходные аудиоданные. Суть этого эффекта в том, что слабый сигнал одного диапазона частот зачастую маскируется более мощным сигналом соседнего диапазона, если он присутствует в аудиозаписи, или мощным сигналом, предыдущего фрейма. Этот сильный сигнал вызывает временное понижение чувствительности уха к сигналу текущего фрейма. По сути, имеет место явление "временного оглушения". Для каждого звукового диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если маскирующий сигнал превышает мощность сигнала текущего диапазона, то данный диапазон сигнала не кодируется, что позволяет психоакустической модели удалить часть данных из этого фрейма. Для оставшихся данных каждого диапазона определяется, сколькими битами на фрейм мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта. Несомненно, все отмечали, что звук, кодированный при низких битрейтах, отличается крайней нечеткостью и глухостью. Это происходит из-за того, что при потере одного бита информации в общее звучания вносится шум квантования величиной порядка 6 dB.

Все эти ухищрения суммарно называются адаптивным кодированием. Используя тот факт, что подавляющее большинство людей не обладают идеальным слухом, технология адаптивного кодирования позволяет существенно уменьшить размер кодируемого файла выбросив наименее значимые с точки зрения слухового восприятия детали звучания.

Надо заметить, что в случае низких битрейтов кодирование начинается с адаптивного кодирования. После дополнительного квантования формируется итоговый поток, который затем и сжимается по алгоритму Хаффмана (аналогично алгоритму RAR).

Чем замечателен этот формат, так это тем, что степень сжатия, то есть, соотношение размер/качество полностью во власти пользователя. Ширина потока (bitrate) способна изменяться от наибольшего значения в 320kbs, до 64 kbs и ниже, соответственно варьируется и размер.

С технологиями сжатия используемых в MP3 CODEC мы ознакомились, настало время поговорить о разных битрейтах.

Качество требует жертв

Очевидно, что различные битрейты даже одного и того же CODECa дают далеко неодинаковое качество. Причем разные люди совершенно по-разному оценивают качество приемлемости одних и тех же битрейтов, высказывая свое собственное сугубо субъективное мнение. При оценке качественности звучания зачастую возникает путаница, так как многие путают факт наличия низкого или высокого уровня шумов с высоким или низким качеством сигнала. Такой дуболомный подход в принципе неверен, так как это характеристика обычной, некомпьютерной аппаратуры, которую некоторые лихо по аналогии переносят на цифровое аудио, забывая, что для компьютера это всего лишь характеристика конкретного программного MP3 плеера. Отсюда следует, что в некоторых случаях, сменив плеер можно существенно улучшить качество воспроизведения.

Так же, почему-то многие пользователи считают, что мнение профессионалов, так сказать "дегустаторов" от звука, обладающих хорошо развитым слухом и чувством фальши, не является авторитетным, а важно мнение середнячков со слухом отравленным дешевой аудиоаппаратурой уровня ESS. Это мнение может повлиять только на звание которое дают тому или иному CODECу – например "массовый", "народный", "популярный", но при оценке качественности кодировщика оно абсолютно неуместно.

При разработке формата MP3 его разработчики наняли команду профессиональных звуковых "дегустаторов", которые прослушали определенный набор тестовых композиций закодированных с разными битрейтами. Профессионалы единогласно указали, что битрейт 256kbs в большинстве случаев сохраняет качество звучания, которое практически не отличается от исходного. И так же единодушно указали, что уже битрейт 192kbs довольно ощутимо отличается от оригинала и не может претендовать на непогрешимость.

Но вы должны обратить внимание на оговорку "в большинстве случаев" которую эксперты сделали для битрейта 256kbs. В некоторых случаях, особенно при кодировании классической музыки этот битрейт проявляет себя не лучшим образом.

Если вы хотите точного соответствия сжатого файла оригиналу, пользуйтесь максимальный для кодирования CD Audio битрейтом - 320kbs. Коэффициент сжатия 4:1, для битрейта 256 kbs – 6:1. Размер несколько больше, зато качество смело можно считать непогрешимым.

Многие пользователи-меломаны уже создали себе обширные фонотеки на CDR или просто на винте, используя MP3 256kbs и 320kbs. Кстати, именно в этой связи повсеместно приобрели огромную популярность домашние компьютеры, оснащенные приводами CD-RW (пишущий CD-ROM).

Но самый популярный на текущий момент все же битрейт 128 kbs, который весьма быстро занял место формата RA. Причина такой популярности – в относительно небольшом размере (сжатие 12:1), что является определяющим фактором в условиях медленной передачи данных и дороговизны услуг провайдеров. Так же по размеру файла MP3 легко определить продолжительность звучания. У этого битрейта 1 минута звучания занимает примерно 1 мегабайт. Но качество у этого новоявленного "сетевого короля" на СD даже не претендует. Это качество средней аудиокассеты. В сети Интернет можно в основном найти MP3 только с битрейтом 128 kbs, MP3 с этим битрейтом и создавался первоначально как сетевой формат.

Путь к победе: триумф звука

После долгой раскачки данного формата, постепенно тысячи и тысячи пользователей наконец его оценили. Как грибы после дождя появилось множество сайтов, специализирующихся исключительно на распространении музыки в модном формате. Разумеется, практически все MP3-файлы были нелегальны или полулегальны, так как до пользователей не доходило, что распространяя купленную за свои деньги и переведенную в MP3 формат музыку, они нарушают законы об авторских и смежных правах. Или доходило, но... Но вот поймать и тем более наказать нелегальных распространителей оказалось невероятно сложно. Более того, благодаря небольшому размеру MP3 с bitrate 128 kbs оказалось возможным записать на один компакт-диск не 74 минуты музыки как раньше, а более 650 минут! Этим немедленно воспользовались пираты. Они стали производить диски типа "все альбомы хитовой группы на одном диске". Аудиозаписывающие компании стали нести убытки. Зачем покупать один альбом, если за те же деньги можно купить десять альбомов на одном CD?
Попытку побороть нелегальное распространение музыки MP3 недавно предпринял звукозаписывающий гигант RIAA. Но было уже поздно. MP3 индустрия достигла невиданного размаха. Стали появляться аппаратные мини-плееры с памятью на 32 мегабайта и возможностью подключения к компьютеру, их уже появилось более 40 моделей. Плееры для автомобилей на базе небольших по объему (1Гб) винчестеров. Даже звуковые карты с аппаратной поддержкой MP3. С этой волной бороться стало невозможно. MP3 стал первым признанным форматом хранения аудиоданных после CD-Audio. Это была победа.

Эта музыка будет вечной...

Пусть MP3 уже не лучший. Ему на смену идут новые формать: семейство AAC (advanced audio codec), VQF, PAC (perceptual audio codec). Но он был первым. Кроме того, многочисленная аудитория пользователей MP3 весьма консервативен, MP3 удалось глубоко поразить своих поклонников, тогда как его конкуренты способны их разве что слегка удивить. Так что думаю этому стандарту уготованы еще долгие годы существования, прежде чем его сменит более достойный.

Глоссарий

  • MP3 (MPEG Layer3) - цифровой формат мультимедиасжатия семейства MPEG, предназначенный исключительно для кодирования звука. Имел предшественников в лице МР1 и МР2, отличатся высокой сложностью алгоритма, как следствие высокими требованиями к системным ресурсам. Лучший в своем классе по соотношению размер/ качество.
  • CODEC - расшифровывается как COder/DECoder. Это не что иное как совокупность алгоритмов кодирования и декодирования звука.
  • Bitrate - ширина потока. Количество бит, использующиеся для кодирования звукового потока. Измеряется в kbs, т.е. число килобит в секунду.
  • Квантование – процесс удаления частот, не воспринимаемых обычным человеческим слуховым аппаратом (ухом).
  • CD Audio - старейший формат цифрового звука, существует более 20 лет. Параметры 44Khz, 16-bit стерео.
  • RA - формат, расшифровывается как Real Audio. Первый сетевой формат, обеспечивающий передачу и воспроизведение звука в реальном времени. Если сравнивать с МР3, то имеет битрейт 8 и 16 kbs, и соответственно ужасное качество звука.

Сегодня трудно найти человека, незнакомого с трехбуквенной аббревиатурой – mp3. Вот только, когда начинаешь спрашивать, что же это такое и как расшифровывается, то некоторые люди недоуменно разводят руками, а другие говорят так: ”Ты что? Это же музыка этот MP3!”. Кроме того, MP3 поддерживают многие мобильники. Об этом то мы знаем, а дальше, а больше? :)Понятно, что мало кому понятно, что это за формат. В этой статье я как раз и объясню, что же все - таки это такое, этот MP3.

MP3 – это наиболее популярный формат хранения и передачи информации в цифровой форме, использующий компрессию сигнала. Формат MP3, или MPEG Audio Layer-3, был разработан компаниями Fraunhofer IIS и Thomson. По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit, Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.
Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плееров, каждый современный телефон поддерживает MP3-мелодии (и даже имеет встроенный плеер для их удобного воспроизведения). По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.

Описание формата MP3

Формат сжатия аудиоданных MP3 (сокращение от MPEG Layer3) - один из первых популярных способов сжатия звука. Разработан немецкой компанией Fraunhofer IIS и позднее, при поддержке фирмы THOMSON, внедрён как часть видеоформатов MPEG1 и MPEG2. Обеспечивает высокое качество звука при сравнительно небольших размерах файла.

Технические сведения о формате MP3

Высокая степень сжатия в MP3 достигается за счёт достаточно сложного алгоритма кодирования. Используются как математические методы компрессии, так и особенности человеческого слуха (психоакустическая модель): эффект маскировки слабого звука одной частоты более громким звуком такой же или соседней частоты, понижение чувствительности уха к тихому звуку сразу после громкого, невосприимчивость к звукам ниже определённого уровня громкости.

Поток звука при кодировании разбивается на равные по участки (фреймы). Каждый из фреймов кодируется отдельно со своими параметрами и содержит заголовок, в котором эти параметры указаны. Сжатие может быть выполнено с разным качеством и соответственно размером конечного файла.
Степень сжатия характеризуется битрейтом (bitrate) - количество передаваемой за единицу времени информации. Файлы MP3 обычно закодированы с битрейтом от 64 до 320 килобит в секунду (kbps или kb/s), а также с переменным битрейтом (VBR) - когда для каждого фрейма используется свой, оптимальный для данного участка, битрейт.
Исходный сигнал с помощью фильтров разделяется на несколько частотных диапазонов, для каждого диапазона определяется величина маскирующего эффекта от соседних диапазонов и предыдущего фрейма, несущественные сигналы игнорируется. Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери были ниже величины маскирующего эффекта. На этом работа психоакустической модели завершается, а итоговый поток дополнительно сжимается по алгоритму Хаффмана (аналогично RAR архиватору).

При битрейте 320 kbps применяется только итоговое сжатие, без психоакустического моделирования. Следует иметь в виду, что различные кодеки могут кодировать аудиосигнал по-разному, различия особенно проявляются на высоких частотах и низких битрейтах. В формате MP3 кодируется стереосигнал, при этом возможны несколько вариантов преобразования:

Dual Channel - каждый канал получает половину потока и кодируется отдельно - возможна запись двух абсолютно разных сигналов.
Stereo - каждый канал кодируется отдельно, но программа-кодер может использовать свободное место одного канала для размещения информации другого. Режим stereo выставлен по умолчанию в большинстве кодеров.
Joint Stereo (MS Stereo) - стереосигнал раскладывается на общий для обоих каналов и разностный. Имеет вариант - MS/IS Stereo с упрощённым разностным сигналом.

Сильные стороны формата MP3:

Высокая степень сжатия при приемлемом качестве звука.
Степень сжатия и качество может регулироваться пользователем.
Фреймовая структура удобна для передаче по сети, позволяет переход к любому месту файла.
Широкое распространение аппаратуры и программ.

Сегодня трудно найти человека, незнакомого с трехбуквенной аббревиатурой – MP3. Вот только, когда начинаешь спрашивать, что же это такое и как расшифровывается, то некоторые люди недоуменно разводят руками, а другие говорят так: ”Ты что? Это же музыка этот MP3!”. Кроме того, MP3 поддерживают многие мобильники. Об этом то мы знаем, а дальше, а больше? :)Понятно, что мало кому понятно, что это за формат. В этой статье я как раз и объясню, что же все - таки это такое, этот MP3.

MP3 – это наиболее популярный формат хранения и передачи информации в цифровой форме, использующий компрессию сигнала. Формат MP3, или MPEG Audio Layer-3, был разработан компаниями Fraunhofer IIS и Thomson. По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit, Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.

Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плееров, каждый современный телефон поддерживает MP3-мелодии (и даже имеет встроенный плеер для их удобного воспроизведения). По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.

Описание формата MP3

Формат сжатия аудиоданных MP3 (сокращение от MPEG Layer3) - один из первых популярных способов сжатия звука. Разработан немецкой компанией Fraunhofer IIS и позднее, при поддержке фирмы THOMSON, внедрён как часть видеоформатов MPEG1 и MPEG2. Обеспечивает высокое качество звука при сравнительно небольших размерах файла.

Технические сведения о формате MP3

Высокая степень сжатия в MP3 достигается за счёт достаточно сложного алгоритма кодирования. Используются как математические методы компрессии, так и особенности человеческого слуха (психоакустическая модель): эффект маскировки слабого звука одной частоты более громким звуком такой же или соседней частоты, понижение чувствительности уха к тихому звуку сразу после громкого, невосприимчивость к звукам ниже определённого уровня громкости.

Поток звука при кодировании разбивается на равные по участки (фреймы). Каждый из фреймов кодируется отдельно со своими параметрами и содержит заголовок, в котором эти параметры указаны. Сжатие может быть выполнено с разным качеством и соответственно размером конечного файла.

Степень сжатия характеризуется битрейтом (bitrate) - количество передаваемой за единицу времени информации. Файлы MP3 обычно закодированы с битрейтом от 64 до 320 килобит в секунду (kbps или kb/s), а также с переменным битрейтом (VBR) - когда для каждого фрейма используется свой, оптимальный для данного участка, битрейт.

Исходный сигнал с помощью фильтров разделяется на несколько частотных диапазонов, для каждого диапазона определяется величина маскирующего эффекта от соседних диапазонов и предыдущего фрейма, несущественные сигналы игнорируется. Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери были ниже величины маскирующего эффекта. На этом работа психоакустической модели завершается, а итоговый поток дополнительно сжимается по алгоритму Хаффмана (аналогично RAR архиватору).

При битрейте 320 kbps применяется только итоговое сжатие, без психоакустического моделирования. Следует иметь в виду, что различные кодеки могут кодировать аудиосигнал по-разному, различия особенно проявляются на высоких частотах и низких битрейтах. В формате MP3 кодируется стереосигнал, при этом возможны несколько вариантов преобразования:

  • Dual Channel - каждый канал получает половину потока и кодируется отдельно - возможна запись двух абсолютно разных сигналов.
  • Stereo - каждый канал кодируется отдельно, но программа-кодер может использовать свободное место одного канала для размещения информации другого. Режим stereo выставлен по умолчанию в большинстве кодеров.
  • Joint Stereo (MS Stereo) - стереосигнал раскладывается на общий для обоих каналов и разностный. Имеет вариант - MS/IS Stereo с упрощённым разностным сигналом.

Сильные стороны формата MP3:

  • Высокая степень сжатия при приемлемом качестве звука.
  • Степень сжатия и качество может регулироваться пользователем.
  • Фреймовая структура удобна для передаче по сети, позволяет переход к любому месту файла.
  • Широкое распространение аппаратуры и программ.

Особенности применения MP3

Несмотря на то, что кодирование в MP3 осуществляется с утерей части исходной информации, при битрейтах 256 и 320 kbps практически невозможно отличить на слух сжатый сигнал от оригинала, особенно при прослушивании на распространённой аудио аппаратуре. При этом размер файла в самом худшем случае будет в 4 раза меньше, чем в формате CD audio.

Для использования в компактных плеерах и других устройствах с невысоким качеством акустики можно вполне использовать битрейт не ниже 192 kbps. Битрейты ниже 192 kbps рекомендуется использовать для сжатия сигнала с ограниченным частотным диапазоном или невысокими требованиями к достоверности (например, разговор или телепередача).

На чем же основана идея компрессии звука в MP3?

Наверняка, обращаясь к приятелю, отгороженному от внешнего мира «музофоном», вы замечали, как он начинает неестественно громко отвечать на ваши вопросы, поскольку собственный голос, слышимый им под рев рок-концерта, звучит для него непривычно тихо - особенность человеческого восприятия. И дело тут не столько в остроте слуха, сколько в способности нашего мозга «переваривать» звуковую информацию: не реагировать на импульсы, мощность которых ниже определенного уровня; после сильного грохота не слышать шепота и т. д.

Этим и пользуются при создании MP3-кодеров, в каждом из которых может быть реализована своя собственная, варьируемая в зависимости от целей и задач, так называемая психоакустическая модель, где можно пренебречь сравнительно слабыми сигналами.

Как же работают такие методы?

Исходный звуковой сигнал разбивается на отдельные блоки, именуемые фреймами, к каждому из которых применяется специальный алгоритм кодирования, причем параметры сжатия для разных фреймов могут значительно отличаться друг от друга. В процессе кодирования блока исходный сигнал разделяется на несколько составляющих частотных диапазонов. Для каждого из них просчитывается величина так называемого эффекта маскирования слабого сигнала более мощным от соседнего диапазона или от предыдущего фрейма. Затем в зависимости от результатов происходит удаление второстепенных звуков, которые не будут слышимы «среднестатистическим» человеком из-за наличия в данный момент более громкого сигнала. Кроме того, учитывается неспособность большинства людей различать высокочастотные сигналы (выше 16 kHz).

Аудиоинфоpмация, сжатая по данной схеме, может передаваться потоком, например через интернет, а может храниться в файлах формата MP3.

Битрейт и его значение

Одной из важнейших характеристик MP3-файла является битрейт - скорость потока обрабатываемых данных, или общее количество информации, передаваемой в единицу времени. Эта величина не зависит от того, содержит этот поток моно- или стереозвук.

Битрейт 128 Kbps с легкой руки Fraunhofer IIS был признан оптимальным для использования в интернете, а некоторые производители кодеров распространили мнение о том, что этой скорости вполне достаточно для кодирования музыки с качеством, близким к Audio CD. Однако это не так. На хорошей аппаратуре невосполнимые потери аудиоинформации становятся заметными.

Чем выше битрейт, тем больше места на диске потребуется для сохранения конечного MP3-файла, но и, как правило, тем выше будет качество закодированного сигнала. В целом же каждое значение битрейта имеет свою область применения.

Даже профессиональные эксперты с тонким музыкальным слухом порой не в состоянии отличить на хорошей аппаратуре звучание трека Audio CD и его образа, закодированного в MP3-файл с низким коэффициентом сжатия, например 4:1 (320 Kbps). Для рядового же меломана эта разница становится практически неощутимой при скорости потока 192-256 Kbps.

Ежели вы имеете дело только с компьютерными акустическими системами или недорогой бытовой радиоаппаратурой, то для кодирования и последующего прослушивания композиций вполне достаточно 160-192 Kbps. Для компрессии быстро устаревающей поп-музыки, а также для «выкладывания» музыкального архива в сети вполне подойдет и 128 Kbps. Значения битрейта ниже 128 Kbps не позволяют добиться должного качества звучания. Скорости 64-96 Kbps чаще всего используют для сжатия аудиоуроков иностранного языка, лекций, интервью и аудиотрансляций.

Долгое время кодеры поддерживали лишь постоянный битрейт (CBR - Constant BitRate), т. е. пользователь задавал определенную скорость потока данных, а программа обеспечивала при этом максимально возможное качество кодирования. Но очевидно, что плотность потока значимой информации от фрейма к фрейму различна. (Зачем, к примеру, кодировать паузы?) Вот разработчики кодеров и решили использовать для компрессии каждого фрейма свой битрейт, т. е. поставили задачу минимизировать скорость потока данных, сохранив тот же уровень качества. Так родилась идея переменного битрейта VBR (Variable BitRate).

Думаю, теперь вам стало чуть более понятно, какую музыку «предпочитает» ваш телефон. Желаю вам больше приятных мелодий! До встреи в следующих статьях на mobime!

В 1987 году институт Fraunhofer начал свою работу над алгоритмом аудио кодирования, основанном на восприятии в агентстве EUREKA, проект EU147: Трансляция Цифрового Аудио (Digital Audio Broadcasting – DAB). В совместной кооперации с Университетом Эрлангена (University of Erlangen, Prof. Dieter Seitzer), Fraunhofer IIS продумал и разработал очень мощный алгоритм, который был стандартизирован как ISO-MPEG Audio Layer-3 (IS 11172-3 и IS 13818-3 ).

Различную информацию по разработкам института Fraunhofer’а вы можете найти по адресу

Общие сведения

Формат иногда путают с MPEG-3, но MP3 предназначен для сжатия исключительно аудиоинформации и полное название звучит как MPEG Audio Layer-3. MPEG-3 же предназначался для использования в системах телевидения высокой четкости (HDTV) с битрейтом потока 20-40 Мбит/с, но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается.

Нельзя сказать, что этот формат аудиосжатия легко пробился к массовому пользователю. На начальном этапе раскрутки Fraunhofer – институт, создавший МP3 , едва не убил собственное детище не в меру поспешной жадностью (кстати, многие разработчики новых аудиоформатов, совершают ту же ошибку), но, увидев, что никто не желает платить деньги за кота в мешке, сделала единственно верный шаг – сделала этот формат открытым и бесплатным. Сказать, что после этого МP3 стал популярен – значит ничего не сказать. Это был взрыв популярности! Этот аудиоформат столь резво пошедший в массы обладал по тем временам нереально высоким коэффициентом сжатия звука при достаточно высоком качестве звука и с легкостью покорял любого пользователя, который любил слушать музыку. С молниеносной быстротой появилась целая индустрия: МP3-сайты, которые занимались только МP3 , производители программных и аппаратных проигрывателей музыки в МP3 формате, нелегальные распространители музыкальных композиций, более известные как пираты, первые додумавшиеся до выпуска дисков типа “все песни этой группы на одном диске”. Невероятно возрос спрос на пишущие CD-R дисководы и чистые диски для них. МP3 теперь всюду – это признанный звуковой формат. Его используют в играх, кодеки встраивают в операционные системы. Вот уже несколько лет МP3 на вершине популярности…

Но вот, эйфория, вызванная его появлением, потихоньку прошла, и стало ясно, что МP3 вовсе не безупречен. Несмотря на высокую степень сжатия, размер файлов все же слишком велик, чтобы сделать МP3 по-настоящему сетевым форматом, а 128 kbps, столь любимый пиратами и народом, дает настолько низкое качество, что огрехи при воспроизведении слышат не только продвинутые музыканты и меломаны, но и вполне рядовые пользователи. В свете этого возникла нужда в новых альтернативных более прогрессивных алгоритмах компрессии звука. И такие алгоритмы появились очень быстро. Некоторые из них начали разрабатываться практически одновременно с МP3 (например VQF), но по каким-то причинам вышли позже и упустили пальму первенства, некоторые алгоритмы разрабатывались и позиционировались разработчиками уже как замена МP3 (семейство MPEG-2 ААС). Тем не менее, эти алгоритмы по своим возможностям и качеству во многом превосходят MP3 .

MP3Pro

Расширенная версия от Coding Technologies, которая использует Spectral Band Replicaton (отражение спектральной полосы частот) – SBR , чтобы повысить его эффективность для битрейтов ниже 96 kbps stereo. Не будучи частью MPEG стандарта, поддержка mp3PRO обеспечивается только некоторыми программными и аппаратными продуктами, например Thomson демо плеер/кодер и input plugin для Winamp, MusicMatch JukeBox, Nero, dbPowerAMP, JetAudio, Steinberg myMP3PRO, Impload, Spacial Audio, Audion 3, RCA Lyra портируемый и DVD плеер. Это возможно не изменится в будущем, тем не менее некоторые слуховые тесты показали хорошую производительность на низких битрейтах по сравнению с другими кодеками.

Реализации

Lame (Lame Ain’t Mp3 Encoder)

Разработка Lame началась приблизительно в середине 1998 года. Майк Ченг (Mike Cheng) начал улучшение и исправление исходных кодов кодера 8hz-MP3. После некоторых сомнений сообщества о его качестве, Майк твердо решил начать с чернового варианта, основанного на исходных кодах dist10. Эта ветка стала LAME 2.0, и только на LAME 3.81 они освободились от всего исходного кода dist10, и LAME наконец-то перестал быть всего лишь доработкой. Проект быстро превратился в командный проект. Майк Ченг (Mike Cheng) в итоге оставил лидерство и начал работать над MP2 кодером, tooLame. Марк Тейлор (Mark Taylor) принял лидерство и появилась версия 3.0, имевшая новую психоакустическую модель, gpsycho, разработанную им. Сегодня Lame считается лучшим MP3 кодером на высоких и переменных битрейтах, следует сказать большое спасибо посвятившим этой работе талантливых разработчиков, таких как Takehiro Tominaga, Naoki Shibata, Darin Morrison, Gabriel Bouvigne, Robert Hegemann и так далее. Разработка Lame продолжается и по сей день. Таким образом, LAME на сегодняшний день является наиболее перспективным кодером. Замечательное качество и высокая доступность позволили получить ему народное признание. Используется в Winamp’е для кодирования информации в MP3 из Audio-CD, также есть в dbPowerAmp’е.

Gogo-No-Coda

Gogo является веткой MP3 кодера LAME с переписанными на ассемблере местами, наиболее требовательными к процессору. Это сделало Gogo одним из быстрейших MP3 кодеров с приемлимым качеством. Он был разработан командой японских программистов.

FhG Fastencc

Это – MP3 кодер, основанный на кодирующих библиотеках, украденных из института Fraunhofer’а. По слухам, разработчик нарушил свое соглашение о конфиденциальности и сделал доступными эти библиотеки для некоторых программистов. Один из этих программистов сделал CLI для этих библиотек и назвал его fastencc.

Этот кодер известен своим отвратительным багом стерео, его использование крайне не рекомендуется.

Fraunhofer IIS

Это – кодек от создателей технологий MP3 и AAC . Считается самым медленным MP3 -кодеком, тем не менее, он обладает довольно высоким качеством. Он входит в стандартную поставку Windows, используется в Adobe Audition .

Helix

После приобретения кодека Xing компанией RealNetworks , его развитие продолжилось и кодек стал называться Helix . На форумах doom9 пользователь karl_lillevold (похоже , что он является разработчиком в компании RealNetworks ) объявил об открытии исходного кода проекта Helix . Сообщество восприняло довольно тепло такой шаг, участником Enig123 начали формироваться сборки с исправлениями и улучшениями.

На сайте сообщества Helix есть описание MP3 декодера, ключевыми моментами которого являются оптимизация под ARM-процессоры, легкая подключаемость в виде библиотеки и в целом качественный код.