Компрессия звука: принцип и настройка. Компрессия в работе со звуком

  • Перевод
  • Tutorial

Для чего нужна компрессия?

Компрессоры и лимитеры - это специализированные усилители, используемые для уменьшения динамического диапазона - промежутка, между самым тихим и самым громким уровнем трека. Использование компрессии при записи и живом миксе может сделать звук качественнее путем контроля максимальных уровней и поддержания более высокой средней громкости. Кроме того, большинство компрессоров - как аппаратных, так и программных - имеют своё фирменное звучание, которое способно привнести замечательный окрас и тон в «безжизненный» трек. Компрессия так же используется, когда необходимо сделать звук более естественным и понятным без добавления искажений, в результате чего ваш трек будет слушаться максимально «комфортно». С другой стороны, чрезмерное сжатие может погасить ту искру, которая делала запись живой. Для тех, кто не знаком с компрессорами, знание основ позволит начать долгий путь к пониманию, как компрессия работает, и использованию её в свою пользу.

Общие элементы управления и параметры компрессора

Вне зависимости от того, какой компрессор вы используйте, и является ли он аппаратным или плагинным, существуют некоторые общие параметры и элементы управления, которые вы будете использовать, что бы настраивать его работу. Ниже приведен ряд из основных элементов компрессора.
Threshold
Управление порогом устанавливает уровень, при котором происходит сжатие. Когда уровень сигнала становится выше порогового, он будет скомпрессирован. Если порог установлен, скажем, на -10 дБ , только пики сигнала, которые выше этого уровня, будут сжаты. Все остальное время компрессии происходить не будет.
Knee
«Колено» отображает переходы между сжатым и несжатым аудиосигналом. Как правило компрессоры предлагают одну из, или в некоторых случаях возможность переключения между обоими, настроек: «soft knee» или «hard knee” . Некоторые компрессоры позволяют вам выбрать любое положение между двумя этими типами настроек. Как вы можете видеть на рисунке, „soft knee“ обеспечивает более плавное и постепенное сжатие, чем «hard knee».

Attack Time
Речь идет о времени, которое потребуется сигналу, чтобы стать полностью скомпрессированным после превышения порогового уровня. Более быстрая атака, как правило, от 20 мкс до 800 мкс зависит от типа и марки устройства, в то время как более медленная - в диапазоне от 10 мс до 100 мс . Некоторые компрессоры представляют это значение как дБ/сек . Быстрое время атаки может создавать искажения, изменяемые природе медленных низкочастотных сигналов (например, если цикл на 100 Гц длится 10 мс , то у атаки в 1 мс будет время, что бы изменить форму волны, что и будет формировать искажения.
Release Time
Это значение буквально противоположно времени атаки. В частности, это время, которое требуется сигналу, что бы перейти обратно в исходное состояние. Release Time будет значительно больше, чем время атаки, и в целом составляет от 40-60 мс до 2-5 секунд , в зависимости от того, с каким прибором вы работаете. Это значение также может быть представлено в виде дБ в секунду . Нормальная работа компрессора будет заключаться в установке этого значения как можно меньшим, не создавая при этом эффект «раскачки», который вызывается цикличной активацией и деактивацией компрессии. Например, если «release time» выставлено слишком маленьким и компрессор циклирует между активным и неактивным состоянием, ваш основной сигнал - как правило, бас-гитара или бочка - будут модулировать шум, в результате чего появится эффект «дыхания».
Compression Ratio
Этот параметр часто остается неправильно понятым, но он просто показывает величину ослабления, которая применяется к сигналу. Вам будет предложен широкий диапазон доступных коэффициентов сжатия в зависимости от типа и производителя компрессора, который вы используете. «Compression Ratio» 1:1 представляет собой коэффициент «единичного усиления», или, иными словами, без ослабления. Эти значения выражаются в децибелах, так что соотношение 2:1 указывает на то, что сигнал, превышающий порог на 2 дБ, будет ослаблен до 1 дБ выше порогового значения, или сигнал, превышающий порог на 8 дБ, будет ослаблен до 4 дБ после порога, и т.д. Соотношение около 3:1 можно считать умеренным сжатием, 5:1 будет средним уровнем сжатия, 8:1 начинает ряд значений сильного сжатия, а значения от 20:1 и до ∞:1 считаются ограничивающими и могут быть использованы для обеспечения сигнала, не превышающего пороговый. На диаграмме ниже показаны коэффициенты сжатия, как они относятся к входным и выходным сигналам и как ваши настройки сжатия повлияют на общий сигнал.

Output Gain
Часто компрессоры воспринимаются как приборы, делающие сигнал громче. В действительности же все компрессивно-индуцированные ослабления уменьшают сигнал на выходе. Вот тут «output gain» и вступает в игру. Вы можете использовать выходной усилитель для нейтрализации ослабления сигнала после компрессии. Некоторые компрессоры обладают индикаторами “gain reduction”, что позволяет более точно применить выходное усиление.

Большая четверка: Распространенные типы компрессии

Тип компрессора, который вы выберите, так же сыграет большую роль в общем звучании эффекта. Некоторые из них будут иметь более быстрые значения “attack”/“release”, а некоторые придадут звуку интересный окрас и винтажную атмосферу. Это список из четырех наиболее известных типов компрессии и краткое описание того, чем они отличаются.
Ламповая компрессия
Вероятно, самый старый тип компрессии. Как правило, имеет более медленную реакцию, чем другие типы компрессии. Благодаря этому, лампа привносит различные окраски и «винтажный» звук, которые почти невозможно достичь с другими компрессиями. (Пример: Fairchild 670)
Оптическая компрессия
Оптическая компрессия влияет на динамику звукового сигнала с помощью световых и оптических элементов. С ростом амплитуды сигнала световые элементы испускают больше света, что приводит к «оптическим ловушкам», ослабляющим выходной сигнал. (Пример: LA-2A Classic Leveling Amplifier)
FET -компрессия
Компрессор на основе полевого транзистора эмулирует ламповое звучание с помощью транзисторной схемы. Они быстрые, чистые и надежные. (Пример: 1176LN Classic Limiting Amplifier)
VCA-компрессия
Компрессоры на основе усилителя, управляемого напряжением, используют твердотельные элементы или интегральные схемы. Они, как правило, дешевле, чем ламповые или оптические компрессоры. Они так же меньше окрашивают звук по сравнению с другими. (Пример: dbx® 160 Compressor / Limiter) Вот несколько советов для работы с компрессорами. Это, конечно же, не правила, но мы надеемся, что они помогут вам при работе с этими чрезвычайно мощными приборами. Получайте удовольствие от опыта и экспериментируйте!
  • Лучше использовать мягкую компрессию на всех стадиях записи/сведения/мастеринга, а не чрезмерно сильную только на одном этапе.
  • Всегда слушайте, когда работаете с компрессией. Она может негативно повлиять на тембр инструмента. Это может случиться из-за типа компрессии, которую вы используете, или же чаще всего из-за разных тонов между минимумами и максимумами звука инструмента.
  • Попробуйте начать со средних соотношений в районе от 2:1 до 5:1. Установите время атаки на среднее/быстрое, а время релиза на среднее. Теперь постепенно поднимайте порог, пока не достигните около 5 дБ «gain reduction». Затем установите выходное усиление на 5 дБ для компенсации затухания. И наконец, ускорьте ваше время атаки, пока не добьетесь нужного эффекта.
  • Если вы хотите ставить компрессию на весь микс, то будьте крайне осторожны. Во многих типах популярной музыки бас-линия находится на постоянном уровне сигнала. Если вы будете использовать компрессию для удаления пиков, весь уровень микса опустится до этого уровня из-за бас-линии, что приведет к режиму «раскачки», описанного выше. Это проблема может быть решена с использованием многополосного компрессора. Этот тип может разделить сигнал на несколько частотных диапазонов и позволит сжимать их по отдельности.
  • И как всегда, позвольте судить вашим ушам. Если звучит хорошо - значит все хорошо.

В этой статье пойдёт речь о компрессии звука как о эффекте и средстве сужения динамического диапазона. Будет на практике показано действие компрессора, лимиттера, гейта и максимайзера.

Введение в компрессию звука
Для чего же нужна компрессия звука? Компрессия звука нужна для повышения разборчивости обрабатываемого сигнала. Компрессия может быть применена как к отдельному не изменяющемуся звуку, так и к партии определённого инструмента или же ко всей композиции. Основные цели использования компрессии звука:

  1. Увеличение общей громкости композиции
  2. Удаление щелчков и резко выделяющихся громких звуков
  3. Придание чёткости и разборчивости звучания

Общая громкость композиции или отдельной партии увеличивается благодаря уменьшению амплитуды наиболее громких частей композиции и последующим увеличением громкости всей композиции, за счёт освободившегося пространства. В результате этого действия более громкие звуки становятся тише, ну а более тихие звуки становятся громче, динамический диапазон композиции сужается. Также с помощью компрессии можно удалять из звука так называемые «пики» — кратковременные всплески амплитуды не несущие в себе ни полезной информации ни эстетичности. Это возможно благодаря специальным настройкам компрессии, — подавления амплитуды звука с определённой силой и скоростью реакции на превышение заданного пользователем уровня звука. Разборчивость и чёткость придаётся ряду инструментов благодаря характерным настройкам компрессии. Так, при обработке бас бочке компрессором с достаточно большим временем реагирования (атаки) она становится более чёткой за счёт подчёркиванием характерного щелчка. Вокал и речь после компрессии становится более разборчивым благодаря искусственому повышению громкости тихих звуков, которые в обратном случае маскируются более громкими звуками (эффект маскировки).

Параметры компрессии звука

Компрессор анализирует уровень звука на входе сравнивая его с задаваемым пользователем значением Threshold (Порог).

Если уровень сигнала ниже значения Threshold — то компрессор продолжает анализировать звук не изменяя его. Если уровень звука превышает значение Threshold — то компрессор начинает своё действие. Так как роль компрессора заключается в сужении динамического диапазона, то логично предположить то что он ограничивает наиболее большие и наиболее маленькие значения амплитуды (уровня сигнала). На первом этапе происходит ограничение наиболее больших значений, которые понижаются с определённой силой, которая называется Ratio (Отношение).

Порог срабатывания (threshold) – уровень звука, после превышения которого компрессор начинает работать.
До обработки компрессором:




Соотношение (ratio) – с которым будет подавляться входящий сигнал, после того как будет превышен порог срабатывания Threshold.
Атака (attack) – время которое проходит пока компрессор достигает выставленного Ratio, т.е. с 1:1 (bypass) до, скажем 4:1. Если Атака стоит на 20 ms, то на 10 ms сигнал уже обрабатывается с Ratio 2:1.
До обработки компрессором:


После обработки компрессором:


Обратите внимание на то что появился характерный пик, показывающий промежуток времени, по истечению которого компрессор начал подавлять сигнал (после подавления уровень звука был повышен).
Отступление (release) – время, которое проходит после того как сигнал упал за порог и компрессор возвращается в исходное положение, до Ratio 1:1.

Типы компрессоров

Компрессоры разделяются на несколько типов, исходя из их предназначения, цели применения. Иногда нужно добавить чёткости и разборчивости обрабатываемому звуку. Иногда нужно просто срезать все значения амплитуды, превышающие определённый уровень (не затронув полезный сигнал). Иногда нужно обработать всю композицию так чтобы с наименьшими потерями качества звука максимально сузить динамический диапазон. Именно в следствие различных целей применения компрессоры и подразделяются на несколько типов, хотя на самом деле всё их отличие заключается лишь в вышерассмотреных параметрах компрессии. Т.е. всякий тип компрессора является ограниченной версией оригинального, стандартного компрессора, иногда с добавлением дополнительных параметров и процессоров звука для более удобной работы. Ниже приведён пример работы обычного компрессора. До обработки:

после обработки:

Благодаря тому что время атаки отличалось от нуля — появились пики амплитуды, отображающие те места, в которых компрессор начинал работать после превышения уровня звука.

Лимиттер

Лимиттер — это компрессор с нулевым значением атаки (времени срабатывания компрессора), большим уровнем компрессии (ratio) и очень коротким промежутком времени действия компрессора. Благодаря таким настройкам — компрессор срезает все короткие выступы амплитуды, подобные тем, которые Вы можете наблюдать в предыдущем примере (после обработки компессором). Лимиттер приминяется для повышения общего уровня звука, ведь после подобной компрессии звука освобождается определённое динамическое пространство, ранее занимаемое «пиками». В конце обработки звука его громкость повышается с помощью параметра out (output).

Гейт

Гейт — это процессор звука, который также начинает подавлять звук после преодоления определённого порога уровня звука, однако его отличие заключается в том, что он начинает работать после того как звук станет не громче а тише определённого пользователем уровня. Это необходимо для удаления шума, посмотрите примеры действия этого процессора. До обработки гейтом:

Обратите внимание на то что на втором изображении отсутствует шум. Гейт подавляет звук до тех пор пока не будет превышен определённый польователем уровень звука. Сложность заключается в том, чтобы правильно выставить значения атаки и отступления — это влияет на обработку полезного сигнала, на сколько он будет видоизменён при удалении шума.

Максимайзер

Максимайзер — это экстремальная компрессия звука, применяемая для максимального сужения динамического диапазона. В результате чего композиция теряет свою динамичность и обретает «громкость». Максимайзерами обычно пользуются на конечном этапе обработки композиции, преимущественно только в электронной и поп. музыке.

Давайте послушаем несколько аудио примеров компрессии звука.
До обработки гейтом:

После обработки гейтом:

До обработки компрессором.

О компрессорах аудиосигнала, основных параметрах работы читайте в нашей статье. Также мы расскажем о дополнительных функциях и схемах подключения устройств.

Все начинающие музыканты слышали о компрессоре аудиосигнала. Одни – считают его волшебным прибором, который позволяет сделать музыку лучше. Другие – не понимают назначения, не пользуются, либо прогоняют звук через устройство на средних пресетных настройках, потому что «так сказали!».

Сегодня мы с вами разберемся в том, что такое компрессор. Узнаем принцип его работы и особенности применения. Эта статья, как предыдущие, расcчитана на широкий круг непрофессиональных пользователей, поэтому мы не будем углубляться в технические параметры и использовать сложную терминологию. Однако некоторые необходимые для работы вещи все же придется озвучить.

Что такое компрессор

Итак, компрессор должен что-то сжимать. Примерно так и работает устройство.

Принцип его работы проще понять по графику (смотри ниже). Нужно представить, что у нас есть входной и выходной сигналы.

Рисунок 1. График работы компрессора, на котором изображены сигналы входа и выхода

Компрессор – это динамический прибор, который меняет соотношение входного и выходного сигнала, уменьшая динамический диапазон трека.

Основные параметры компрессора

У любого компрессора есть минимум два основных параметра: порог срабатывания и величина компрессии. Для облегчения работы мы рекомендуем использовать приборы с четырьмя параметрами. Какими? Почему нам нужны все четыре?

1. Порог срабатывания (Threshold) – это уровень (точка на графике) с которого компрессор начинает свою работу. Если не указано иного, то компрессор не трогает звук тише уровня срабатывания, звук громче – зажимает, деля тише

2. Величина компрессии (Ratio) – величина на которую будет обработан сигнал, превышающий порог срабатывания. В связи с тем, что компрессор изменяет соотношение входного и выходного сигналов, величину компрессии принято выражать соотношением. Например, 2:1. Это значит, что при увеличении ВХОДНОГО сигнала на 2 дБ, ВЫХОДНОЙ увеличится всего на 1 дБ!

3. Атака (Attack) – параметр, отвечающий за время, которое необходимо компрессору для начала обработки сигнала. Attack есть не во всех приборах, часто является автоматическим и не поддается корректировке. Конечно, устройства с возможностью изменения удобны в работе.

4. Восстановление (Release) – параметр времени. Отвечает за возврат установленного режима работы компрессора к исходному.

Как они работают?

Давайте рассмотрим работу параметров на конкретном примере.

Возьмем исходный материал с графика работы компрессора (смотри рисунок 1). Мы видим, что на рисунке изображен сигнал, громкость которого увеличивается. Через некоторое время она возвращается к исходной позиции.

Основные моменты работы прибора легко проследить именно на этом отрезке.

Работать необходимо с частью выделенного сигнала. Позже вам будет легче увидеть разницу между необработанным и измененным отрезками.

Рисунок 4. Настройка параметров обработки

Обработаем сигнал со следующими настройками: порог – 24 дБ, величина – 4:1, атака 100 мс, восстановление – 1000 мс. Приблизительные настройки взяты для наглядности.

Рисунок 5. Результат обработки отрезка

Нажимаем «применить» и видим вот такой результат.

Что же у нас получилось? Компрессор сразу начал мягко повышать уровень сигнала до среднего значения, так как он было выше порога. В тот момент, когда сигнал стал громче, наоборот – понижать. На рисунке хорошо видно, что устройство не сразу начало понижение уровня входного сигнала, а с некоторой задержкой – это и есть время атаки. В результате громкость обработанного участка стала ближе к некоему среднему значению.

Дополнительные настройки

Помимо основных, многие современные приборы обладают дополнительными настройками. Рассмотрим некоторые из них:

  • Make-Up Gain – это регулятор, позволяющий оптимизировать выходной уровень. Применяется при слишком тихом выходном уровне сигнала.
  • Knee – регулятор, а чаще переключатель, определяющий мягкость срабатывания компрессора. В большинстве приборов выполнен в виде переключателя с обозначениями HardKnee и SoftKnee.
  • Peak/RMS – переключатель, определяющий характер работы компрессора. Следовательно, прибор будет реагировать либо на пиковые значения, либо на среднеквадратичную громкость. Компрессор, установленный в режим Peak и Ratio – ∞:1 – является лимитером.

Итак, мы рассмотрели основные принципы и параметры работы компрессора. Тихое он делает громче, а громкое – тише. Однако, необходимо упомянуть и о других режимах работы.

Компрессоры с дополнительными функциями

Большинство современных приборов выполняют не только компрессию. Чаще всего – это компрессоры-лимитеры, компрессоры-экспандеры, компрессоры-гейты, компрессо-лимито-экспандеры и другие.

Но существует множество приборов, выполняющих только одну функцию:

  • Лимитер – прибор/режим, который отрезает превышающий уровень срабатывания сигнал. Его работу «слышно» только на конечной записи.
  • Экспандер – прибор/режим, усиливающий сигнал с уровнем выше порога срабатывания. Звук с меньшим уровнем он не обрабатывает. Это устройство выполняет противоположную компрессору функцию и применяется для исправления «поджатого» сигнала.
  • Гейт – не затрагивает сигнал выше порога срабатывания, а тот что ниже убирает до 0 дБ. Устройство/режим позволяет убрать тихие посторонние звуки в паузах. Часто применяется на радио.

Нестандартные варианты использования компрессора

Существенно расширяет возможности компрессора режим Side-Chain – «боковая цепь». В нем к прибору на одноименный вход подается сигнал для управления степенью компрессии. Используется в электронной музыке для создания «качающего грува»: на входы компрессора подают сигнал баса, а на вход боковой цепи – сигнал бочки. В момент ее звучания, компрессор сильно давит бас, в момент тишины – восстанавливает уровень звучания. Создается эффект, при котором бас «выпрыгивает» из бочки.

Музыканты в популярной музыке применяют его для усиления внутреннего движения, выражения динамики. Чаще всего используют Side-Chain компрессию всей (или почти всей) фонограммы от вокала.

Режим позволяет реализовать компрессию в определенном спектре частот, подавая на управляющий вход сигнал после эквалайзера с заданными для сжатия частотами. Наверное, многие уже догадались, что таким образом можно организовать де-эссер или многополосную компрессию. Для этого у вас должно быть несколько устройств.

Компрессор также позволяет управлять атакой и восстановлением. Гитаристам знаком прибор «Сустейнер», который представляет собой настроенный определенным образом компрессор. В электронной музыке им обрабатывают каждую дорожку, а на некоторых (ударных), их бывает больше двух.

Схемы подключения компрессоров

Для домашней студии:

Для использования в качестве выходного мастер-компрессора/лимитера

Подведем итоги

Компрессор – это незаменимый прибор, который за счет разных режимов работы позволяет реализовывать как технические, так и творческие задачи:

  • Нивелировать разницу между тихими и громкими нотами певца, гитариста, бас-гитариста, ударника. Раньше этим занимался специальный человек, управляя ручкой громкости микрофона во время записи, полагаясь на свой слух и знание партитуры.
  • Управлять атакой и восстановлением.
  • Держать необходимый уровень громкости. Например, на радио.
  • Получить сухое звучание инструментов, убрав посторонние шумы в паузах между нотами.
  • При помощи управляющего сигнала Side-Chain реализовать частотно-зависимую компрессию.
  • Добиться динамики в фонограмме.

Как и в любом другом деле, здесь важна умеренность. Не стоит увлекаться. Излишняя компрессия, лимитирование, могут вызвать артефакты звучания. Сокращая динамический диапазон всего трека, вы делаете его громким, мощным, но скучным. В профессиональных кругах на этой почве возникло явление «Война дБ».

Постарайтесь сделать так, чтобы компрессия была, а слышно ее не было.

Недавно, прослушивая очередной трек в программе Reason, я обратил внимание на настройку компрессора на инструменты. Этой программой я пользуюсь довольно давно, но уже «сижу в кубе». Меня удивило, что на бас бочку был задан порог срабатывания 5 децибел с компрессией 1:2, атакой 1 миллисекунда и затуханием 200 миллисекунд (НА БАСС БОЧКУ!!!). Вы что-нибудь поняли из этого? Если нет, то вам следует читать эту статью. Советую так же почитать ее и более продвинутым пользователям.

Итак, что же такое компрессия ? По этому вопросу написано уже достаточно литературы и статей. Нам же нужно самое важное и как можно более простым языком. Ранее на студиях звукозаписи «роль компрессора» выполняли звукооператоры или звукоинженеры (это не важно, важно то, что это были обычные люди). Представьте себе партию бас гитары. В идеале сыгранная она представляет собой довольно ровную динамическую (приблизительно одной громкости) картину. Но иногда получается, что звук на некоторых ладах звучит более громко, а на других тише. В таких случаях звукорежиссер держал ползунок громкости на микшере и при тихих моментах он повышал уровень, при громких - понижал. Тем самым он выравнивал динамический диапазон . Но ведь это был обычный человек и реакция у него так же человеческая, то есть в момент повышения громкости он реагировал не сразу, а после определенного времени. Дальше, когда звук становился тише, звукооператору нужно было время чтобы сориентироваться и прибавить уровень. Это пример работы «человеческой» компрессии , но без цифр. После этого краткого описания можно сформулировать следующие термины:

  • Атака (attack) - время, до начала понижения уровня (компрессии );
  • Спад (release) - время для возращения исходной громкости;
  • Компрессия (ratio) - относительная величина на которую передвинул ползунок громкости звукоинженер (на сколько она относительна рассмотрим чуть ниже);
  • Порог срабатывания (threshold) - уровень звука, после которого звукоинженер выравнивал громкость сигнала.
  • Входной сигнал (in) - сигнал который слышит звукоинженер;
  • Выходной сигнал (out)- сигнал, который слышим мы с вами:).

Естественно то что звукоинженер уставал и на смену ему:) пришли приборы под названием компрессоры. Принцип работы у компрессоров был тот же. Но было намного больше преимуществ. Главный из них - это то что можно конкретно задавать значения параметров, что немаловажно для получения требуемого результата. Теперь посмотрим принцип работы компрессора в «цифре».

Рисунок 1

На рисунке изображен компрессор компании Sony. Принцип его работы можно изобразить графически.


Рисунок 2

Данный график показывает зависимость выходного уровня сигнала в зависимости от компрессии и входного уровня. По оси х - сигнал на входе по оси у - на выходе. Так что же тут происходит, судя по графику? Давайте разберемся вместе. Серая линия, наклонена под углом 45 градусов - это есть линия уровня сигнала (или компрессии ). Доходя до порога срабатывания, она надламывается и идет несколько ниже (не обращайте внимание на пунктирную линию). Как видно из графика показано 3 варианта пути данной ломаной линии. Для самого первого варианта показана «компрессия 2:1». Теперь давай посмотрим на продолжение серой линии пунктиром - это компрессия 1:1. Значит, при увеличении компрессии происходит понижение выходного уровня до конкретного значения. Это значение можно с легкость посчитать как: out=threshold+(in- threshold)*ratio. Например какой выходной уровень будет на компрессоре при threshold=-18 дб, in=0 дб, ratio = 1:3. out=-18+(0-18)*1/3=-12 дб. Получили, что называется, результат в цифре - это уже хорошо. Давайте обратим внимание на горизонтальную ломаную линию. Это линия компрессии с ratio равной 1:бесконечность. В этом случае сигнал не будет выше по уровню порога срабатывания, а, следовательно, получаем ограничение или лимитирование сигнала.

Сделаем небольшую рецензию.
1. Компрессия это процесс выравнивания динамического диапазона;
2. Компрессия характеризуется величинами threshold и ratio;
3. Компрессор срабатывает после превышения порога срабатывания threshold;
4. При компрессии 1:1 компрессор пропускает звук без изменений, при 1:бесконечность получаем лимитирование (в литературе приводится факт, что при компрессии 1:15 уже получается лимитирование сигнала).

Теперь необходимо разобраться с параметрами атаки (attack) и спада (release).

Данные характеристики уже зависят напрямую от типа звукового материала и ваших ушей. Рассмотрим типичный пример - бас бочка.


Рисунок 3. Бас бочка без обработки компрессией

При применении настроек (рисунок 4) бочка стала плотнее (рисунок 5).


Рисунок 4. Настройка компрессора для бас бочки


Рисунок 5. Бас бочка после обработки компрессией

Обратите внимание: компрессия начала активно срабатывать при превышении порога с самого начала. Причем сигнал уменьшился по громкости.

Далее можно применить немного другой компрессор Graphic Compressor от производителя Sony. Но там есть еще один параметр - выходная громкость. Теперь тут нужен расчет. На слух тут мало что сделаешь. Из формулы out=threshold+(in- threshold)*ratio = -18+(0+18)/4=-13 дб. Но так же следует учесть звук, который идет перед атакой, то есть приблизительно -4 дб. Теперь для того чтобы не было перегрузки необходимо выбрать одно из значений и компенсировать выходной сигнал до уровня 0 дб. А выбирается значение, которое меньше, так как если к выходному сигналу добавить 12 децибел, то звук будет искажаться в периоде перед атакой.


Рисунок 6. Настройка графического эквалайзера

После обработки звук получается более плотным, по динамике и басу выше, чем без обработки.


Рисунок 7. Полученная бас бочка после обработки графическим компрессором

Следует заметить что при динамической обработке готовых звуковых петель алгоритм несколько другой. Рассмотрим поподробнее.

Для этого создадим петлю (рисунок 8).


Рисунок 8. Звуковая петля


Рисунок 9. настройка компрессора

В результате получили проблему - звук получился очень резкий. (рисунок 10) и грязный.

На первый взгляд ничего не произошло, но если присмотреться, появился небольшой щелчок у бочки в начале, стали более выделенные хай хеты.

При пред мастеринге обычно используют многополосные компрессоры. Преимущества их в том, что весь спектр частот трека разбивается на полосы (зоны), которые в дальнейшем компрессируются отдельно. Особых рекомендаций по многополосной компрессий нет, так как характер звучания трека выбирается самим автором этого трека.

Как всегда после статьи несколько советов:

1. Не используйте компрессор на все дорожки подряд, а используйте только на те, которые динамически неровные
2. Эквализацию лучше всего ставить перед компрессией
3. Не использовать компрессор как максимайзер, для этих целей лучше подходят L3 от Waves
4. Не используйте нулевые атаки - проще понизить уровень сигнала
5. При обработке партии бас бочки спад компрессора лучше ставить порядка 50 мс, при этом компрессор отработает до начала следующего удара.

Успехов вам в творчестве.

Обратите внимание:

Комментарии (54)

Чтобы оставить комментарий, авторизуйтесь .

4esh - СТАТЬЯ ОТЛИЧНА! НЕДАВНО НАЧАЛ САМ МАСТЕРИТЬ ДОМА, ПОСЛЕ ПРОЧТЕНИЯ РЕЗУЛЬТАТЫ ВЕСЬМА-ВЕСЬМА УЛУЧШИЛИСЬ... СПАСИБО)))

dissector - математики в звуке - напрягают. главные задачи компрессора на на сегодня 1 скрыть кривые руки-горла "музыкантов и певцов" 2 сжать динамический диапазон для цифромастеринга за не имением запаса по перегрузу на цифре. 3 некоторые из них - реально прикольные эффекты - вносящие в звук теплоту и оттяг. gotohell...

Compressor - Правильная формула выглядит так: Output = ((Input - Threshold) / Ratio) + Threshold Или иначе (для самых маленьких и тупых): Input - Threshold Output = ----------------- + Threshold Ratio

Donpedro - Статья хорошая для всех. Споры это подтверждают. Даже имея высшее инженерное по радиотехнической специальности - сразу понять характер работы компрессора трудно вообще...Поэтому отталкиваться недо всегда от цели использования прибора:"что тебе надА?"...ответ: "здесь поприжать, а тут приподнять!"...потом: где понизить?..сколько?..на сколько?..Где приподнять?..сколько?..на сколько?.. И сначала ответить себе на эти вопросы...тогда станет сразу ясно, что если ты Релизить будешь на все 50м/с, то будь готов к поднятию и шума, высоких и ревера в бочке - и получишь всю грязь на сколько поднимешь ратио...Если хочешь понизить щелчек - посмотри, где он по времени, прибери до компрессора в его полосе эквалазером ровно на столько - на сколько будешь поднимать остальной сигнал...поэтому думай какая атака тебе нужна и спад(и это относится не к сигналу - а к компрессору)...конечно, нет смысла делать эквализацию трека, если ты с минимальной атакой и спадом во всю длительность звучания поставишь ратио 8:1 и поднимешь общий уровень трека...т.е. думаю не надо друг-друга здесь поносИть, а просто делайте свою музыку, применяя прочитанное...и, если она стала лучше - статья пошла на пользу...

Миха - статья норм. Что такое компрессор понял,как только прочёл. Хотя мои музыкальные пристрастия заканчиваются на авто звуке. Критика полезна,если уместна. West777,нормально ответил. Ебланы не дуйтесь. Щеки треснут.

Аудио компрессия для меломанов

правда о высоком битрейте при сжатии с потерями

Предисловие

В понимании большинства людей слово меломан чаще всего ассоциируется с человеком, не просто любящим и коллекционирующим музыку, а еще и ценящим качественную музыку, причем не только в художественно-эстетическом плане, но еще и качество записи самой фонограммы. Подумать только, еще несколько лет назад эталоном качества музыки считался аудио компакт диск, компьютер же даже в мечтах не мог конкурировать с качеством CD. Однако, время — большой шутник, и часто любит переворачивать все с ног на голову. Прошло, казалось бы, совсем немного времени, какой-то год или два и… всё, компакт диск на PC отступил на второй план. Не спрашивайте "почему?", Вы ведь сами знаете ответ на этот вопрос. Всему виною революция в мире звука на компьютере — аудио компрессия (здесь и далее под аудио компрессией подразумевается сжатие с потерями, для уменьшения размера аудио файла), которая позволила хранить музыку на жестком диске, много музыки! Более того, появилась возможность обмениваться ею через Интернет. Вышли новые звуковые карты, способные "выжать" чуть ли не студийное качество из, казалось бы, бесполезной в плане музыки "железки". Сегодня, имея даже не очень шустрый по производительности компьютер, купив звуковую карту Creative SoundBlaster Live! и вспомнив, что еще с советских времен имеется хороший усилитель и добротная акустика, Вы получите ни что иное, как музыкальный центр высокого качества, звучание которого уступает разве что очень дорогой аудио аппаратуре (средней или даже высшей Hi-Fi категории). Прибавьте к этому общедоступность музыкальных файлов, и Вы поймете, что у Вас в руках — сила. И тогда происходит переворот, и Вы понимаете, что компакт диск — это уже и не так удобно, завораживает Вас совсем другое — магические знаки "MP3". Вы не можете ни есть, ни спать — перед Вами неразрешимый на первый взгляд вопрос "курицы и яйца": чем "сжимать" и, самое главное, — как "сжимать"…

Из существующих на сегодня форматов компрессии аудио заслуживающими внимания, на мой взгляд, являются три: MP3 (или MPEG-1 Audio Layer III), LQT (как представитель семейства MPEG-2 AAC / MPEG-4) и совершенно новый формат OGG (Ogg Vorbis), разрабатываемый группой энтузиастов:

  • На сегодняшний день MP3 — самый распространенный из них (в первую очередь потому, что он бесплатный). Напомню, что именно благодаря формату МР3 и произошло победоносное шествие сжатого аудио. Однако, как часто бывает с пионерами, он постепенно сдает позиции и уступает место более новым и качественным форматам.
  • Второй формат, LQT, является представителем нового направления алгоритмов аудио кодирования, представителем семейства AAC. Это достаточно качественный, но коммерческий и строго засекреченный формат.
  • OGG стал широко известен общественности этим летом и на данный момент бурно развивается, в скором времени (с релизом кодера и декодера) должен побить MP3 лучшим качеством звучания при меньшем объеме файлов.

Я не буду приводить здесь подробного описания технологий и форматов, Вы легко можете найти их самостоятельно. Будут только факты, выводы и рекомендации. Свои исследования отдельно по каждому формату я планирую изложить в отдельных статьях.

Условие задачи

Я решил "столкнуть лбами" три указанных формата на предмет получения максимально качественного звука при минимальном размере файла. Для теста были выбраны несколько семплов (здесь семпл — вырезанный из PCM файла небольшой фрагмент) из композиций двух типов. Первый — очень плотного и громкого звучания с нормализацией по амплитуде (уплотнение звука "по вертикали", чтобы он с 24 битного мастера уместился в 16 битах) и компрессией динамического диапазона (чтобы при этом звучание всех инструментов было всегда громким). В качестве первого типа (как и в моих прошлых тестах) была выбрана композиция Crush On You из альбома Have A Nice Day группы Roxette, исследовалось три семпла по 15-20 секунд с разных участков композиции. Второй семпл — чистый и прозрачный (легкая оркестровая или акустическая аранжировка). В качестве второго типа была взята композиция Mano a Mano с альбома Tango известного пианиста Richard Clayderman.

Почему именно эти записи? В семплах Roxette имеет место очень сильная динамическая компрессия (значение амплитуды очень часто равно максимуму (что плохо) и приводит к перегрузке воспроизводящей аппаратуры и сильным искажениям).

На подобных семплах кодерам приходится работать в экстремальном режиме, из-за чего становятся легко слышны любые искажения, т.к. к уже имеющимся собственным искажениям оригинала добавляются еще и искажения кодирования. Вы спросите "а зачем тогда брать в качестве теста такой семпл?". Нужно и еще как. Подавляющее большинство выпускаемых в настоящее время альбомов именно таким образом и записано. Поэтому кодер должен приемлемо относиться к перегруженному звуку.

С семплами Клайдермана ситуация диаметрально противоположная. Исходно аналоговая запись после очень качественного цифрового ремастеринга записана на компакт диске, причем без динамической компрессии.

Великолепное звучание, очень приятные и мягкие "верха". На них мы и обратим особое внимание при проведении анализа, попытаемся их сохранить. А ведь именно эти частоты кодерам будет сложнее всего передать.

Чем "жмем"

Мои исследования эталонного качества для разных битрейтов и кодеров формата MP3 выражены в программе OrlSoft MPeg eXtension . Параметры кодирования подобраны по результатам тестов.

Безусловный лидер качества на высоком битрейте — кодер LAME. Кодеры от Fraunhofer IIS по-прежнему хороши только для низких битрейтов — для 128 и 160 кбит/с. Про другие я даже говорить не буду. Только НИ В КОЕМ СЛУЧАЕ не связывайтесь с кодерами, основанными на коде XING (самый известный представитель — Audio Catalyst) — эти самые плохие, звук — просто ужас.

Для большинства пользователей формата MP3 проблема качественного звука обычно ставится следующим образом: "256 или 320? а может попробовать VBR?". И этот вопрос мучает их изо дня в день. Не все записи хорошо звучат в 256 — имеют место сильно слышимые и видимые (по измерениям) потери в области верхних частот. При использовании режима VBR (так называемый поток с переменным битрейтом) часто бывает, что музыка звучит на слух лучше, чем 256, но это нельзя брать за общее правило. Кодируйте мало ценные записи, либо не очень качественные — не ошибетесь. Параметры VBR у меня подобраны для получения максимального для VBR качества.

Для коммерческого формата LQT существует только фирменный кодер от авторов — Liquifier Pro. Им и жмем. Отмечу, что формат LQT изначально основан на VBR кодировании, поэтому для него существует просто несколько режимов типа "плохо", "хорошо" и "отлично". Естественно, для наших тестов берем режим "отлично" (Audiophile), в результате чего получается поток от 192 до 256, чаще всего 200-220 кбит/с. Напомню, что формат LQT основан на семействе алгоритмов MPEG-2 AAC. Более того, это наиболее качественная на сегодня реализация AAC (проверено на аналогах).

Формат OGG родственник формата MP3, однако содержит в себе иную психоакустическую модель и некоторые отсутствующие у MP3 технические новинки. Начать хотя бы с того, что OGG изначально поддерживает только режим VBR. Пользователь задает ориентировочную скорость потока, а кодер пытается сжать максимально ближе к нему. Диапазон изменения чрезвычайно широк: от 8 до 512 кбит/с, причем он значительно более дискретный, чем у MP3. Верхняя планка составляет целых 512 кбит/с, в то время как MP3 кодеры на сегодня реально "тянут" только до 320. Вы спросите "а разве бывает что и 320 мало?". Да, бывает, но редко.

Семплы Roxette

Ну вот, мы и подошли к самому интересному. Начнём с моих слуховых ощущений.

Для МР3 на потоке 256 кбит/с явно слышны нарушения звучания верхних частот. Мало того, что в звуке отсутствует немалая их часть, так еще и примешивается сильное искажение, хрип, металлический лязг и прочие "прелести". Это знак к тому, что 256 явно не хватает, следовательно, надо попробовать повыше. Берем сжатый в 320 семпл. Звук значительно изменился — это совсем другое дело: верха на месте, на слух никакой разницы не обнаружено. Для чистоты эксперимента посмотрим, что же получится в режиме плавающей скорости потока. Получаем средний битрейт в 290 кбит/с, из чего напрашивается вывод, что 256 для исследуемого семпла маловато будет. Действительно, на слух семпл, закодированный в режиме VBR, звучит чуть-чуть лучше, чем 256, однако явно не дотягивает до звучания 320. В случае применения МР3, для качественного сжатия подходит только кодирование в режиме 320 кбит/с, т.е. на максимуме возможностей.

Берем OGG как "модифицированный MP3". Для кодера существует пять ориентировочных битрейтов: 128, 160, 192, 256 и 350. Что ж, попробуем 192 и 256. Битрейт 350 брать не будем, т.к. нам уже известно, что MP3 при 320 кбит/с передает явно прекрасное качество, лучше вроде бы и не надо. Для режима 192 получаем средний поток в 226, а для режима 256 — целых 315 кбит/с. Вот вам и точность. Столь большое отклонение от ориентира — это сигнал к очень сложно кодируемому звуковому материалу, при более простом по плотности семпле точность будет выше. Честно говоря, я долго пытался оценить 320 MP3 и 315 OGG и пришел к выводу, что оба они звучат практически аналогично исходному звучанию. Но они основаны на разных психоакустических моделях и окраска звучания у них разная. Лично мне чуть больше понравился все-таки MP3. Однако, это действительно спорный вопрос — ведь кодер OGG пока только бета версия. Когда будет релиз, думаю, он должен обогнать MP3 в качестве. Сравнивая их по отдельности с оригиналом, я склонился к тому, что OGG все-таки ближе по звучанию к оригиналу, но вот с верхними частотами у этого кодера что-то не так. Из-за этого MP3 и звучит немного лучше. Думаю, не надо говорить, что в режиме 350 (средний битрейт получился в 365) OGG "идеально" повторяет оригинал.

Теперь про малоизвестный, но широко рекламируемый как "самый качественный" формат — формат LQT. И, что самое главное, он действительно звучит очень круто в целом, однако, прислушавшись, я понял, что мне не понравилось в его звучании. Он не искажает верхние частоты, как MP3 на 256 кбит/с, но размазывает звук, причем сильно размазывает. Резкие звуки размываются во времени. Да, это плохо. Но дело в том, что сравнивать LQT на битрейте всего в 230кбит/с с MP3 на таком же битрейте бесполезно, МР3 проигрывает по общему звучанию. Придраться, конечно, есть к чему. МР3 теряет и искажает верхние частоты, LQT же в свою очередь несколько "проваливает" средние частоты и размазывает верхние. В общем, тут кому что больше понравится. Но это — тема уже для другой статьи. Сегодня у нас разговор только про высшие битрейты. Да, LQT дает хорошее качество, но отнюдь не супер. По всей видимости, здесь сказывается недостаток скорости потока, то есть, если в LQT появится режим большего битрейта, он побьет даже 320 кбит/с MP3 на записях типа исследуемой.

Это были мои чисто субъективные впечатления. Давайте теперь перейдем к более объективным тестам. Исследуем АЧХ (то есть амплитудно-частотную характеристику ) семплов, признанных лучшими (320 для MP3, 315 для OGG и 230 для LQT). Представленная диаграмма — так называемый "сонарм" — частотно-временное представление звука. По горизонтали располагается шкала времени, по вертикали — линейная шкала частот.

Внимательно присмотрелись? Вот вам и ясное подтверждение моих слов: новейший формат Ogg Vorbis в режиме 256 явно недотягивает "по верхам" — урезание частот видно невооруженным взглядом. "Супер коммерческий" формат LQT передает диапазон частот по верхам вроде как даже лучше, чем LAME, но общее качество хуже. Дело в том, что в LQT нет режима чистого стерео — там, по сути, всегда Joint-Stereo (кодер сначала сжимает левый канал, а потом кодирует только разницу между левым и правым). Из-за этого и происходит размазка верхов при недостатке битрейта, что прекрасно видно на иллюстрациях, плюс сие заключение легко подтверждается исследованием сигнала в MS-матрице, т.е. при переводе его в режим центральный канал + стерео. Что можно сказать про семпл LAME… все просто замечательно — чуть-чуть урезаются верхние частоты, но это терпимо; видимых провалов также не отмечено.

Подытожим. На финишной прямой для семпла Roxette форматы OGG на 256 кбит/с и LQT сошли с дистанции, семпл OGG на 350 кбит/с не уступает лидеру. Однако не будем хоронить новый формат раньше времени — подождем релиза. Вот тогда уже и проведем тесты еще раз: OGG 256 против LAME 320.

Семплы Richard Clayderman

C семплами Roxette вроде все понятно — плотный звук пока лучше сжимать кодером LAME в режиме 320 кбит/с. А как насчет более прозрачного звука? Попробуем сначала сжать в режиме 256 кбит/с и все, по идее, должны бы быть довольны. Результат: низкие частоты вроде на месте, да и средние тоже, а вот верхние частоты… не стало верхних частот! Они есть, но в них не осталось того красивого звучания, не обратить внимание на которое в данной записи очень сложно. Высокие частоты в целом на месте и сильных потерь нет, однако звук "тарелок" стал какой-то синтетический, резкий и весьма неприятный. Такой звук не имеет права претендовать на звание качественного. Что ж, придется снова использовать 320, а ведь как хотелось сжать в 256… Если сравнивать 320 со звучанием 256, передача верхних частот стала значительно лучше. Однако, при сравнении с оригиналом, слышно, что запись по-прежнему не является удовлетворительной в плане качества. После сравнения еще нескольких семплов, становится очевидно, что это погрешности психоакустической модели. Даже в 320 кбит/с MP3 не передает нормально верхние частоты на исследуемом типе записей. Верхние частоты становятся более резкими, металлическими, от них так и веет синтетикой и, как ни странно, они кажутся более громкими (измерения АЧХ этого не демонстрируют — чисто слуховой эффект).

Исследуем теперь Ogg Vorbis. Как и в предыдущем тесте, берем семплы, сжатые в режиме 256 кбит/с. После неудачи с MP3 сложно поверить в полученный результат — звучание Ogg Vorbis лучше по всем параметрам и не идет ни в какое сравнение с тем, что выдает LAME на 320 кбит/с! Сравнивая с оригиналом, также очень сложно найти разницу. Ogg Vorbis на битрейте 287 побил LAME на битрейте 320. Именно об этом я и говорил в начале статьи: формат OGG вполне может победить MP3.

Хорошо, а что нам может сказать титулованный формат LQT на битрейте всего в 252? Но и здесь получается шокирующий результат — чрезвычайно близкое соответствие оригиналу! По-крайней мере, разница настолько мала, что можно считать ее несущественной. Еще, обратите внимание на интересный факт: при кодировании семплов Roxette средний битрейт получался порядка 230 кбит/с, а на, казалось бы, более простых семплах Clayderman — 250 кбит/с. Это говорит о том, что LQT значительно лучше адаптирован под реальное звучание музыки, в нем более точно учитываются все нюансы. Великолепный формат. Вот ему бы нормальный кодер без выкрутасов и битрейт чуть-чуть повыше, чтобы смог кодировать более сложные семплы.

Это были мои субъективные "слуховые" исследования. Теперь посмотрим на АЧХ.

И снова анализ АЧХ сигналов только подтверждает мои выводы по результатам прослушивания: LQT выдает просто выдающийся результат, на сей раз лучше LAME. Прекрасная передача частотного диапазона, а потери на уровне 21 кГц это удаленный высокочастотный шум, что даже приветствуется. LAME отстает, но не сильно. Как и ожидалось, с передачей частотного диапазона у MP3 все нормально. А вот АЧХ семпла Ogg Vorbis принесло разочарование: посмотрите, какое урезание частот. Но звучит он лучше, чем можно было бы подумать, взглянув на его АЧХ. По всей видимости, за счет урезания некоторых частот получается возможным более точно передать общую звуковую картину.

И что же мы получаем в итоге? Два лидера: LAME и LQT на максимальном битрейте. OGG очень сильно наступает на пятки MP3 и победит в дальнейшем, если его разработчики доведут свою идею до финального воплощения: меньший размер и лучшее качество.

Исследование дельта-сигналов

Формат MP3 за счет высокого битрейта лучше на большинстве записей. Однако он сдает позиции, когда мы имеем дело с очень качественным звуком. Здесь LQT — абсолютный фаворит. Но разница между 256 и 320 не такая уж и большая, поэтому ею чаще всего можно поступиться ради более удобного и распространенного формата. Многие, да и я в том числе, так и делают в своей фонотеке, а особо качественные записи просто покупают на дисках.

Все это конечно хорошо, но два формата звучат по-разному, и это не дает многим покоя. Есть еще одно интересное исследование. Можно вычислить разностный сигнал (далее он будет упоминаться как дельта-сигнал ) двух семплов и тем самым узнать, а в чем же они различаются. Это, конечно же, сугубо цифровое исследование, т.к. разница может быть не настолько значительной, чтобы ее можно было услышать. В нашем случае все оказалось совсем не так.

Громкость разностного сигнала доходит до -25дБ, а его АЧХ внешне сильно напоминает широкополосный шум. Если прослушать дельта-сигнал, он звучит как широкополосный набор искажений, т.е. в нем явно слышна разница психоакустических моделей MP3 и LQT.

Сравнив по той же схеме MP3 с форматом OGG, ничего нового не получили (разница, конечно, меньше, но она все же значительная):

Аналогичные результаты получаются и для пары LQT и OGG.

Результаты исследования дельта сигналов говорят о том, что психоакустические модели трех рассмотренных форматов очень сильно отличаются друг от друга и их бессмысленно сравнивать между собой по разнице АЧХ.

Заключение

Что ж, попытаемся сделать некоторые окончательные выводы, представив их в виде практических рекомендаций:

  1. LAME — лучший представитель кодеров формата MP3, выдает практически максимум того, что можно получить из MP3. Для всех очень громких и "плотных" записей я бы рекомендовал использовать LAME на 320.
  2. OGG — некоторая структурная модификация формата MP3 с новой психоакустической моделью, математическая обработка и практическая реализация которой в корне отличается от MP3. Для малоценных и низкокачественных записей пойдет OGG в режиме 192 кбит/с (либо LQT в режиме 128 Transparent, в среднем получается 160-180 кбит/с).
  3. В отличие от MP3 и OGG, которые являются представителями кодеров формата MPEG-1, формат LQT базируется на спецификации MPEG-2 AAC. Формат AAC передает значительно лучшее качество на более низких битрейтах за счет принципиально другой обработки звука. Для записей средней ценности рекомендую LQT (на максимуме), либо на выбор (разница между ними невелика): OGG в режиме 256 кбит/с, LAME на 256. VBR режим кодера LAME лучше не использовать, он заметно хуже.
  4. Для очень качественных записей, на которых даже при кодировании в 320 кбит/с ясно слышно отсутствие чего-либо значительного в звучании семпла, попробовать закодировать семпл кодером Ogg Vorbis на 350 кбит/с.
  5. Если сжатый с потерями звук Вас всё-таки не устроит, придется покупать понравившиеся композиции на CD-DA диске.

Возможно, какая-то часть статьи Вас заинтересовала в большей степени. Пишите мне — буду очень рад отзывам.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: