//
запись...

Все статьи

Что такое RMS


vol_470x210

Если у вас приличный опыт звукорежиссуры и с аудиоредакторами вы на «ты», скорее всего, эта небольшая статья ничего нового для вас не откроет. В ней речь пойдет о технических характеристиках звука, таких как пиковая амплитуда и различные виды RMS.

Впрочем, иногда бывает весьма полезно уложить в голове уже знакомую информацию словами другого человека.

Пиковая амплитуда

Главный абсолютный показатель громкости в звуковой дорожке – это пики. Открывая файл в любом редакторе, вы видите прорисовку волны, которая в громких местах подскакивает вверх. Эти «подскоки» как раз и называются пиками, или пиковой амплитудой (Peak Amplitude).


Нужно помнить, что звук – не математическая, а физическая величина, значение его громкости не может быть отрицательным. Соответственно, горизонтальная линия, изображающая ось Х, не означает, что волна ниже нее имеет отрицательную громкость. Самый тихий звук находится не в самой нижней точке рабочего окна, а на уровне оси Х. Любые отклонения вверх или вниз – некоторая неотрицательная громкость. Всплеск вниз будет таким же заметным, как и всплеск вверх на ту же амплитуду.

Пики в звуковой волне

Условно принято, что в цифровой среде максимальная громкость не может быть выше 0 дБ, а отсчеты громкости ведутся от максимума вниз: -2 дБ громче, чем -4 дБ.

Но не путайте значение 0 дБ с осью Х, которую скорее можно назвать «минус бесконечностью». 0 дБ – это ограничительные линии, которые можно найти в аудиоредакторе с двух сторон от волны – сверху и снизу (см. рисунок). Выход за пределы этого уровня приведет к клипам, то есть к искажениям сигнала. Клипы можно получить двумя способами – ошибками во время записи (слишком сильно разогнанная чувствительность микрофона или инструмента) или ошибками при обработке уже записанных фрагментов.

Обычные методы увеличения громкости на первых порах приобщения к сфере звукорежиссуры – это повышение чувствительности (Gain) или нормализация (Normalize). Эти два приема – по сути одно и то же, только первый позволяет изменить громкость на заданное значение, а во второй – привести к заданному уровню.

Например, если в треке максимальный пик находится на -3 дБ, то можно увеличить чувствительность всей дорожки на 3 дБ или нормализовать до 0 дБ, в обоих случаях произойдет одно и то же – звук станет громче на 3 дБ, а пик окажется на значении 0.

Но и здесь нужно быть внимательным. Если пиковое значение исходного сигнала -3 дБ, а вы пытаетесь увеличить чувствительность на 4 дБ, то в результате громкость пика превысит 0 дБ и приведет к клипу. Нет, значения +1 дБ на графике не появится, вы просто увидите обрезанную верхушку волны ровно по уровню 0 дБ, а при воспроизведении услышите треск. Более гуманным способом повышения громкости является нормализация до 0 дБ, которая автоматически вычислит максимальный уровень и предотвратит клипы.

Появление клипов в аудио

Зачем же тогда нужна функция изменения чувствительности? Во-первых, с ее помощью можно не только увеличить громкость, но и уменьшить. А во-вторых – опытный звукорежиссер использует манипуляции с чувствительностью для выравнивания громкости звучания дорожки в ручном режиме, учитывая необходимый запас в децибелах для будущей обработки (хедрум).

К примеру, бывает, что бочка, бас-гитара или голос записаны динамически неровно, а использовать компрессор нецелесообразно. Тогда проваливающиеся участки можно аккуратно поднять, а слишком громкие – слегка убавить. Такая процедура наносит звуку намного меньше вреда, чем топтание дорожки компрессией, но она требует опыта.

Однако наведение порядка с пиковыми значениями через нормализацию или гейн практически никогда не дает ощутимого эффекта по увеличению громкости песни. Чтобы заставить композицию звучать громче, необходимы более глубокие вмешательства, связанные с уменьшением ее динамического диапазона.

RMS и его разновидности

Для условной градации песен по громкости и анализа динамического диапазона звукорежиссеры используют характеристику RMS в различных видах.

RMS – параметр, показывающий среднюю громкость звучания трека или какой-либо его части. С математической точки зрения RMS (Root Mean Square) – это среднеквадратическое значение громкостей всех семплов дорожки.

Один семпл звука в цифровой среде

По сути, звуковой файл – это многократное чередование амплитудных пиков и провалов волны. Даже в очень громкой музыке невозможна ситуация, когда волна непрерывно находится на максимуме своей амплитуды, ей обязательно надо проходить через центральную ось, ведь звук – это колебания.

В любой записи есть определенное количество громких и тихих участков, а также участки с промежуточными значениями громкости. Минимальный дискретный участок звукового файла – это семпл. Каждый семпл в звуковой дорожке имеет свою амплитуду, то есть воспроизводится на определенной громкости.

При работе на частоте дискретизации 44,1 кГц в 1 секунде записи содержится 44100 семплов. Если композиция длится 1 минуту, то всего в ней 2,646 млн. семплов. Чтобы вычислить RMS, нужно громкость (амплитуду) каждого семпла возвести в квадрат, суммировать все получившиеся значения, потом это число разделить на количество семплов, и из результата вычислить квадратный корень. Как будто бы сложно, но на деле все элементарно:

Формула расчета RMS звука

Где a – это каждый отдельный семпл,  n – количество семплов.

Среднеквадратическое – это почти то же самое, что знакомое всем из школы среднее арифметическое, только каждое слагаемое возводится в квадрат, а из общего результата дроби вычисляется квадратный корень.

Разные аудиоредакторы немного по-разному подходят к анализу RMS, но в целом концепция схожая. Очень удобен для этих целей Adobe Audition. При сборе статистических данных по файлу программа учитывает следующие показатели:

Total и Average RMS в Adobe Audition

  • Minimum Sample Value (минимальное значение семпла) – самая нижняя точка графика. Не путайте с самым тихим значением, наоборот – это громкая амплитуда в отрицательном от оси Х направлении.
  • Maximum Sample Value (максимальное значение семпла) – самая верхняя точка графика.
  • Peak Amplitude (пиковая амплитуда) – значение самого громкого пика во всем треке в децибелах.
  • Possibly Clipped Samples (семплы с возможными клипами) – показывает семпл с подозрением на появление клипа.
  • DC Offset (Direct current offset) – «смещение по постоянному току». Отображается, если в графике (а соответственно и в самом звуке) присутствует общее смещение по амплитуде. Офсет возникает в результате некачественной записи, когда в звук добавляются некоторые постоянные значения. На слух DC Offset чаще всего незаметен, но при обработке может привести к определенным проблемам, в том числе и к ограничению по громкости звука.
  • Total RMS (общий RMS) – среднеквадратическое значение громкости по всему треку.
  • Average RMS (средний RMS) – среднеквадратическое значение громкости по всему треку с учетом особенностей восприятия звука человеком.
  • Maximum RMS (максимальный RMS) – участок записи с наибольшей громкостью.
  • Minimum RMS (минимальный RMS) – участок записи с наименьшей громкостью.
  • Actual Bit Depth (актуальная разрядность) – показывает действительную разрядность (битность) сигнала.

Нажав в каждом случае на кнопку со стрелочкой, можно переместиться к тому участку файла, который учитывается в данной графе статистики, причем эта функция доступна для каждого канала в отдельности.

Важно понять, что максимальный RMS – это не то же самое, что пиковое значение. Пик – это обычно один семпл с наибольшей амплитудой, а максимальный RMS – это участок, где плотность громких всплесков наибольшая. В зависимости от продолжительности анализируемых участков, эти области могут даже и не совпадать. По умолчанию  Adobe Audition берет за основу расчета участки в 50 миллисекунд.

Нужно также внести уточнение по Total и Average RMS. Не все аудиоредакторы показывают оба эти параметра, кроме того, некоторые программы обозначают «средним» то, что Adobe Audition называет «общим». Если нужно разобраться в этом глубже следует обращаться к инструкциям конкретного приложения, но на практике их значения чаще всего довольно близки.

Также нужно учитывать, что при расчете общего и среднего RMS программа будет учитывать тишину в начале и в конце файла. Чтобы полученные данные были ближе к реальности, лишние секунды имеет смысл удалять или оставлять за пределами выделенной для анализа области.

В ближайшее время в моем блоге будут опубликованы две больших статьи, затрагивающих вопросы громкостей, мастеринга и динамической обработки сигнала. Некоторые материалы из этих статей уже доступны читателям моей книги «Академия Мюзикмейкера», но будет и значительная часть новой информации.

Если вам интересно, как добиться от своей записи плотного звучания и громкости, сопоставимой с фирменными записями, следите за обновлениями. Чтобы не пропустить статьи, можно подписаться на блог, и тогда они будут отправлены вам прямо на электронный адрес.

Ну и конечно, любые дополнения и уточнения всегда приветствуются. А если у вас возникли какие-либо вопросы – задавайте их в комментариях, по возможности постараюсь на них ответить максимально подробно.


© Алексей Данилов
Иллюстрации: А. Рублевский
При перепечатывании ссылка на источник обязательна

Интересное: