Перейти к основному содержимому

Психоакустика

Алгоритмы сжатия звука, такие как MP3, AAC, Ogg Vorbis и другие, широко используются в мультимедийных приложениях благодаря своей способности существенно уменьшать объем данных без значительного ухудшения качества. Основу этих алгоритмов составляют принципы психоакустики, позволяющие удалять неслышимые компоненты звукового сигнала, тем самым снижая битрейт.

1. Маскирование

Маскирование — это процесс, при котором один звук подавляет восприятие другого звука. Это ключевой механизм, используемый в психоакустике для понимания того, как человеческое ухо обрабатывает звуковые сигналы. Существует два основных вида маскирования: временное и частотное.

Временное маскирование

::: info Определение: Временное маскирование — это феномен, при котором сильный звук подавляет восприятие слабого звука, следующего непосредственно перед ним или после него.

:::

Характеристики временного маскирования
  1. Предмаскирование:
    • Происходит, когда сильный звук подавляет восприятие слабого звука, который следует за ним через короткий промежуток времени (обычно менее 50 мс).
    • Эффект уменьшается с увеличением временного интервала между звуками.
  2. Постмаскирование:
    • Происходит, когда сильный звук подавляет восприятие слабого звука, который предшествует ему через короткий промежуток времени (обычно менее 150 мс).
    • Эффект уменьшается с увеличением временного интервала между звуками.
Типичные значения временного маскирования
Тип маскированияМаксимальный временной интервал (мс)
Предмаскирование50
Постмаскирование150

Частотное маскирование

::: info Определение: Частотное маскирование — это феномен, при котором сильный звук на одной частоте подавляет восприятие слабого звука на другой частоте, находящейся вблизи первой.

:::

Характеристики частотного маскирования
  1. Узкополосное маскирование:
    • Происходит, когда сильный узкополосный шум подавляет восприятие узкополосных тонов на тех же частотах.
  2. Широкополосное маскирование:
    • Происходит, когда сильный широкополосный шум подавляет восприятие широкого спектра частот.
  3. Критические полосы слуха:
    • Частоты, находящиеся внутри одной критической полосы слуха, маскируют друг друга сильнее, чем частоты вне этой полосы.
Типичные значения частотного маскирования
Тип маскированияШирина критической полосы (Гц)
Низкие частоты (<500 Гц)100–200
Средние частоты (500–2000 Гц)200–700
Высокие частоты (>2000 Гц)700–3000

Применение в психоакустике

  1. Алгоритмы сжатия звука:
    • MP3, AAC и другие алгоритмы сжатия используют маскирование для удаления неслышимых компонентов звукового сигнала, что позволяет значительно уменьшить размер файла без заметной потери качества.
  2. Цифровая обработка звука:
    • Эквалайзеры, компрессоры и лимитеры учитывают эффекты маскирования для улучшения звучания.
  3. Разработка наушников и акустических систем:
    • Оптимизация частотной характеристики под критические полосы слуха и учет временной задержки и фазовых искажений.

2. Критические полосы слуха

Критические полосы слуха представляют собой частотные диапазоны, внутри которых звуки воспринимаются как единое целое. Давайте разберем эту концепцию более подробно.

::: info Критическая полоса слуха — это интервал частот, в пределах которого звуки воспринимаются как единый тон, даже если они состоят из нескольких гармонических составляющих. Внутри этой полосы слуховая система объединяет все составляющие в одну общую оценку громкости и высоты звука.

:::

Характеристики критических полос

  1. Ширина критических полос:
    • Ширина критических полос увеличивается с увеличением частоты.
    • На низких частотах ширина критической полосы составляет около 100 Гц.
    • На средних и высоких частотах она достигает 3000 Гц и выше.
  2. Зависимость ширины от частоты:
    • Ниже 500 Гц критические полосы довольно узкие.
    • Выше 500 Гц их ширина быстро растет.
  3. Число критических полос:
    • Всего существует около 25 критических полос, покрывающих весь диапазон слышимых частот (от 20 Гц до 20 кГц).

Таблица критических полос

Ниже представлена таблица, показывающая зависимость ширины критической полосы от центральной частоты:

Центральная частота (Гц)Ширина критической полосы (Гц)
10030
20060
500110
1000230
2000460
4000920
60001380
80001840
  1. Маскирование:
    • Если два звука попадают в одну и ту же критическую полосу, то более сильный звук может маскировать более слабый.
    • Это особенно важно при разработке алгоритмов сжатия звука, так как позволяет удалить неслышимые компоненты.
  2. Разделение спектра:
    • При анализе звукового сигнала его спектр часто разбивается на критические полосы.
    • Это позволяет более точно оценить восприятие звука и применить соответствующие методы обработки.
  3. Эквалайзеры и фильтры:
    • Знание критических полос помогает разрабатывать эквалайзеры и фильтры, которые корректируют звук таким образом, чтобы он лучше соответствовал восприятию человека.

Формула для расчета ширины критической полосы

Существует эмпирическая формула, предложенная Гласбергом и Муром, которая позволяет приблизительно рассчитать ширину критической полосы:

где f — центральная частота в килогерцах (kHz), Delta f — ширина критической полосы в герцах (Hz).

3. Порог слышимости

Порог слышимости — это минимальная интенсивность звука, которую человек может воспринять на определенной частоте. Этот показатель имеет важное значение в психоакустике, поскольку он определяет границы слышимого диапазона и влияет на разработку аудиосистем, алгоритмов сжатия звука и других мультимедийных технологий.

::: info Порог слышимости — это уровень звукового давления (SPL), при котором звук начинает быть ощутимым для среднего человека. Этот порог меняется в зависимости от частоты звука.

:::

Характеристики порога слышимости

  1. Минимальный порог:
    • Самый низкий порог слышимости находится в диапазоне частот от 1 кГц до 6 кГц, где он составляет около 0 дБ SPL.
  2. Изменение с частотой:
    • На низких и высоких частотах порог слышимости повышается, достигая значений около 80 дБ SPL на частоте 20 Гц и 16 кГц.
  3. Индивидуальные различия:
    • Порог слышимости может варьироваться у разных людей в зависимости от возраста, состояния здоровья и индивидуальных особенностей слуха.

Таблица порога слышимости

Ниже приведена таблица, показывающая изменение порога слышимости в зависимости от частоты:

Частота (Гц)Порог слышимости (дБ SPL)
2080
5055
10035
50015
10000
20005
400012
800018
1600045

Кривая равной громкости

Для описания зависимости порога слышимости от частоты используется концепция кривых равной громкости, также известных как изофоны. Эти кривые показывают, какой уровень звукового давления необходим для создания ощущения одинаковой громкости на разных частотах.

Применение в психоакустике

  1. Сжатие звука:
    • Алгоритмы сжатия звука, такие как MP3 и AAC, используют знания о пороге слышимости для удаления неслышимых компонентов звукового сигнала.
  2. Аудиометрия:
    • Измерения порога слышимости используются в медицинских исследованиях для диагностики нарушений слуха.
  3. Проектирование аудиосистем:
    • Знание порога слышимости помогает инженерам оптимизировать акустические системы для наилучшего восприятия звука.

Формулы для расчета порога слышимости

Существуют различные математические модели, описывающие зависимость порога слышимости от частоты. Одна из наиболее распространенных формул была предложена Ринне и основана на концепции эквивалентного уровня шума (Leq):

где Leq — эквивалентный уровень шума, P — звуковое давление, P0 — эталонное звуковое давление, которое обычно принимается равным

4. Временное разрешение слуха

Временное разрешение слуха относится к способности слуховой системы различать временные интервалы между звуковыми событиями. Это важный аспект психоакустики, который влияет на восприятие музыки, речи и других звуковых сигналов.

::: info Временное разрешение слуха — это минимальное временное расстояние между двумя звуковыми событиями, при котором они воспринимаются как отдельные события, а не как одно непрерывное событие.

:::

  1. Минимальное временное разрешение:
    • Человеческое ухо способно различать временные интервалы порядка 10–20 миллисекунд (мс).
  2. Зависимость от типа звука:
    • Временное разрешение может изменяться в зависимости от характера звукового сигнала. Например, для импульсных звуков оно может быть меньше, чем для тональных.
  3. Эффект маскирования:
    • Временное маскирование (пред- и пост-маскирование) также влияет на временное разрешение. Сильные звуки могут маскировать слабые звуки, следующие непосредственно перед ними или после них.

Типичные значения временного разрешения

Тип звукаМинимальное временное разрешение (мс)
Импульсы5–10
Тоновые сигналы10–20
  1. Цифровое аудио:
    • При дискретизации аналогового сигнала в цифровой формат важно учитывать временное разрешение слуха. Частота дискретизации должна быть достаточно высокой, чтобы сохранить временные детали звука.
  2. Акустические системы:
    • Временное разрешение слуха влияет на проектирование динамиков и усилителей. Важно минимизировать временные искажения, чтобы обеспечить точное воспроизведение звука.
  3. Речь и музыка:
    • Временное разрешение слуха играет важную роль в распознавании речи и восприятии музыкальных ритмов. Даже небольшие временные сдвиги могут повлиять на понимание и эмоциональное воздействие звука.

Методы измерения временного разрешения

  1. Метод минимального временного интервала:
    • Испытуемый прослушивает две последовательности звуков и должен определить, какая из них содержит меньший временной интервал между звуками.
  2. Метод маскирования:
    • Исследуется влияние временного маскирования на восприятие звуков. Испытуемого просят определить наличие слабого звука в присутствии сильного звука, расположенного перед ним или после него.

Вложения