Перейти к основному содержимому

G711 G722

Кодеки G.711 и G.722

Эти кодеки называют "телефонными" -- они используются в телефонной связи и не претендуют на качество звука для передачи музыки. Их основная задача -- разборчивая передача речи.

Общие сведения:

G.711 – стандарт ITU-T, представляющий собой алгоритм кодирования речевого сигнала, разработанный в 1972 году. Он обеспечивает преобразование аналогового аудиосигнала в цифровой формат с частотой дискретизации 8 кГц и разрядностью 16 бит. Стандарт поддерживает два метода компандирования: A-law (европейский стандарт) и μ-law (американский стандарт). Эти методы позволяют уменьшить динамический диапазон сигнала без значительного ухудшения качества звука.

G.722 – также стандарт ITU-T, но он был принят позже, в 1988 году. Этот кодек работает с широкополосным аудио (7 кГц), обеспечивая более высокое качество звука за счет увеличенной частоты дискретизации до 16 кГц при той же разрядности 16 бит. В отличие от G.711, который использует импульсно-кодовую модуляцию (PCM), G.722 основан на адаптивной дифференциальной импульсно-кодовой модуляции (ADPCM).

Основные параметры:

G.711:
  • Частота дискретизации: 8 кГц
  • Разрядность: 16 бит
  • Битрейт: 64 Кбит/с (для каждого канала)
  • Алгоритмы компрессии: A-law и μ-law
  • Поддержка монофонического аудио
G.722:
  • Частота дискретизации: 16 кГц
  • Разрядность: 14 бит
  • Битрейт: 48–64 Кбит/с (в зависимости от настроек)
  • Алгоритм компрессии: ADPCM
  • Поддержка стереофонического аудио

Лицензионная информация:

Оба стандарта (G.711 и G.722) являются открытыми спецификациями, доступными для использования без лицензионных отчислений. Однако некоторые реализации этих стандартов могут включать проприетарные компоненты, требующие лицензий.

Применение:

G.711: Широко используется в телефонных сетях, системах VoIP, а также в мультимедийных приложениях, где требуется высокая надежность передачи голоса с минимальной задержкой. Из-за низкой сложности алгоритма и малого объема вычислений этот кодек подходит для устройств с ограниченными ресурсами.

G.722: Применяется там, где необходимо обеспечить более высокое качество звука, например, в конференц-связи, IP-телефонии высокого класса, радиовещании и мультимедиа, требующих широкополосного аудио.

Сравнение с другими кодеками:

  • G.729: Более современный кодек, обеспечивающий высокую степень сжатия (до 8 Кбит/с), однако требует значительно больше вычислительной мощности. Подходит для приложений с ограниченным каналом связи.
  • Opus: Современный открытый кодек, поддерживающий широкий спектр частот и битрейтов. Он превосходит G.711 и G.722 по качеству звука при аналогичных битрейтах, особенно в условиях потерь пакетов.

Совместимость с ПО:

Оба кодека широко поддерживаются различными программными платформами и библиотеками, такими как:

Это позволяет легко интегрировать их в существующие системы и приложения.

Принцип работы:

G.711:

Использует метод компандирования (логарифмическое сжатие амплитуды сигнала):

  • A-law: Используется в Европе и странах СНГ. Коэффициент компрессии составляет примерно 87,6 дБ.
  • μ-law: Применяется в Северной Америке и Японии. Коэффициент компрессии около 85,3 дБ.

Принцип заключается в том, что сигнал разбивается на сегменты, каждый из которых сжимается логарифмически. Это уменьшает динамический диапазон сигнала, делая его менее чувствительным к шумам.

G.722:

Основан на ADPCM, который включает следующие этапы:

  1. Преобразование входного сигнала в разностную форму.
  2. Квантование разностей с использованием предсказателя и квантизатора.
  3. Передача квантов на приемную сторону.
  4. Декодирование и восстановление исходного сигнала.

Этот подход позволяет достичь высокой степени сжатия при сохранении хорошего качества звука.

Примеры использования:

FFmpeg:
ffmpeg -i input.wav -acodec g722 output.g722

Вложения