G711 G722
Кодеки G.711 и G.722
Эти кодеки называют "телефонными" -- они используются в телефонной связи и не претендуют на качество звука для передачи музыки. Их основная задача -- разборчивая передача речи.
Общие сведения:
G.711 – стандарт ITU-T, представляющий собой алгоритм кодирования речевого сигнала, разработанный в 1972 году. Он обеспечивает преобразование аналогового аудиосигнала в цифровой формат с частотой дискретизации 8 кГц и разрядностью 16 бит. Стандарт поддерживает два метода компандирования: A-law (европейский стандарт) и μ-law (американский стандарт). Эти методы позволяют уменьшить динамический диапазон сигнала без значительного ухудшения качества звука.
G.722 – также стандарт ITU-T, но он был принят позже, в 1988 году. Этот кодек работает с широкополосным аудио (7 кГц), обеспечивая более высокое качество звука за счет увеличенной частоты дискретизации до 16 кГц при той же разрядности 16 бит. В отличие от G.711, который использует импульсно-кодовую модуляцию (PCM), G.722 основан на адаптивной дифференциальной импульсно-кодовой модуляции (ADPCM).
Основные параметры:
G.711:
- Частота дискретизации: 8 кГц
- Разрядность: 16 бит
- Битрейт: 64 Кбит/с (для каждого канала)
- Алгоритмы компрессии: A-law и μ-law
- Поддержка монофонического аудио
G.722:
- Частота дискретизации: 16 кГц
- Разрядность: 14 бит
- Битрейт: 48–64 Кбит/с (в зависимости от настроек)
- Алгоритм компрессии: ADPCM
- Поддержка стереофонического аудио
Лицензионная информация:
Оба стандарта (G.711 и G.722) являются открытыми спецификациями, доступными для использования без лицензионных отчислений. Однако некоторые реализации этих стандартов могут включать проприетарные компоненты, требующие лицензий.
Применение:
G.711: Широко используется в телефонных сетях, системах VoIP, а также в мультимедийных приложениях, где требуется высокая надежность передачи голоса с минимальной задержкой. Из-за низкой сложности алгоритма и малого объема вычислений этот кодек подходит для устройств с ограниченными ресурсами.
G.722: Применяется там, где необходимо обеспечить более высокое качество звука, например, в конференц-связи, IP-телефонии высокого класса, радиовещании и мультимедиа, требующих широкополосного аудио.
Сравнение с другими кодеками:
- G.729: Более современный кодек, обеспечивающий высокую степень сжатия (до 8 Кбит/с), однако требует значительно больше вычислительной мощности. Подходит для приложений с ограниченным каналом связи.
- Opus: Современный открытый кодек, поддерживающий широкий спектр частот и битрейтов. Он превосходит G.711 и G.722 по качеству звука при аналогичных битрейтах, особенно в условиях потерь пакетов.
Совместимость с ПО:
Оба кодека широко поддерживаются различными программными платформами и библиотеками, такими как:
Это позволяет легко интегрировать их в существующие системы и приложения.
Принцип работы:
G.711:
Использует метод компандирования (логарифмическое сжатие амплитуды сигнала):
- A-law: Используется в Европе и странах СНГ. Коэффициент компрессии составляет примерно 87,6 дБ.
- μ-law: Применяется в Северной Америке и Японии. Коэффициент компрессии около 85,3 дБ.
Принцип заключается в том, что сигнал разбивается на сегменты, каждый из которых сжимается логарифмически. Это уменьшает динамический диапазон сигнала, делая его менее чувствительным к шумам.
G.722:
Основан на ADPCM, который включает следующие этапы:
- Преобразование входного сигнала в разностную форму.
- Квантование разностей с использованием предсказателя и квантизатора.
- Передача квантов на приемную сторону.
- Декодирование и восстановление исходного сигнала.
Этот подход позволяет достичь высокой степени сжатия при сохранении хорошего качества звука.
Примеры использования:
FFmpeg:
ffmpeg -i input.wav -acodec g722 output.g722