Перейти к основному содержимому

WAV

WAV (Waveform Audio File Format) – аудиоконтейнерный формат, разработанный Microsoft и IBM в начале 1990-х годов для хранения несжатого линейного PCM-аудио (Pulse Code Modulation). Этот формат широко используется благодаря своей простоте и поддержке большинства операционных систем и мультимедийных приложений.

Основные характеристики:

  • Тип содержимого: Аудиофайлы.
  • Контейнер: WAV может содержать аудио без сжатия (PCM), а также сжатые форматы, такие как ADPCM, GSM, MP3 и другие.
  • Битрейт: Обычно варьируется от 8 до 32 бит на выборку.
  • Частота дискретизации: От 8000 Гц до 192000 Гц (в зависимости от требований к качеству).
  • Каналы: Поддерживает моно-, стерео- и многоканальные записи.
  • Совместимые кодеки: WAV поддерживает широкий спектр кодеков, включая:
    • PCM** (без сжатия)**
    • ADPCM (Adaptive Differential Pulse Code Modulation)
    • GSM (Global System for Mobile Communications)
    • MP3** (MPEG-1 Layer III)**
    • FLAC** (Free Lossless Audio Codec)**

Применение:

  • Профессиональная звукозапись: Из-за отсутствия потерь при хранении WAV часто используется в студийной работе и при мастеринге аудио.
  • Редактирование звука: Многие программы для редактирования звука поддерживают WAV, так как он позволяет работать с чистым сигналом без необходимости декодирования.
  • Обмен данными между приложениями: WAV легко интегрируется в различные приложения и системы, обеспечивая универсальность и совместимость.

Сравнение с другими контейнерами:

  • AIFF (Audio Interchange File Format): AIFF аналогичен WAV, но был создан Apple для MacOS. Оба формата могут хранить несжатый PCM-аудио, однако AIFF имеет несколько отличий в заголовке файла.
  • FLAC** (Free Lossless Audio Codec)**: FLAC обеспечивает потерю качества, сохраняя меньший размер файла за счет сжатия данных без потерь. В отличие от WAV, который всегда содержит несжатый аудиопоток.
  • MP3** (MPEG-1 Layer III)**: MP3 использует сильное сжатие с потерями, что делает файлы значительно меньше по размеру, чем WAV, но приводит к ухудшению качества звука.

Ограничения:

  • Размер файлов: Несжатый PCM-звук занимает значительное количество места на диске. Например, одна минута стереозвука с частотой дискретизации 44.1 кГц и разрядностью 16 бит будет занимать около 10 МБ.
  • Поддержка кодеков: Хотя WAV теоретически может поддерживать множество различных кодеков, на практике многие программы ограничены поддержкой только PCM и некоторых других распространенных кодеков.

Уникальные особенности:

  • Простота структуры: Формат WAV очень прост, что облегчает его обработку различными программами и устройствами.
  • Отсутствие потерь: Отсутствие сжатия означает отсутствие искажений и потерь качества звука, что особенно важно для профессионального использования.

Примеры кодирования:

Кодирование через FFmpeg:

ffmpeg -i input.mp3 -acodec pcm_s16le -ar 44100 output.wav

Этот пример конвертирует MP3-файл (input.mp3) в WAV с частотой дискретизации 44.1 кГц и 16-битным разрешением (PCM).

Кодирование через GStreamer:

gst-launch-1.0 filesrc location=input.mp3 ! decodebin ! audioconvert ! wavenc ! filesink location=output.wav

Здесь filesrc считывает входной файл, decodebin декодирует его, audioconvert преобразует аудио в нужный формат, wavenc упаковывает данные в WAV-контейнер, а filesink сохраняет результат в выходной файл.