Война форматов. DSD против всех или все против него ?

Довольно часто начинающие музыканты и звукорежиссеры сталкиваются с необходимостью обработки звуковых файлов или записанных вживую инструментальных и вокальных партий в представлении в виде записи формата PCM. По поводу того, что это такое, у многих несведущих пользователей существует масса заблуждений, поскольку они считают такой тип аудио исключительно расширением файла. На самом деле это понятие является общим для нескольких типов аудио. В большинстве своем звуковые файлы в нынешнем своем компьютерном представлении за редким исключением как раз и относятся к формату PCM. Но для того, чтобы в дальнейшем не возникало путаницы, давайте рассмотрим его предназначение, понимание и редактирование.

Что такое формат PCM?

Для понимания самого термина необходимо просто расшифровать сокращение. Оно образовано от английского Pulse Code Modulation, что переводится как «импульсно-кодовая модуляция». Такая технология ранее применялась исключительно для оцифровки аналогового аудио, но сейчас используется повсеместно и для кодирования звука, и для записи в студиях, и в кинопроизводстве, и т. д. Формат аудио PCM является некой обобщенной группой звуковых объектов, для записи или сохранения которых применяются схожие технологии обработки. Сюда можно отнести файлы WAV, MP3, BWF, AMB, RF64, AIFF и многие другие. Как правильно заметил кто-то из блогеров в интернете, сегодня проще сказать, что не относится к формату PCM, нежели бесконечно перечислять все цифровые стандарты PCM. Альтернативой можно назвать в основном аудио новых форматов, относящихся к стандарту DSD.

Разновидности по объему и качеству

Форматы аудио-файлов могут быть выделены в следующие группы:

1. Несжатые – такие как WAV, AIFF, AU или необработанные PCM без заголовков.

2. Форматы со сжатием без потерь – к примеру, FLAC, AudioMonkey’s (расширение файла .ape), WavPack (расширение файла .wv), TTA, ATRAC AdvancedLossless, ALAC (расширение имени файла .m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA без потерь) и Shorten (SHN).

3. Форматы с компрессией с потерями качества – например, Opus, MP3, Vorbis, Musepack, AAC, ATRAC и Windows Media Audio Lossy (сжатые WMA).

форматы аудио файлов

Чем открыть файлы для прослушивания?

По большому счету, если речь идет исключительно о компьютерной технике, открыть цифровое аудио в формате PCM можно любым удобным проигрывателем (либо встроенным в саму операционную систему, либо созданным сторонними разработчиками).

Плееры для проигрывания форматов PCM

Другое дело, что в этой обширной категории могут присутствовать файлы с разными расширениями, которые собственные средства системы могут и не поддерживать. В этой ситуации на помощь приходят либо плееры, либо редакторы аудио. Если же речь идет о бытовой технике, некоторые форматы без проблем можно воспроизвести на самых обычных DVD-плеерах.

Форматы, поддерживаемые проигрывателями Blu-ray

Однако наибольшее количество известных типов аудио, включая все форматы PCM, поддерживают проигрыватели Blue-ray. Но ведь иногда возникает необходимость редактирования звуковых файлов. Что делать в этом случае?

DSD в цифрах

Профессиональные аудио модуляторы имеют уровень шума в слышимом звуковом диапазоне для частот дискретизации:

  • DSD64 около -125 … -145 дБ (сравнимо с PCM 24 бит)
  • DSD128 около -165 дБ (лучше, чем PCM 24 бит)
  • DSD256 и выше около -170 … -200 дБ (сравнимо с PCM 32 бит)

Уровень шума в слышимом диапазоне почти не зависит от демодулятора. Но уровень шума должен быть максимально подавлен вне этой полосы. Так как ультразвуковой шум может привести к интермодуляционным искажениям.

Читайте о DSD vs DSF vs DFF >

Чем редактировать формат цифрового звука PCM?

Совершенно естественно, что с возрастанием возможностей современных компьютеров в плане обработки звука, появились и специальные программные продукты, позволяющие редактировать звуковые файлы практически любого известного типа.

Поддерживаемые типы файлов

Все известные на сегодня программы такого направления без труда работают с любыми объектами, поддерживающими технологию PCM, открывая их в виде самой обычной волны. В некоторых приложениях вроде Audition можно при открытии или сохранении в поле форматов выбирается категория PCM, после чего можно работать только с файлами определенных форматов.

Разработанные для определенной цели

.ACT — это сжатый аудиоформат ADPCM до 8 кбит/с. В нем происходит запись с большинства китайских MP3- и MP4-плееров и диктофонов.

.AU — стандартный формат аудиофайла, используемый Sun, Unix и Java. Аудио в файлах AU может быть в виде PCM или же сжатым с помощью кодеков μ-law, a-law или G729.

.AWB (AMR-WB) — аудио, используемое в основном для речи, аналогично спецификации ITU-T G.722.2.

.DCT – его использует программное обеспечение NCH. Это формат переменных кодеков, предназначенных для диктовки. Он имеет информацию заголовка диктовки и может быть зашифрован (как того требуют медицинские законы конфиденциальности). Можно также сказать, что это проприетарный формат программного обеспечения NCH.

.DSS — файлы Olympus DSS являются собственными форматами Olympus. Это довольно старый и плохой кодек. GSM или MP3, как правило, предпочтительнее, если их позволяет использовать рекордер. Это дает возможность хранить дополнительные данные в заголовке файла.

.DVF — это собственный формат Sony для сжатых голосовых файлов, обычно используемый диктофонами этой компании.

.GSM — разработанный для использования в телефонии в Европе. Это лучший аудио-формат для качественного звучания голоса по телефону. Хороший компромисс между размером и качеством файла. Также стоит отметить, что WAV-файлы иногда могут быть закодированы с помощью кодека GSM.

.MSV — собственный формат Sony для сжатых голосовых файлов Memory Stick.

формат аудио cd дисков

Как изменить формат файла в стандарт PCM в редакторах аудио?

Как уже понятно, если в редакторе аудио открыть звуковой файл неподдерживаемого операционной системой или каким-то устройством воспроизведения формат, можно применить для конвертирования (преобразования) формата самый простой метод.

Изменение формата в Adobe Audition

Он состоит в том, чтобы просто сохранить исходное аудио в другом нужном формате, выбрав из списка тот, с которым можно будет работать в дальнейшем.

Возможно ли, что расширение файла с ошибками?

Мы нашли следующие похожие расширения в нашей базе:
.pcm

RAW PCM Audio Data

.lcm

Lipikar Custom Map

.lpc

LPC-10 Encoded Audio

.lpm

WonderBit Life Photo Maker Data

.lcm

Label Designer Plus Document

Конвертирование форматов

Но ведь сами понимаете, когда у вас есть огромная коллекция файлов, включающая тысячи и десятки тысяч треков, да еще и в разных форматах, для преобразования в единый тип лучше использовать специализированные программы (конвертеры аудио), которые поддерживают пакетную обработку файлов.

Аудио конвертер в PCM-Wave

Но и в этом случае необходимо обратить внимание на один существенный аспект. А что если файлы записаны с разной громкостью, а вам нужно, так сказать, привести их к единому знаменателю? Изменять параметры уровня для каждого файла тоже будет достаточно проблематично! Здесь на помощь приходят конвертеры, позволяющие «подгонять» громкость всех файлов под какой-то один выбранный шаблон. В Итернете таких конвертеров полно. И большинство из них являются бесплатными. Но если вы хотите добиться максимального качества звука, придется поработать самостоятельно, поскольку может потребоваться изменить, скажем, битрейт, частоту дискретизации или глубину аудио. Работа – кропотливая, но результат, как говорится, стоит свеч.

Параметры DSD

Характеристики DSD

АббревиатураDirect Stream Digital
Метод кодирования аудио данныхсигма-дельта модуляция (читайте подробности и смотрите видео)
Битовая разрядность1 бит или выше (читайте подробности о качестве звука)
Частота дискретизацииDSD 64 (2.8 МГц), DSD 128 (5.6 МГц, double), DSD 256 (11.2 МГц, quad), etc. (читайте подробности)
Количество каналовСтерео и многоканальный
НосителиSACD оптический диск, включая hybrid SACD (с CD-аудио слоем), компьютерные файлы (читайте подробности)
Спецификация«Scarlet book» (1999)
ИспользованиеПроизводство музыки, домашнее hifi/hiend аудио

Direct Stream Digital является обним из аудиофильских форматов высокого разрешения (high resolution audio). Он был создан для улучшения динамического диапазона CD-аудио в слышимой частотной области звука.

Читайте далее о вопросах качества звука (шум, битовая глубина, полоса, частота дискретизации DSD audio по сравнению с PCM).

Нестандартные типы аудио

Наконец, посмотрим, что можно сделать с не РСМ-форматами или с файлами, как раз имеющими расширение .pcm. В принципе, для работы с такими объектами лучше всего применять все те же аудиоредакторы или конвертеры с расширенными возможностями. Кроме Adobe Audition можно предложить неплохие студии вроде Audacity, Sound Forge или даже некоторые секвенсоры или целые виртуальные звуковые студии, поддерживающие работу с такими объектами (например, Cubase, Sonar, Avid Pro Tools, Cockos Reaper и т. д.).

Экспорт файла в Cockos Reaper

А вообще, среди музыкантов и звукорежиссеров негласно принято считать, что оптимальным расширением для обработки цифрового звука на компьютерах является все же самый обычный стандарт WAV, хоть он многим и кажется несколько морально устаревшим. По умолчанию практически все студии и редакторы сохраняют материал именно в таком формате, правда, показатель глубины устанавливается на уровне 24 или 32 бита (в зависимости от типа самого программного продукта), частота дискретизации находится на уровне 48 или 96 кГц, а битрейт колеблется от 192 до 320 кбит/с. Такие завышенные показатели используются только для того, чтобы достичь наилучшего качества аудиоматериала после обработки.

Перегрузка и устойчивость

Когда разрабатывается сигма-дельта модулятор, инженеры обращают особое внимание на:

  • уровень шума в слышимом звуковом диапазоне и
  • устойчивость к перегрузке.

Для решения этих проблем разработчики могут варьировать:

  • битовой глубиной,
  • частотой дискретизации,
  • нойз-шейпингом.

Эти параметры должны рассматриваться в связи друг с другом.

Битовая глубина

Увеличение битового разрешения уменьшает шумы квантования (шумы ошибки квантования).

Нойз-шейпинг

Нойз-шейпинг «выталкивает» энергию ошибки квантования из слышимого диапазона.

Для «выталкивания» большего количества энергии нужно более крутой нойз-шейпинг.

Более крутой нойз-шейпинг увеличивает вероятность срыва стабильности работы сигма-дельта модулятора при перегрузке на входе. Когда модулятор в нестабильном состоянии, на его выходе отсутствует сигнал или генерируются колебания. После срыва стабильности модулятор должен быть принудительно перезапущен.

Устойчивость сигма-дельта модулятора к перегрузке

Частота дискретизации

Более высокая частота дискретизации уменьшает уровень спектра ошибки квантования. Потому, что энергия шума распределяется в более широкой полосе. Это позволяет использовать более пологий нойз-шейпинг.

Энергия — это площадь фигуры, заключенной между линеей спектра и горизонтальной осью в полосе 0 … [частота дискретизации]/2.

Частота дискретизации и уровень шума квантования

В правой и левой частях изображения площади фигур шума одинаковы. Но фигура, более растянутая по горизонтальной оси, дает более низкий уровень шума.

Увеличение частоты дискретизации позволяет снизить уровень шума в полосе слышимого звука. Это позволяет уменьшить крутизну нойз-шейпинга и увеличить устойчивость модулятора к перегрузке.

Resume

Мы можем видеть, что более низкий уровень шума и более высокая устойчивость модулятора к перегрузке на входе могут быть достигнуты разными путями.

Например, лучшее качество звука — это вопрос реализации нойз-шейпинга при имеющихся битовом разрешении и частоте дискретизации. Но, с другой стороны, возможно увеличить частоту дискретизации и/или количество бит для снижения ошибки квантования (уровня шума) без улучшения метода нойз-шейпинга.

ИНТЕРФЕЙС

Основной экран несет в себе всю необходимую информацию: состояние батареи, название и прогресс композиции, характеристики воспроизводимого потока и обложку альбома.

При нажатии на среднюю кнопку, плеер спрашивает что делать с текущим файлом. Тут варианта всего два: воспроизвести и удалить. Форматов плеер умеет играть невероятно много, включая реальный DSD256, то есть без конвертации в PCM, как у всяких понтовых плееров.

ЗВУК

Очень много вопросов о звуке Zishan DSD мне задавали в контексте сравнения с FiiO X5 первого поколения. Тут я хочу подчеркнуть, что из коробки звучание этих плееров весьма схоже: тот же в меру глубокий, однако быстрый и хлесткий бас, кристально прозрачная середина и яркие детальные верха.
Детализация средних частот и разделение сценических планов заставляют пожать виртуальную руку разработчикам данного чуда. Подача немного агрессивная и весьма эмоциональная.

В одном из комментариев к распаковке устройства мне намекнули на наличие «кроватки» на плате Zishan DSD. Под «кроваткой» понимается возможность легкой замены усилителя, без использования паяльника и каких либо технических знаний. Вот тут то меня и ожидал сюрприз!

Покопавшись в столе, я обнаружил известный своей музыкальностью усилитель LM6172

и тут же приступил к его установке. Для того чтобы разобрать устройство надо сначала открутить винтик на ручке громкости, а затем 4 остальных винта. В общем, процесс смены усилителя хотя и требует полной разборки устройства, но на деле это занимает минут пять, если считать и обратную сборку.

Итак, усилитель на ФНЧ был установлен, а комплектный LME49720

был убран в стол. Тут же стоит заметить, что по своей «музыкальности»
LME49720
ничем особенным не отличается и с существенным отрывом проигрывает
LM6172
.

РАСПАКОВКА И КОМПЛЕКТАЦИЯ

Пришел плеер без какой либо упаковки, просто замотанным в «пупырку». Беглый взгляд на комплектацию вообще располагает разве что наполнить им ближайшее мусорное ведро.

Рейтинг
( 2 оценки, среднее 4.5 из 5 )
Понравилась статья? Поделиться с друзьями: