Сам факт, что качество звучания записанной музыки можно оценивать как-то иначе, чем по принципу «нравится — не нравится», порой вызывает у аудиофилов недоумение. Многие считают, что это не более чем дело вкуса и здесь не может быть никаких объективных критериев, параметров и характеристик. Вот колонки, усилители и т. п. — дело другое, там можно замерить герцы и децибелы, а как измерить качество звука, да еще записанного? Тем не менее профессионалы выработали методы оценки качества фонограмм. О них и пойдет речь в этой статье. (От редакции) Несомненно, что, когда мы выносим суждения о звучании аппаратуры при воспроизведении тех или иных записей и произносим слова «тональный баланс», «детализация», «пространственная локализация» и др., всем нам — и аудиофилам, и экспертам — очень полезно знать, какой смысл вкладывают в эти понятия профессионалы, которые создавали прослушиваемые записи. И выходит, что субъективные впечатления от звучания музыкальных фонограмм — не такие уж субъективные.

Необходимость такой оценки возникла с развитием радиовещания и звукозаписи, когда специалисты отрасли пришли к выводу, что только технической оценки записи на предмет наличия или отсутствия искажений и помех недостаточно. Ведь бывает, что шумов, искажений, модуляций в фонограмме нет, и в этом смысле придраться не к чему, но она не нравится по чисто звуковым и музыкальным соображениям. Поэтому после прохождения ОТК записи стали прослушиваться на особом экспертном совете, причем специалисты обращали внимание не на сугубо музыкальные, а прежде всего на художественно-звуковые аспекты.

 

Анатолий Иванович Вейценфельд — основатель журнала «Звукорежиссер», главный редактор интернет-портала ProSound.iXBT.com, член Ассоциации джазовых журналистов Москвы, американской Ассоциации джазовых журналистов JJA, международной Ассоциации музыкальной прессы MIPA. В 1960-е при Государственном доме радиовещания и звукозаписи по инициативе главного технолога ГДРЗ легендарного Бориса Меерзона была сформирована экспертная группа квалифицированных и прошедших специальную подготовку людей из числа звукорежиссеров, музыкантов, инженеров звукозаписи, акустиков, работников отдела технического контроля. Группа подвергалась жесткой тренировке на одинаковое восприятие различных звуковых явлений. Как писал Борис Яковлевич, «опыт показал, что специалисты по звукозаписи, обладающие хорошим слухом и большим опытом работы, после нескольких совместных прослушиваний и обсуждений качества звучания записанных музыкальных произведений приобретают умение оценить записи так, что их субъективные мнения практически совпадают. Таким образом, усредненные оценки подготовленных экспертов (если в прослушивании принимают участие несколько человек) можно в известной степени считать условно-объективными». Здесь же надо отметить, что в музыкальных вузах в программу обучения по специальности «звукорежиссура» включается в качестве обязательного предмет «анализ звукозаписей и их оценка». Для оценки записей был разработан протокол OIRT (Ассоциация вещательных организаций стран СЭВ), аналогичный оценочным протоколам CCIR (ныне ITU) и Международного звукотехнического общества AES. По этому протоколу и производилась оценка качества фонограмм — сначала по 10-балльной шкале, позже по 5-балльной. Аналогичная методика оценки качества фонограмм применяется и на Всероссийском конкурсе творческих работ студентов-звукорежиссеров им. Виктора Бабушкина, который автор настоящей статьи проводит с 2000 года. Какие же параметры оценки входили в этот протокол? Разберем их подробно и по порядку. Это не просто определение положения источников звука в пространстве, но и общая акустическая атмосфера в помещении, где производилась запись. Основной критерий — соответствие звукового пространства типу музыкального состава, стилю произведения и эпохе его создания. Например, слушатель должен составить представление о соответствии размеров студии количеству исполнителей и характеру музыкального произведения, о времени и характере реверберации, а также об акустическом балансе (соотношении прямых и отраженных звуков). Важным достоинством музыкальных записей является ощущение звуковой перспективы в глубину, т. е. создание иллюзии различных расстояний от слушателя до тех или иных групп инструментов оркестра. Многоплановость звуковой картины как бы воссоздает объемность звучания. В 1960-е при Государственном доме радиовещания и звукозаписи по инициативе главного технолога ГДРЗ легендарного Бориса Меерзона была сформирована экспертная группа для оценки художественно-звуковых аспектов записей Джаз малых составов лучше звучит в небольшом и негулком клубном зале, который лучше передает живую атмосферу общения музыкантов. Органу же нужен большой и довольно гулкий собор. А вот рояль в соборе расплывется, ему необходим академический зал с прозрачной акустикой. Параметр «пространственное впечатление» относится и к записям, сделанным не в естественном помещении, а с использованием реверберации и других эффектов пространственно-временной обработки. Правильный подбор параметров искусственного пространства всецело зависит от мастерства звукорежиссера.


Для оценки записей был разработан протокол OIRT (Ассоциация вещательных организаций стран СЭВ, на фото — лист протокола), аналогичный оценочным протоколам CCIR (ныне ITU) и Международного звукотехнического общества AES Иногда говорят о многопространственности, которую не следует путать с многоплановостью. Многопространственность — это недостаток звукорежиссерского решения, проявляющийся в том, что различные инструменты звучат как бы из разных помещений с неодинаковыми акустическими свойствами. Многопространственность в записях оркестровой, хоровой или камерной музыки воспринимается как существенное нарушение естественности звучания. Однако в современной музыке она применяется достаточно часто как специальный эффект.

Прозрачность и детализация

Под этими терминами профессионалы понимают хорошую различимость звучания отдельных инструментов в оркестре, ясность музыкальной фактуры и разборчивость текста. Прозрачность и детализация находятся в прямой зависимости от акустической обстановки при записи, расстановки микрофонов, музыкального и тонального балансов, от инструментальной фактуры произведения и, конечно, от качества исполнения. В оркестровой музыке прозрачность — это возможность не просто услышать тембр каждого из инструментов, но и проследить за движением музыкального материала. Излишек реверберации ухудшит прозрачность. Тембральное преобладание одного инструмента над другим и возникающий в результате эффект маскировки ухудшит детализацию. При записи вокала хорошая передача красивого тембра может сочетаться с пониженной разборчивостью дикции, что снижает общую оценку фонограммы. Но иной раз и излишняя детализация — недостаток. Слушателю совершенно не обязательно слышать технические призвуки инструментов — звяканье, постукивания, свист струн, шуршание смычка, чмоканье губ и т. п.

 


Важным достоинством музыкальных записей является ощущение звуковой перспективы в глубину, т. е. создание иллюзии различных расстояний от слушателя до тех или иных групп инструментов оркестра

ЦАП! И цифра превращается … в аналоговый сигнал

Проигрыватель прочитал цифровую последовательность с компакт-диска или из файла. Теперь наступает самый математический момент воспроизведения цифрового звука. Цифровой сигнал преобразуется в аналоговый. Происходит эта матемагия в ЦАП, или цифро-аналоговом преобразователе.

ЦАП может быть встроен в проигрыватель или реализован в виде отдельного блока. Задаваясь целью получить звук высокого качества, нужно остановить свой выбор на втором варианте. Встроенный преобразователь обычно уступает отдельному по качеству. Внешний ЦАП имеет собственный блок питания, встроенный запитан от общего с проигрывателем источника. При использовании внешнего ЦАП на его работу почти не влияют помехи от проигрывателя и усилителя.

Внешний ЦАП по схемотехническим решениям реализуют в 4-х основных вариантах:

 

  • Широтно-импульсный модулятор;
  • Схема передискретизации;
  • Взвешивающего типа;
  • Лестничного типа, или цепная R-2R схема.

При таком богатстве выбора для достижения звучания высокого качества вариант R-2R оказывается безальтернативным. За счет специальной схемы, реализованной на прецизионных сопротивлениях, в ЦАП лестничного типа удается достичь очень высокой точности преобразования.

При выборе внешнего цифро-аналогового преобразователя следует обратить внимание на две основных характеристики:

  • Разрядность. Хорошо, если у выбранной модели она равна 24 битам.
  • Максимальная частота дискретизации. Очень хорошее значение 96 кГц, великолепное 192 кГц.

Музыкальный баланс

Правильные пропорции между уровнями громкости компонентов партитуры —инструментов, вокалистов, оркестровых и хоровых групп — обеспечивают правильный, естественный музыкальный баланс. Во время выступления оркестра в зале музыкальный баланс может восприниматься иначе, чем при воспроизведении записи того же выступления, даже если микрофон был установлен в той же точке, где находился слушатель. Это объясняется различным восприятием звука при непосредственном прослушивании в зале и при прослушивании через громкоговорители в аппаратной. Музыкальный баланс формируется и при последовательной записи наложением с последующим микшированием. При создании музыкального баланса важнее всего соблюсти пропорции между главными и второстепенными партиями как по громкости, так и по перспективе.

Звуковая карта улучшает звук?

Выделенную музыкальную карту выбирают не только игроки, у которых нет встроенного контроллера, но и те люди, которые заботятся о более высоком качестве звука. Как уже упоминалось, если компьютер используется для повседневных, нетребовательных приложений, таких как просмотр интернета или электронной почты, работа в офисе или прослушивание музыки, нет смысла вкладывать средства в дорогие контроллеры с исключительными возможностями.

Иная ситуация, когда пользователь является поклонником качественных звуков, заядлым игроком или создателем музыки. Тогда покупка даже самой простой звуковой карты до 2000 рублей будет заметна. Однако, когда вы думаете о профессиональном использовании, лучше сразу оборудовать себя более эффективным контроллером, который будет влиять не только на предлагаемый звук.

Чтобы получить гораздо лучшее качество музыки во время просмотра фильмов, прослушивания любимой группы и драки на виртуальных аренах, вам необходимо не только купить эффективный звуковой контроллер, но и подключить к нему высококачественные динамики или наушники. Только тогда можно полностью использовать потенциал звуковой карты.

Тональный баланс

Этот параметр определяется соотношением между разными частотными областями и регистрами звукового диапазона. Излишний подъем либо, напротив, завал в той или иной области воспринимается на слух как перегрузка или обеднение тембра. Избыток баса вызывает бубнение, огрубляет звучание в целом, а недостаток баса дает так называемый тощий звук. Избыток высоких частот порождает чрезмерную резкость и пронзительность звучания, а недостаток ощущается как глухое звучание. Причем надо учитывать, что основная и наиболее важная музыкальная информация находится в области средних частот, и потому несбалансированность этого регистра отражается на качестве звучания в первую очередь.

Как хранить хорошее звучание?

Для записи и хранения цифровой аудиоинформации применяют цифровые аудиоформаты. Под аудиоформатом понимают набор требований к представлению звуковых данных в цифровом виде.

 

При рассуждении о качестве звучания цифровые форматы делят на 3 категории:

  • Форматы без дополнительного сжатия (CDDA, DSD, WAV, AIFF и др.);
  • Форматы, сжатые без потери качества (FLAC, WavPack, ADX и др.);
  • Форматы, в которых применено сжатие с потерями (MP3, AAC, RealAudio и др.).

Звук высокого качества получается при воспроизведении музыки, сохраненной в форматах из первой и второй категорий. В форматах третьей категории, для уменьшения объема данных, намеренно исключают часть информации. Например, информацию о скрытых частотах.

Скрытыми называют частоты, лежащие за пределами диапазона восприятия среднестатистического человека: 20 Гц – 22 кГц. Для аудиофилов этот диапазон в силу индивидуальных психофизиологических особенностей бывает шире.

Для комплектации домашней аудиотеки следует выбирать записи, сохраненные в файлах с расширениями:

  • *.wav, *.dff, *.dsf, *.aif, *.aiff – это файлы со звуком без сжатия;
  • *.mp4, *.flac, *.ape, *.wma – это наиболее распространенные файлы со звуком, сжатым без потерь.

Из истории. Говорят, что самые первые опыты по сохранению звука проводили еще древние греки. Они пытались сохранить звук в амфорах. Выглядело это примерно так: в амфору произносили слова и быстро её закупоривали. Увы, не одной такой записи не дошло до наших дней.

Тембровая достоверность

Если музыкальные инструменты и голоса передаются естественно, узнаваемо и без искажений, то звучание в целом воспринимается как темброво достоверное. Но к электронной музыке этот параметр может применяться очень условно, хотя вполне может использоваться по отношению к тембрам электрогитар, органа и характерных эффектов. Тембровая достоверность касается не только узнаваемости инструментов, но и точности передачи свойственных им особенностей звукоформирования и звукоизвлечения — воздушных призвуков и пристукивания клапанов у духовых, ударов молоточков и звучания нажатой педали фортепиано, ударов палочек по тарелкам и пластику барабанов, ведению смычка, ударов пальцев или плектра по струнам и т. п. Все эти мелкие подробности и создают впечатление достоверной передачи тембра.


При записи вокала хорошая передача красивого тембра может сочетаться с пониженной разборчивостью дикции, что снижает общую оценку фонограммы

Хорошее питание – залог комфортного звучания

Наконец наш домашний комплекс для качественного воспроизведения музыки в цифровом формате собран. Теперь остался сущий пустяк. Для хорошей аппаратуры нужно качественное электропитание. Если самые дорогие «брендовые» усилители, ЦАП, проигрыватели запитать от общей сети, то ни о каком качественном звуке речи быть не может. Загрязненное помехами напряжение убьет все усилия по подбору и покупке качественных блоков для аудиоцентра.

 

Организуйте питание каждого блока отдельным кабелем. Кабели нужно подключить непосредственно к распределительному щитку на вводе в жилище. Розетки для подключения должны обеспечивать высокую степень фиксации штепселя. Разумно использовать сетевой фильтр, он сделает питание, а, следовательно, и звучание более чистым.

Оцените статью Рейтинг 3.94 (33 Голоса)

Стереофоничность

Вынося суждения о стереофоничности, эксперты учитывают точность локализации кажущихся источников звука, ширину звуковой картины, баланс между левой и правой сторонами, точность восприятия центра сцены, отсутствие звуковых дыр в середине ансамбля исполнителей. Принимается также во внимание и продуманное размещение источников по ширине звуковой сцены, причем при записи классических музыкальных составов со сложившейся традиционной расстановкой инструментов на сцене их расположение по стереобазе стараются сделать аналогичным: первые скрипки слева, виолончели справа и т. п. При этом в тон-зале студии оркестр может сидеть совершенно необычно, не так, как на сцене в зале, — это зависит от звукорежиссера.

Основные пункты

  • Если инструменты используют для измерения точности, то применяют объективные измерения. Субъективные относятся к мнениям – люди прослушивают звуки и сравнивают их, определяя качество.
  • Качество звука живой музыки именуется тоном. Когда вы улавливаете тон, то настраиваетесь на главную частоту. Однако есть и побочные гармоники – обертоны.
  • Качество звука основывается на множестве факторов: записывающее оборудование, обработка, способ воспроизведения и среда прослушивания.

Техника звукозаписи

При оценке техники звукозаписи итоговая фонограмма рассматривается с точки зрения технологических решений, к которым прибегнул звукорежиссер. Эксперты обращают внимание на правильность выбора микрофонов и их расстановки, на использование приборов частотной коррекции и динамической обработки сигналов, на применение реверберации и других эффектов, качество монтажа фонограммы и иные аспекты, не отраженные в предыдущих пунктах. В случае необходимости и при возникновении вопросов эксперты обращаются к графической схеме, так называемой микрофонной карте. Это не только рисунок с расположением микрофонов, но и описание помещения, расположения музыкантов и т. д. Если эксперт слышит в записи какой-то недостаток, то, обратившись к микрофонной карте, он поймет, можно ли было скорректировать звучание и с помощью каких технических решений.

Как может звучать цифра?

Лирическое отступление, экспертам можно не читать.

В двух словах объясню, откуда берется звук в цифровом формате. В процессе звукозаписи микрофон преобразует механические колебания (собственно звук) в аналоговый электрический сигнал. Аналоговый сигнал в самом общем случае похож на синусоиду, которая всем нам знакома со времен средней школы. В эру аналогового звука именно этот сигнал записывался на различные носители и затем воспроизводился.

С развитием микропроцессорной техники появилась возможность записывать и хранить аудиоинформацию в цифровых форматах. Получают эти форматы с помощью процесса аналого-цифрового преобразования (АЦП).

В ходе АЦП аналоговый сигнал (нашу синусоиду из средней школы) преобразуют в дискретный (проще говоря, разрезают на части). На следующем этапе дискретный сигнал квантуют, т.е. каждому получившемуся отрезку синусоиды сопоставляют цифровое значение. На третьем этапе квантованный сигнал оцифровывают, т.е. кодируют в виде последовательности 0 и 1. Применительно к цифровой звукозаписи оцифровке подвергаются сведения об амплитуде и частоте звука.

 

Заметность помех и искажений


Тембровая достоверность касается не только узнаваемости инструментов, но и точности передачи свойственных им особенностей звукоформирования и звукоизвлечения — воздушных призвуков и пристукивания клапанов у духовых инструментов, ударов молоточков рояля (на фото) Этот параметр — прежде всего технический. В нем отражается заметность на слух фонового шума, наводок, гула, тресков и щелчков, а также выпадений и изменений уровня сигнала, нелинейных искажений и интермодуляций — всего того, чего не было в исходном сигнале и что появилось по мере прохождения сигнала через звукозаписывающий тракт. С развитием звукозаписывающей техники количество искажений и шумов уменьшилось, а современный цифровой тракт почти лишен таких дефектов, как фоновый шум, детонация, хотя в случае перегрузки тракта по уровню возникают очень неприятные на слух цифровые искажения. Впрочем, для их предотвращения используются надежные аппаратные и программные средства, а новейшее ПО для реставрации позволяет исправить цифровую перегрузку. К рассматриваемому параметру относятся также шумы, проникающие в студию или зал в результате плохой звукоизоляции или создаваемые самими исполнителями (шелест нотных страниц, щелчки клапанов духовых инструментов, скрип стульев или подставок для хора, шум зрительного зала при записях с открытых концертов и т. д.). При прослушивании фонограммы подобные шумы воспринимаются ярче и значительно больше мешают слушателю, чем в зале. Вместе с тем легкий шум зала при концертной записи обычно не считается браком, так как придает живость звучанию. В некоторых случаях оцениваются дополнительные параметры.

Звуковая карта – основы конструкции

Выделенные звуковые карты можно разделить на внешние и внутренние системы:

  • Внутренние звуковые карты – похожи на традиционные карты расширения, используемые в ПК. Они подключены непосредственно к разъему PCI на материнской плате компьютера, и только часть со звуковыми разъемами выступает из корпуса. Как вы можете легко догадаться, эти типы карт расширения могут использоваться, в основном, на настольных компьютерах, которые часто выбирают профессиональные музыканты и компьютерные игроки. Среди решений, предназначенных для последних, можно встретить системы, которые отличаются своей оригинальной стилистикой и эффектами в виде, например, программируемой системы подсветки.
  • Внешние звуковые карты – подключаются к компьютеру через порт USB, FireWire или Thunderbolt. Музыкальные карты FireWire и Thunderbolt производятся для профессиональных приложений, например, студий звукозаписи, и позволяют подключать до нескольких десятков дополнительных каналов. Это дорогие решения, потому что они стоят несколько десятков тысяч рублей. Из-за высокой стоимости и возможностей, которые выходят за рамки интересов геймеров или музыкантов-любителей, их редко можно встретить в домашних условиях. Здесь часто используются очень эффективные звуковые карты USB. Они могут быть в форме небольших аксессуаров, напоминающих брелок или гораздо более крупных «коробок». Возможности музыкальных USB-карт зависят, в первую очередь, от производителя, конкретной модели и используемых в ней решений.

Выделенные звуковые карты имеют преимущество в качестве звука, который они предлагают, благодаря своей конструкции. Они состоят из таких элементов, как преобразователи АЦП и ЦАП, процессоры DSP, синтезаторы MIDI, память ОЗУ и ПЗУ, микшеры звука, усилители выходного сигнала и шинные соединители.

Качество аранжировки

Специалисты принимают во внимание качество аранжировки (дополнительный параметр) — в основном для оценки записей популярной музыки. Дело в том, что аранжировка, перенасыщенная партиями с мелкими фигурациями, перегруженная по инструментальной и вокальной фактуре, способна сделать произведение настолько неудобным для записи, что никакая технология и звукорежиссерские приемы не помогут добиться прозрачности, детальности и музыкального баланса. Тут требуется упростить фактуру аранжировки, что и может рекомендовать экспертная комиссия.


Вынося суждения о стереофоничности, эксперты учитывают точность локализации кажущихся источников звука, ширину звуковой картины, баланс между левой и правой сторонами, точность восприятия центра сцены, отсутствие звуковых «дыр» в середине ансамбля исполнителей

Параметры цифрового звука

Биты, герцы… Что скрывается за этими понятиями? При разработке стандарта аудио компакт дисков были приняты значения 44

кГц,
16
бит. Почему именно столько? В чем причина выбора, а также — почему предпринимаются попытки повысить эти значения до, скажем, 96 кГц и 24 или даже до 32х битов…
Разберемся сначала с разрешением сэмплирования — то есть с битностью. Так уж получается, что выбирать приходится между числами 16, 24 и 32. Промежуточные значения были бы, конечно, удобнее в смысле звука, но слишком
неприятны для использования в цифровой технике.

За что отвечает этот параметр? В двух словах — за динамический диапазон. Диапазон одновременно воспроизводимых громкостей — от максимальной амплитуды (0 дБ) до той наименьшей, которую позволяет передать разрешение, например — примерно -93 дБ для 16 битного аудио. Как не странно, это сильно связано с уровнем шумов фонограммы. В принципе, для, к примеру, 16 битного аудио вполне возможна передача сигналов мощностью и в -120 дБ, однако эти сигналы будет затруднительно применять на практике из-за такого фундаментального понятия как шум дискретизации

 

. Дело в том, что при взятии цифровых значений мы все время ошибаемся, округляя реальное аналоговое значение до ближайшего возможного цифрового. Самая маленькая возможная ошибка — нулевая, максимально же мы ошибаемся на половину последнего разряда (бита, далее термин младший бит будет сокращаться до МБ). Эта ошибка дает нам так называемый шум дискретизации — случайное несоответствие оцифрованного сигнала оригиналу. Этот шум носит постоянный характер и имеет максимальную амплитуду равную 0.5МБ. Это можно рассматривать как случайные значения, подмешанные в цифровой сигнал. Иногда это называется шум округления или квантования.

Остановимся подробнее на том, что понимается под мощностью сигналов, измеряемой в битах. Самый сильный сигнал в цифровой обработке звука принято принимать за 0 дБ, это соответствует всем битам, поставленным в 1. Если старший бит (далее СБ) обнулить, получившееся цифровое значение будет в два раза меньше, что соответствует потере уровня на 6 дБ. Никакими другими битами кроме СБ нельзя добиться уровня выше -6 дБ. Соответственно — старший бит как бы отвечает за наличие уровня сигнала от -6 до 0 дБ, поэтому СБ — это бит 0 дБ. Предыдущий бит отвечает за уровень -6 дБ, ну а самый младший, таким образом — за уровень (число_бит-1) * 6 дБ. В случае 16 битного звука, МБ соответствует уровень в -90 дБ. Когда мы говорим 0.5МБ, мы имеем в виду не -90/2, а половину шага до следующего бита — то есть еще на 3 дБ ниже, -93 дБ.

Возвращаемся к выбору разрешения оцифровки. Как уже было сказано, оцифровка вносит шум на уровне 0.5МБ, это говорит о том, что запись, оцифрованная в 16 бит, постоянно шумит

на -93 дБ. Она может передавать сигналы и тише, но шум все равно остается на уровне -93 дБ. По этому признаку и определяется динамический диапазон цифрового звука — там, где соотношение сигнал/шум переходит в шум/сигнал (шумов больше, чем полезного сигнала), находится граница этого диапазона снизу. Таким образом,
главный
критерий оцифровки —
сколько шума
мы можем себе позволить в восстановленном сигнале? Ответ на этот вопрос зависит отчасти от того, сколько шума было в исходной фонограмме. Важный вывод — если мы оцифровываем нечто с уровнем шумов -80 дБ — нет совершенно никаких причин цифровать это в более чем 16 бит, так как, с одной стороны, шумы -93 дБ добавляют очень мало к уже имеющимся огромным (сравнительно) шумам -80 дБ, а с другой стороны — тише чем -80 дБ в самой фонограмме уже начинается шум/сигнал, и оцифровывать и предавать такой сигнал просто не нужно.

Теоретически это единственный критерий выбора разрешения оцифровки. Больше мы не вносим

совершенно никаких искажений или неточностей. Практика, как не странно, почти полностью повторяет теорию. Этим и руководствовались те люди, которые выбирали разрешение 16 бит для аудио компакт дисков. Шум -93 дБ — довольно хорошее условие, которое почти точно соответствует условиям нашего восприятия: разница между болевым порогом (140 дБ) и обычным шумовым фоном в городе (30-50 дБ) составляет как раз около сотни дБ, и если учесть, что на уровне громкости, приносящем боль, музыку не слушают — что еще несколько сужает диапазон — получается, что реальные шумы помещения или даже аппаратуры получаются гораздо сильнее шумов дискретизации. Если мы можем расслышать уровень под -90 дБ в цифровой записи — мы услышим и воспримем шумы дискретизации, иначе — мы просто никогда не определим, оцифрованное это аудио или живое. Никакой другой разницы в смысле динамического диапазона просто нет. Но в принципе, человек может осмысленно слышать в диапазоне 120 дБ, и было бы неплохо сохранить весь этот диапазон, с чем 16 бит, казалось бы, не справляются.

Но это только на первый взгляд: с помощью специальной техники, называемой shaped dithering

, можно изменить частотный спектр шумов дискретизации, почти полностью вынести их в область более 7-15 кГц. Мы как бы меняем разрешение по частоте (отказываемся от воспроизведения тихих высоких частот) на дополнительный динамический диапазон в оставшемся отрезке частот. В сочетании с особенностями нашего слуха — наша чувствительность к выкидываемой области высоких частот на десятки дБ ниже чем в основной области (2-4 кГц) — это делает возможным относительно бесшумную передачу полезных сигналов дополнительно еще на 10-20 дБ тише, чем -93 дБ — таким образом, динамический диапазон 16 битного звука для человека составляет около 110 дБ. Да и вообще — одновременно человек просто не может слышать звуки на 110 дБ тише чем только что услышанный громкий звук. Ухо, как и глаз, подстраивается под громкость окружающей действительности, поэтому одновременный диапазон нашего слуха составляет и совсем сравнительно мало — около 80 дБ. Поговорим о dithring-е подробнее после обсуждения частотных аспектов.

 

Для компакт дисков выбрана частота дискретизации 44100 Гц. Бытует мнение, что это означает, что воспроизводятся все частоты до 22.05 кГц, однако это не совсем так. Однозначно можно сказать лишь то, что частот выше 22.05 кГц в оцифрованном сигнале нет. Реальная же картина воспроизведения оцифрованного звука всегда зависит от конкретной техники

и всегда не настолько идеальна, как хотелось бы, и как соответствует теории. Все зависит от конкретного ЦАПа.

Разберемся сначала, что нам хотелось бы получить. Человек среднего возраста (скорее молодой) может чувствовать звуки от 10 Гц до 20 кГц, осмысленно слышать — от 30 Гц до 16 кГц. Звуки выше и ниже воспринимаются, но не составляют акустических ощущений. Звуки выше 16 кГц ощущаются как раздражающий неприятный фактор — давление на голову, боль, особо громкие звуки приносят такой резкий дискомфорт, что хочется покинуть помещение. Неприятные ощущения настолько сильны, что на этом основано действие охранных устройств — несколько минут очень громкого звука высокой частоты сведут с ума кого угодно, и воровать что либо в такой обстановке становится решительно невозможно. Звуки ниже 30 — 40 Гц при достаточной амплитуде воспринимаются как вибрация, исходящая от объектов (колонок). Вернее будет даже сказать так — просто вибрация. Человек акустически почти не определяет пространственное положение настолько низких звуков, поэтому в ход уже идут другие органы чувств — осязательные, мы чувствуем такие звуки телом.

Для передачи звука как он есть было бы неплохо сохранить весь хоть как либо воспринимаемый диапазон от 10

Гц до
20
кГц. С низкими частотами в теории в цифровой записи проблем совершенно никаких нет. На практике же — все ЦАПы, работающие по дельта-технологии, имеют потенциальный источник проблем. Таких устройств сейчас 99%, поэтому проблема так или иначе имеет место быть, хотя откровенно плохих устройств почти нет (лишь самые дешевые схемы). Можно считать, что с низким частотами все обстоит благополучно — в конце концов, это лишь вполне решаемая проблема воспроизведения, с которой успешно справляются хорошо сконструированные ЦАПы ценой более $1. С высокими частотами все немного хуже, по крайней мере точно
сложнее
. Почти вся суть усовершенствований и усложнений ЦАПов и АЦП направлена как раз на более достоверную передачу высоких частот. Под «высокими» подразумеваются частоты сравнимые с частотой дискретизации — то есть в случае 44.1 кГц это 7-10 кГц и выше. Поясняющий рисунок:

На рисунке изображена частота 14 кГц, оцифрованная с частотой дискретизации 44.1 кГц. Точками обозначены моменты взятия амплитуды сигнала. Видно, что на один период синусоиды приходится около трех точек, и чтобы восстановить исходную частоту в виде синусоиды, надо проявить некоторую фантазию. Саму синусоиду рисовала программа CoolEdit, она и проявляла фантазию — восстанавливала данные. Аналогичный процесс происходит и в ЦАПе, этим занимается восстанавливающий фильтр. И если сравнительно низкие частоты представляют собой почти готовые синусоиды, то форма и, соответственно, качество восстановления высоких частот лежит целиком на совести восстанавливающей системы ЦАПа. В CoolEdit очень хороший восстанавливающий фильтр, но и он не справляется в экстремальном случае — например, частота 21 кГц:

Видно, что форма колебаний (синие линии) далека от правильной, да и свойства появились, которых ранее не было. Это и составляет основную проблему при воспроизведении высоких частот. Проблема, однако, не так страшна, как может показаться. Во всех современных ЦАП используется технология пересэмплирования (multirate), которая заключается в цифровом восстановлении до в несколько раз более высокой частоты дискретизации, и в последующем переводе в аналоговый сигнал на повышенной частоте. Таким образом проблема восстановления высоких частот перекладывается на плечи цифровых фильтров, которые могут быть очень качественными. Настолько качественными, что в случае дорогих устройств проблема полностью

снимается — обеспечивается неискаженное воспроизведение частот до 19-20 кГц. Пересэмплирование применяется и в не очень дорогих устройствах, так что в принципе и эту проблему можно считать решенной. Устройства в районе $30 — $60 (звуковые карты) или музыкальные центры до $600, обычно аналогичные по ЦАПу этим звуковым картам, отлично воспроизводят частоты до 10 кГц, сносно — до 14 — 15, и кое-как остальные. Этого
вполне
достаточно для большинства реальных музыкальных применений, а если кому-то нужно большее качество — он найдет его в профессионального класса устройствах, которые не то чтобы сильно дороже — просто они сделаны с умом.

 

Вернемся к dithering-у — посмотрим, как можно с пользой увеличить динамический диапазон за пределы 16 бит.

Идея dithering-а заключается в том, чтобы подмешать в сигнал шум

. Как не странно это звучит — для того чтобы уменьшить шумы и неприятные эффекты квантования, мы
добавляем
свой шум. Рассмотрим пример — воспользуемся возможностью CoolEdit-а работать в 32х битах. 32 бита — это в 65 тысяч раз большая точность, нежели 16 бит, поэтому в нашем случае 32х битный звук можно считать аналоговым оригиналом, а перевод его в 16 бит — оцифровкой. Изображение показывает 32х битый звук — музыка, записанная на таком тихом уровне, что самые громкие моменты достигают лишь -110 дБ:

Это с запасом гораздо тише динамического диапазона 16 битного звука (1МБ 16 битного представления равняется единице по шкале справа), поэтому если просто округлить данные до 16 бит — мы получим полную цифровую тишину.

Добавим в сигнал белый шум с уровнем в 1МБ — это -90 дБ (примерно соответствующий по уровню шумам квантования):

Преобразуем в 16 бит (возможны только целые значения — 0, 1, -1, …):

(Не обращайте внимание на синюю линию, которая принимает и промежуточные значения — это фильтр CoolEdit моделирует реальную амплитуду после восстанавливающего фильтра. Точки же взятия амплитуд расположены только на значениях 0 и 1)

Как видно, какие-то данные остались. Там, где исходный сигнал имел больший уровень, больше значений 1, где меньший — нулей. Чтобы услышать то, что мы получили, усилим сигнал на 14 бит (на 78 дБ). Результат можно скачать и послушать (dithwht.zip, 183 кб).

 

Мы слышим этот звук с огромными помехами в -90 дБ (до усиления для прослушивания), тогда как полезный сигнал составляет всего -110 дБ. Мы уже имеем передачу звука с уровнем -110 дБ в 16 битах. В принципе, это и есть стандартный способ расширения динамического диапазона, получающийся часто чуть ли не сам собой — шума везде хватает. Однако само по себе это довольно бессмысленно — уровень шумов дискретизации так и остается на прежнем уровне, а передавать сигнал слабее шума — занятие не очень понятное с точки зрения логики…

Более сложный способ — shaped dithering

. Идея в том, что раз мы все равно не слышим высоких частот в очень тихих звуках, значит следует основную мощность шума направить в эти частоты, при этом можно даже воспользоваться большим шумом — я воспользуюсь уровнем в 4МБ (это два бита шума). Усиленный результат после фильтрации высоких частот (мы не услышали бы их в нормальной громкости этого звука) — ditshpfl.zip, 1023 кб (к сожалению, звук перестал архивироваться). Это уже вполне хорошая (для запредельно низкой громкости) передача звука, шумы примерно равняются по мощности самому звуку с уровнем
-110
дБ! Важное замечание: мы
повысили
реальные шумы дискретизации с 0.5МБ (-93 дБ) до 4МБ (-84 дБ),
понизив
слышимые шумы дискретизации с -93 дБ до примерно -110 дБ. Отношение сигнал/шум
ухудшилось
, но шум ушел в высокочастотную область и перестал быть слышимым, что дало
существенное улучшение реального
(воспринимаемого человеком) отношения сигнал/шум. Практически это уже уровень шумов дискретизации 20 битного звука. Единственное условие этой технологии — наличие частот для шума. 44.1 кГц звук дает возможность размещать шум в неслышимых на тихой громкости частотах 10-20 кГц. А вот если оцифровывать в 96 кГц — частотная область для шума (неслышимая человеком) будет настолько велика, что при использовании shaped dithering 16 бит
реально
превращаются и во все 24.

[На заметку: PC Speaker — однобитное устройство, с однако довольно высокой максимальной частотой дискретизации (включения/выключения этого единственного бита). С помощью процесса, сходного по сути с dithering-ом, называемым скорее широтно-импульсная модуляция, на нем игрался довольно качественный цифровой звук — из одного бита и высокой частоты дискретизации вытягивались 5-8 бит низкой частоты, а фильтром высокочастотного шума выступала неспособность аппаратуры воспроизводить столь высокие частоты, как впрочем и наша неспособность их слышать. Легкий высокочастотный свист, однако — слышимая часть этого шума — был слышен.]

Таким образом, shaped dithering позволяет существенно понизить и без того низкие шумы дискретизации 16 битного звука, спокойно расширив таким образом полезный (бесшумный) динамический диапазон на всю

область человеческого слуха. Поскольку сейчас уже всегда при переводе из рабочего формата 32 бит в конечный 16 бит для CD используется shaped dithering — наши 16 бит совершенно достаточны для полной передачи звуковой картины.

Единственное что — эта технология действует только на последней стадии — подготовке материала к воспроизведению. Во время обработки качественного звука просто необходимо

оставаться в 32х битах, чтобы не применять dithering после каждой операции, более качественно кодируя результаты обратно в 16 бит. Но если уровень шума фонограммы составляет более -60 дБ — можно без малейших зазрений совести вести всю обработку в 16 битах. Промежуточный dithering обеспечит отсутствие искажений округления, а добавленный им шум в
сотни раз
слабее уже имеющегося и поэтому совершенно безразличен.

Q: Почему говорят, что 32-х битный звук качественнее 16 битного?
A1: Ошибаются.
A2: [Имеют в виду немного другое: при обработке или записи звука нужно
использовать большее разрешение. Этим пользуются
всегда
. Но в звуке как в готовой продукции разрешение более 16 бит не требуется.]
Q: Имеет ли смысл увеличивать частоту дискретизации (например до 48 кГц или до 96)?
A1: Не имеет. При хоть сколь грамотном подходе в конструировании ЦАП 44 кГц передают весь
необходимый частотный диапазон.
A2: [Имеют в виду немного другое: это имеет смысл, но лишь при обработке или записи звука.]
Q: Почему всё же идет внедрение больших частот и битности?
A1: Прогрессу важно двигаться. Куда и зачем — уже не столь важно…
A2: Многие процессы в этом случае происходят легче. Если, например, устройство собирается обработать звук — ему будет легче это сделать в 96 кГц / 32 бита. Почти все DSP используют 32 бита для обработки звука, и возможность забыть про преобразования — облегчение разработки и всё же небольшое увеличение качества. Да и вообще — звук для дальнейшей обработки имеет
смысл хранить в большем разрешении, нежели 16 бит. Для hi-end устройств которые лишь воспроизводят звук это
абсолютно
безразлично.
Q: 32х или 24х или даже 18 битные ЦАП лучше чем 16 битные?
A: В общем случае — нет
. Качество преобразования нисколько не зависит от битности. В AC’97 кодеке (современная звуковая карта до $50) используется 18 битный кодек, а в картах за $500, звук которых с этой ерундой даже сравнивать нельзя — 16 битный.
Это не имеет абсолютно никакого значения для воспроизведения 16 битного звука
. Стоит также иметь в виду, что большинство ЦАПов обычно реально воспроизводят меньше бит, чем берутся. Например, реальный уровень шумов типичного дешевого кодека составляет -90 дБ, что составляет 15 бит, и даже если он сам 24х битный — вы не получите никакой отдачи от ‘лишних’ 9 бит — результат их работы, даже если он имелся, потонет в их же собственном шуме. Большинство же дешевых устройств просто
игнорируют
дополнительные биты — они просто реально не идут в расчет в их процессе синтеза звука, хотя и поступают на цифровой вход ЦАПа.
Q: А для записи?
A: Для записи — лучше иметь АЦП большей разрядности. Опять же, большей реальной
разрядности. Разрядность ЦАПа должна соответствовать уровню шумов исходной фонограммы, или просто быть достаточной для достижения желаемо низкого уровня
шума
. Также удобно бывает иметь разрядность с запасом, чтобы использовать повышенный динамический диапазон для менее точной регулировки уровня записи. Но помните — вы должны всегда попадать в
реальный
диапазон кодека. В реальности 32х битный АЦП, к примеру, почти полностью
бессмысленнен
, так как младший десяток бит будут просто непрерывно шуметь —
настолько
малого шума (под -200 дБ) просто
не бывает
в аналоговом музыкальном источнике.

Требовать от звука повышенной разрядности или частоты дискретизации, по сравнению с CD, лучшего качества — не стоит. 16 бит / 44 кГц, доведенные до предела с помощью shaped dithering, вполне способны полностью

 

передать интересующую нас информацию, если дело не идет о процессе звукообработки. Не стоит тратить место на лишние данные готового материала, также как не стоит ожидать повышенного качества звука от DVD-Audio с его 96 кГц / 24 бит. При грамотном подходе при создании звука в формате стандартного CD мы будем иметь качество, которое
просто не нуждается
в дальнейшем улучшении, а ответственность за правильную звукозапись конечных данных давно взяли на себя разработанные алгоритмы и люди, умеющие правильно их использовать. В последние несколько лет вы уже не найдете нового диска без shaped dithering и других приемов доведения качества звукопередачи до предела. Да, ленивым или просто криворуким будет удобнее давать готовый материал в 32х битах и 96 кГц, но по идее — стоит ли это в несколько раз больших аудио данных?…

Качество исполнения

Данная характеристика не является технической, она определяет художественные достоинства фонограммы. Однако от качества исполнения зависит общая оценка записи. Очевидно, что если технически безупречная фонограмма содержит недопустимые ошибки исполнителя, то она будет признана непригодной. Исполнение оценивается как по общей трактовке исполнителем данного произведения, так и по отдельным параметрам: безошибочной игре или пению, чистоте интонирования, четкости артикуляции, верному темпу, правильным нюансам и т. п. Эксперты могут отметить и эмоционально-смысловые достоинства или недостатки исполнения, и прочие чисто эстетические моменты.

Звуковая карта Bluetooth – стоит ли покупать

Качественный звук, необычные музыкальные эффекты, глубокий звук – любой, кто считает, что возможности звуковых карт ограничиваются перечисленными элементами, ошибается. Используемые здесь алгоритмы обеспечивают не только кристально чистый голос в играх или онлайн-чате, но и проприетарное программное обеспечение позволяет настраивать карту.

Выделенные звуковые контроллеры имеют гораздо более сложные функции, и одним из наиболее интересных решений является звуковая карта Bluetooth. Система, оснащенная технологией Bluetooth, позволяет быстро соединить карту с беспроводными наушниками одним касанием. Кроме того, чтобы гарантировать, что качество звука не ухудшится, в этом типе компонентов используется широкий диапазон потоковых кодеков.

Художественная ценность записи

Этот параметр интегрирует предыдущие. Высшая оценка означает полную коммерческую пригодность записи, в которой нет технических и музыкальных недостатков и которую можно смело издавать, продавать или транслировать по радио и ТВ. Если же отдельные недостатки есть, то они снижают ценность фонограммы вплоть до ее непригодности к публикации. По окончании прослушивания определяется окончательная оценка фонограммы как сумма оценок, данных всеми экспертами. Важна и независимость оценок экспертов. Как указывал Б. Я. Меерзон, «многолетний опыт работы группы прослушивания в Государственном доме радиовещания и звукозаписи показал, что наиболее достоверной становится экспертиза, если результаты ее заносятся в протоколы каждым экспертом самостоятельно». В ходе прослушивания не допускаются никакие консультации с коллегами, что позволяет избежать влияния чужого, пусть и авторитетного, мнения. На конкурсе студентов-звукорежиссеров им. В. Бабушкина экспертиза организована аналогично: члены жюри даже не пересекаются друг с другом во время прослушивания. Таким образом, оценка качества звукозаписи — не миф и не сфера субъективных спекуляций, а предмет научно и методически обоснованной экспертизы силами квалифицированных специалистов.
Анатолий Вейценфельд

Редакция Hi-Fi.ru

Что влияет на качество звучания цифровых записей?

Мой дедушка слушал граммофон. Молодость отца прошла под музыку, доносившуюся из динамика катушечного магнитофона. На мою молодость пришелся расцвет и закат кассетных магнитофонов. Мой сын растет в эру цифрового звука. Чтобы не отставать от времени, и обеспечить сына хорошим «звуком», решил разобраться, от чего зависит качество воспроизведения цифрового аудио сигнала.
Пообщался с друзьями меломанами. Провел информационный поиск в Интернете. В итоге пришел к выводу, что качественного звучания в цифровую эру можно добиться, если правильно выбрать 7 основных элементов современных музыкальных центров:

  • формат, в котором записана музыка;
  • проигрыватель;
  • цифро-аналоговый преобразователь;
  • усилитель;
  • акустику;
  • кабели;
  • питание.

Поделюсь ниже своими наблюдениями и выводами по поводу достижения качественного звучания записей в цифровых форматах.

 

Поддержка Asio драйверов

Прежде чем купить звуковую карту, узнайте о наличие Asio драйвера. Это важно. Для тех, кто не знает, вкратце поясню. Asio — это специальный протокол, который используется в программно-аппаратном интерфейсе драйвера звуковой карты при передачи аудио сигнала и обеспечивает низкий уровень задержки этого сигнала (4 — 7 мс).

Например, когда вы пишите вокал или гитару, то при большой задержке отклик в колонках будет с заметным опозданием. Не очень-то и удобно. Или еще пример, когда вы играете на midi-клавиатуре, нажимаете клавишу, а звук слышен позже. В таких условиях вы не сможете сыграть нормальную партию. Те же проблемы вас ожидают и при работе с эффектами. Будет все тормозить, и вы не сможете правильно оценить воздействие на звук. Конечно же, все эти проблемы исчезают, если ваша звуковая карта поддерживает Asio. Тогда задержка у вас будет меньше 10 мс.

Есть еще программный Asio драйвер. Называется он Asio4All. Если ваша карта не имеет драйвер Asio, то можно установить этот программный. Он, конечно же, сделает вам низкую задержку, однако сделает он за счет ресурсов самого процессора. А эти ресурсы вам ой как пригодятся при создании музыки на компьютере. Виртуальные эффекты и инструменты очень активно расходуют ресурсы компьютера, которые вы будете терять на программном уменьшении задержки. А если ваша звуковая карта имеет свой ASIO драйвер, то она своими ресурсами обеспечивает малую задержку.
Рекомендую почитать о том, как настроить ASIO драйвер в программе Nuendo.
В общем, главным образом Asio дает возможность программной обработки звука в режиме реального времени. Это позволяет заменить внешнее оборудование звуковой обработки специальными плагинами работающими в реальном времени. Но хотя большинство профессиональные и даже некоторые мультимедийные карты поддерживают этот драйвер, который также поставляется в комплекте. И все же не забудьте при покупке звуковой карты удостовериться, что данный драйвер будет поддерживаться.

Наличие midi-интерфейса

Если в своей домашней студии для звукозаписи вы планируете заниматься не только звукозаписью, но и, например, созданием музыки или аранжировками, то вам будет не лишним наличие входов и выходов для подключения midi-оборудования. Например, это те же midi-клавиатуры или синтезаторы. Хотя и здесь также большинство профессиональных и мультимедийных плат тоже содержат в себе midi-входы и выходы.

Также стоит сказать, что многие современные midi-клавиатуры подключаются к вашему компьютеру посредством USB. К тому же с USB порта идет еще и питание к устройству. Это значит, что вам не нужно подключать само устройство к сети, не нужен дополнительный провод и блок питания. Поэтому далеко не всегда столь обязательно наличие в карте midi-интерфейса.

Однако при подключении по MIDI, это когда мы подключаем MIDI клавиши к MIDI входу, то обмен информации идет напрямую. Так что подключение по MIDI будет наиболее предпочтительнее. А если у вас есть синтезатор старой модели, то вы спокойно сможете его использовать в качестве MIDI-клавиатуры. Так что наличие подобного порта желательно, но не слишком уж и обязательно.

От admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *