Системы виртуального пространственного звучания

22 мая 2007

Прежде чем приступить к прочтению данной статьи, предлагаем вам провести небольшой эксперимент. Выйдите на балкон или на улицу, закройте глаза и сосредоточьтесь на своих слуховых ощущениях. Уверен, что многие из вас будут удивлены тем, насколько объемной на самом деле является звуковая панорама — голоса людей, пение птиц, звук проезжающих мимо автомобилей. Только лишь на основании своих слуховых ощущений вы без труда сможете сделать выводы о расположении этих звучащих объектов, о том, на каком расстоянии они находятся, являются ли они статичными или движущимися и пр.

Ощущение объемности окружающих нас звуковых образов является привычным, но мало кто из нас задумывается над тем, какие именно механизмы восприятия позволяют нам слышать трехмерное пространство и в точности определять направление и расстояние до звуковых источников. Помимо направления в горизонтальной плоскости наши уши позволяют также сделать выводы о высоте звучащего объекта. Мало кто из людей задумывается над тем, каким образом мы можем услышать 3-мерное звуковое пространство, будучи «вооруженными» только лишь двумя ушами. Ответ на этот вопрос кроется в устройстве человеческого слухового аппарата, которое будет рассмотрено чуть ниже.

Современные системы домашних развлечений разрабатываются и создаются для того, чтобы вызвать у человека максимальный эмоциональный отклик, погрузить его в действие кинофильма, прослушиваемую музыку или компьютерную игру настолько, чтобы он на время забыл о реальности окружающего мира и полностью погрузился в реальность «виртуальную». Естественно, для достижения данной задачи необходимо, чтобы действие, происходящее на экране, вызывало у человека эмоциональный отклик, качество изображения также должно быть максимальным, приближенным к тем картинам, которые мы привыкли видеть в реальной жизни. Хорошо известно также и то, что значительная часть информации об окружающем мире (более 25%) приходится на звук. Качественное объемное звучание — залог того, что человек получит максимальный эмоциональный заряд от кинофильма или музыкального исполнения.

Качественные многоканальные системы
должны устанавливаться в специальных
помещениях прослушивания

Традиционным решением задачи по созданию объемного звучания в комнате прослушивания является построение многоканальных систем, в которых звук передается фронтальными, центральным и тыловыми громкоговорителями. С их помощью можно добиться очень равномерной и правдоподобной звуковой панорамы, при которой эффекты будут окружать слушателя именно таким образом, как задумал звукорежиссер. Для того чтобы повысить достоверность воспроизведения, многие производители аудиотехники предлагают идти по пути увеличения количества каналов (и, соответственно, громкоговорителей), строя уже не пяти-, а шести-, семи- и даже девятиканальные системы домашнего кинотеатра. Резоны производителей понятны. Построение многоканальных аудиосистем действительно является самым верным способом повысить достоверность воспроизведения. Кроме того, увеличение количества каналов, естественно, требует увеличения количества акустических систем, длины коммутационных проводов, применения более сложных и более дорогих усилителей, а следовательно, позволяет увеличивать прибыль от продажи оборудования.

Впрочем, находятся компании, которые идут по другому пути, предлагая не увеличивать, а, наоборот, уменьшать количество каналов воспроизведения. Они совершенно справедливо считают, что далеко не всем потребителям необходимы многоканальные аудиосистемы. Для кого-то это неприемлемо по экономическим соображениям, кто-то не может выделить под систему домашних развлечений специальную комнату, в которой можно было бы проложить все необходимые коммутационные провода и выделить место для установки тыловых громкоговорителей, у кого-то уже есть «нормальная» большая система домашнего кинотеатра, и он хочет построить дополнительную (резервную) систему в маленькой комнате — спальне, кабинете или детской комнате, в которой также хочется «малой кровью» получить объемное звучание. Казалось бы, что получение объемного звука без использования тыловых громкоговорителей, очевидно, не возможно. Если сзади нет звукового источника, то и звуку там неоткуда взяться. Впрочем, очевидность данного утверждения можно поставить под сомнение одним простым утверждением. У человека всего лишь два уха, которые обеспечивают его всей необходимой информацией о расположении источника звукового сигнала, а это значит, что для ее передачи по идее достаточно всего лишь двух громкоговорителей (наушников или акустических систем), воспроизводящих аудиосигнал, в котором эта информация содержится.

Компактные системы 2.1 могут устанавливаться практически где угодно

Не следует забывать о том, что наш слух — это не просто какое-то абстрактное, ничем не объяснимое качество. Слух имеет свои механизмы, в том числе и механизмы локализации звуковых источников в пространстве, изучением которых не один десяток лет занимаются не самые глупые люди. Понимание этих механизмов в теории позволяет «обмануть» нашу слуховую систему путем введения в акустический сигнал, воспроизводимый фронтальными громкоговорителями, дополнительных частотных и фазовых составляющих. Кроме того, воспроизведение звука в большинстве случаев происходит не в чистом поле, а в помещении. Помещение имеет стены и потолок, которые отражают звуковые волны. Правильно рассчитав конструкцию акустических систем, можно добиться того, что отраженный звуковой сигнал будет приходить к слушателю сбоку и сзади — т. е. имитировать звучание тыловых громкоговорителей.

«Избавиться» же от центрального громкоговорителя не представляет особой сложности — достаточно лишь соответствующим образом «подмешать» его сигнал в звучание правого и левого фронтальных каналов, и звук локализуется в пространстве посередине между ними.

Конечно, реализация этих методов на практике представляет собой значительные трудности, но попытки создания позиционированного трехмерного звука при помощи только фронтальных громкоговорителей ведутся уже давно, и определенные результаты достигнуты. В том числе и в серийно выпускаемых домашних аудио-видео комплектах. Для того чтобы лучше понимать особенности их работы, давайте разберемся, как же устроен наш слух, каким образом он позволяет нам производить локализацию звуковых источников, т. е. определять направление и расстояние до них.

Человеческий слух

Основной особенностью нашего слуха, которая позволяет определить место расположения звукового источника в пространстве, является его бинауральное строение — т. е. тот неопровержимый факт, что человек имеет 2 приемника звуковой информации (уха). Звуковые сигналы, воспринимаемые нашими ушами, обрабатываются в периферической части слуховой системы, подвергаются спектрально-временному анализу, после чего информация поступает в соответствующие отделы головного мозга, где на основе анализа сравнения сигналов, поступивших с каждого из слуховых каналов, делаются выводы о месте расположения звукового источника.

Человеческий слуховой аппарат представляет собой очень эффективное устройство, созданное природой. Удивительным является то обстоятельство, что для большинства звуковых сигналов мы можем определить месторасположение источника с очень высокой степенью достоверности. Конфигурация ушной раковины позволяет осуществлять пространственное декодирование поступающих сигналов и подавать на барабанную перепонку звуковой сигнал, в котором уже содержится информация о месторасположении источника в пространстве.

Очень интересным является то обстоятельство, что для определения месторасположения звукового источника в пространстве слуховая система использует не один, а несколько механизмов, каждый из которых наиболее эффективен при решении определенной задачи.

Механизмы слухового восприятия принято делить на основные и вспомогательные. К основным механизмам обычно относят локализацию по разнице амплитуд приходящих сигналов, временной разнице, а также спектральным различиям звука в правом и левом слуховых каналах. К вспомогательным механизмам обычно относят отражения звука от туловища и плеч человека, анализ реверберационных эффектов, а также эффект психологического восприятия, приводящий слышимое расположение звукового источника в соответствие с его расположением, которое мы видим глазами.

ОСНОВНЫЕ МЕХАНИЗМЫ СЛУХОВОГО ВОСПРИЯТИЯ

Локализация по уровню интенсивности

Этот механизм основан на том, что при излучении звука источником, расположенным под определенным углом к фронтальному направлению, уровень звукового давления на барабанные перепонки в разных ушах будет различным. Это связано с тем, что одно ухо будет находиться как бы «в тени», которую создает голова и туловище. Естественно, разница в уровнях звукового давления на барабанные перепонки будет зависеть от угла расположения источника. Анализируя эту разницу, наш мозг способен сделать вывод о направлении на источник звука. Данный механизм, основанный на разнице уровней интенсивности сигналов, поступающих к ушам, является достаточно эффективным, но лишь на звуковых частотах более 2000 Гц. При длине звуковой волны, сравнимой с диаметром человеческой головы, дальнее от источника ухо перестает находиться в «акустической тени», что обусловлено явлением дифракции звуковой волны на поверхности головы.

Локализация по временной разнице

На более низких частотах в действие вступает механизм анализа фазового сдвига звуковых сигналов, приходящих к разным ушам. За счет «разнесенности» ушей в пространстве звуковой сигнал, приходящий от источника, расположенного под некоторым углом к фронтальному направлению, затрачивает различное время для достижения барабанных перепонок в разных ушах. Это приводит к появлению фазового сдвига в сигналах, пришедших к разным ушам. Данный фазовый сдвиг может быть проанализирован мозгом, и на основании этого анализа делается вывод о направлении на звуковой источник. С повышением частоты (а соответственно, с уменьшением длины звуковой волны) фазовый сдвиг сигналов, пришедших от одного и того же источника к разным ушам, увеличивается, и как только он достигает значения, близкого к половине длины звуковой волны, данный механизм локализации перестает работать, поскольку наш мозг не может однозначно определить, отстает ли звуковой сигнал в одном из слуховых каналов от другого или, наоборот, опережает его. Естественно, чем больше угол между направлением на звуковой источник и плоскостью симметрии человеческой головы, тем больше фазовый сдвиг в пришедших к ушам сигналах. Соответственно, с повышением частоты звука угол, в котором мы можем локализовать источник, пользуясь данным механизмом, уменьшается.

Кроме того, данный метод локализации страдает еще одним ограничением. Представьте себе, что источник звука находится под углом 30 градусов к фронтальному направлению головы. При восприятии звукового сигнала мы получим определенный фазовый сдвиг в левом ухе относительно правого, и на основе анализа этого сдвига наш мозг сделает вывод о расположении источника. Рассмотрим теперь звуковой источник, расположенный под углом 30 градусов к направлению, в котором «смотрит» затылок, или под углом 150 градусов к фронтальному направлению. Для этого источника фазовый сдвиг будет точно такой же, как и для первого. Если не ограничиваться только теми источниками, которые находятся на одном уровне с ушами, а рассмотреть также те, которые располагаются выше или ниже, то можно продолжить наши рассуждения и получить конус с вершиной, расположенной в слуховом канале. На основании этого конуса могут расположиться звуковые источники, для которых разность фаз в правом и левом ушах будет одинаковой. Этот эффект, мешающий точному и однозначному определению местоположения звуковых источников с помощью анализа разности фаз для правого и левого слуховых каналов, получил название «конуса неопределенности». Для того чтобы устранить эту неопределенность, человек пользуется третьим, наиболее эффективным механизмом пространственной локализации звука.

Локализация по спектральной разнице

Еще один механизм локализации звука человеком, который, кстати, является наиболее точным, относится к сложным звуковым сигналам и импульсам, и основывается на возможности анализа спектрального состава звука нашим мозгом. При излучении сложного звукового сигнала (т. е. такого сигнала, в спектре которого присутствуют различные частоты) источником, расположенным под определенным углом к плоскости симметрии головы, спектральный состав звука в правом и левом ушах будет различным. Это связано, во-первых, с экранирующим воздействием головы, которое проявляется сильнее на высоких частотах (поэтому в дальнем от излучателя ухе высокочастотных составляющих будет меньше). Кроме того, ушная раковина человека не зря имеет такую сложную форму — по сути, она является точно рассчитанным частотным фильтром, которым наделила нас природа. Фильтрация звуков различной частоты ушной раковиной зависит от направления на источник. При изменении направления звуковой сигнал по-разному отражается от участков ушной раковины и соответственно происходит усиление и ослабление различных участков спектра принимаемого звукового сигнала. Анализ спектрального состава звукового сигнала, поступающего в слуховые каналы, является также основным механизмом при определении того, находится ли звуковой источник спереди или сзади. Механизмы, основанные на оценке разницы интенсивности и фазового сдвига, о которых мы написали выше, в данном случае практически не работают. Ушная же раковина по-разному фильтрует сигналы, приходящие спереди и сзади, поэтому мы и можем сделать вывод об их месторасположении.

В целом, можно сказать, что наилучшим образом определяется местоположение звуковых источников, которые излучают сигнал со сложным спектральным составом. Чистые тона, которые, кстати, практически не встречаются в природе, поддаются локализации с большим трудом, и разрешающая способность человеческого слуха при этом крайне невелика. Высокие частоты (свыше 8000 Гц) практически не поддаются локализации, точно так же невозможно определить и местоположение источников звука очень низкой частоты (менее 150 Гц) — не зря же производители рекомендуют размещать сабвуферы в домашнем кинотеатре в любом, наиболее удобном для вас месте комнаты прослушивания. Аккуратная спектральная обработка воспроизводимого сигнала является одной из приоритетных задач производителей систем пространственного звучания.

Важно понимать, что наш мозг — это не совсем вычислительная машина, которая, воспринимая импульсы, формируемые в слуховых каналах, производит вычисления по какому-то сложнейшему алгоритму. На самом деле мозг производит не вычисления, а скорее сравнения. Он сравнивает информацию, полученную от ушей, с той информацией, которая уже хранится в нашей памяти. Иными словами, механизм локализации источника основывается, прежде всего, на личном опыте человека. В нашей памяти хранится информация о том, как звучат те или иные источники в разных точках пространства. Когда мы слышим звук, то наш мозг сравнивает поступающую информацию с той, что хранится в памяти, выбирает наиболее подходящую и на основании этого делает вывод о расположении источника в пространстве.

Еще один момент, на который хотелось бы обратить внимание, это то, что точность определения месторасположения звукового источника в пространстве существенно возрастает, когда источник не является неподвижным, а перемещается в пространстве. Это дает нашему мозгу дополнительную информацию, которую он может проанализировать. Если источник является неподвижным, то для его локализации человек подсознательно совершает микроперемещения головы (например, еле заметно поводит ей из стороны в сторону). Этих микроперемещений вполне достаточно, для того чтобы мозг получил информацию, на порядок повышающую точность определения положения источника в пространстве.

ДОПОЛНИТЕЛЬНЫЕ МЕХАНИМЫ ПРОСТРАНСТВЕННОГО ВОСПРИЯТИЯ ЗВУКА

Отражение и экранирование звука плечами и туловищем

При описании процессов пространственной локализации звукового источника необходимо учитывать то, что наши уши находятся в непосредственной близости от плеч и туловища. Распространяющийся звук может отражаться от них или поглощаться, вследствие чего спектральные и временные характеристики звука будут меняться. Человеческий мозг анализирует эти изменения и на их основании делает дополнительные выводы о направлении на звуковой источник. Наибольшее значение данный эффект имеет при определении расположения источников, находящихся выше или ниже головы слушателя.

Реверберация

Как известно, при воспроизведении звука в помещении мы слышим не только прямой звуковой сигнал, но и сигналы, отраженные от стен. Эти сигналы являются результатом многократных переотражений и имеют достаточно сложную структуру. Эффект, при котором затухание звука происходит не сразу, а постепенно, за счет этих самых переотражений, носит название реверберации. Время, за которое уровень звука в помещении снижается на 60 дБ, носит название времени реверберации. Оно характеризует как размеры помещения (в малых помещениях за единицу времени происходит большее количество переотражений и звук затухает быстрее, чем в больших), так и отражающие свойства его поверхностей (стен, пола и потолка). Спектральный состав отраженных сигналов в больших и малых помещениях также отличается, поэтому реверберация несет в себе информацию о размере помещения. Помимо размеров, спектр реверберационного сигнала характеризует материалы, из которых изготовлены отражающие поверхности. Например, реверберация, в которой высок уровень высокочастотных составляющих, ассоциируется с комнатой с твердыми стенами, хорошо отражающими высокие частоты. Если же звук реверберации глухой, то слушатель приходит к выводу, что стены комнаты покрыты коврами, драпировками и прочими абсорберами высоких частот.

Помимо определения характеристик помещения, включение реверберационного сигнала в состав воспроизводимого звука полезно и для определения расстояния до звукового источника. Оценивая отношение уровня прямого звука к отраженному, мы можем сделать выводы о том, находится ли он близко (слабая реверберация) или далеко (сильная реверберация). Имитация реверберации в системах позиционированного объемного звука необходима для передачи пространственного контента. Она дает информацию о размере и характеристиках помещения, расстоянии до звукового источника и таким образом существенно добавляет реализма в воспроизводимую запись.

Для имитации реверберационных эффектов зачастую используют геометрическую модель воспроизводимого звукового пространства. Эта модель учитывает позицию слушателя, звукового источника и отражающих поверхностей. Вводя коэффициенты отражения, геометрическая модель позволяет построить систему мнимых источников, уровень которых ослаблен в соответствии с этими коэффициентами, и получить достаточно правдоподобную реверберационную картину, учитывающую ранние отражения звука от стен.

Особенности психоакустического восприятия

Создание 3-мерного позиционируемого звука с помощью 2 громкоговорителей является весьма сложной, практически не выполнимой на сегодняшний день задачей. Это утверждение было бы справедливо, если бы не одна важнейшая особенность нашего слуха. Дело в том, что при недостатке информации или же при поступлении такой информации, которая не соответствует той, что хранится у нас в памяти, человеческий мозг самостоятельно достраивает звуковую картину до той, которая укладывается в его представления о звуках, существующих в реальном мире. Иными словами, для того чтобы «обмануть» наш мозг, совершенно не обязательно в точности воссоздавать желаемый звуковой образ. Достаточно лишь «намекнуть» ему, чтобы он «извлек из памяти» ту 3?мерную картину, которая нам нужна. В качестве аналогии можно привести метод записи музыки в формате mp3. Всем известно, что в этих записях отсутствует множество информации, которая, казалось бы, просто необходима для адекватного восприятия музыки. Тем не менее, информации все же оказывается достаточно для достаточно достоверной передачи — недостающую звуковую информацию мозг достраивает самостоятельно.

Помимо этого, не следует забывать, что в домашнем кинотеатре помимо звука есть еще и изображение, т. е. наш мозг, помимо звуковой, получает еще и зрительную информацию. Это очень существенный момент, поскольку появление еще одного (кстати, основного) информационного канала позволяет существенно упростить процедуру «введения нашего мозга в заблуждение», а следовательно, добиться пресловутого «эффекта присутствия», к которому мы собственно и стремимся, просматривая фильмы в домашнем кино.

Итак, наш слуховой аппарат использует различные механизмы для определения местоположения источника звука в пространстве. Поскольку все эти механизмы строятся на сравнении поступающих в головной мозг сигналов с теми, что «хранятся» у него в памяти, то, используя определенные алгоритмы обработки звука, можно «обмануть» его и заставить поверить в то, что звуковой источник расположен там, где на самом деле его нет. Именно на этом и построены современные алгоритмы построения 3?мерного звукового пространства в компьютерных играх и, что более важно для нашего издания, домашних аудио-видео системах.

Прежде чем перейти к рассмотрению конкретных алгоритмов построения виртуального звукового окружения, мы рассмотрим основные задачи, которые этим системам приходится решать.

Определение направления на звуковой источник

Как уже упоминалось выше, для определения направления на источник звукового сигнала используются все три основных алгоритма пространственной локализации — по амплитудной разнице сигналов в слуховых каналах, по фазовой задержке звука, пришедшего к правому и левому ушам, а также по оценке спектрального состава звука, трансформированного ушной раковиной в зависимости от направления его распространения.

Вертикальная (высотная) локализация

Все, о чем мы говорили выше, относилось в первую очередь к локализации звукового источника в горизонтальной плоскости. Однако, как нам кажется, мы не раскроем особой тайны, если скажем, что человек может определять направление на звуковой источник не только в горизонтальной, но и в вертикальной плоскости. Механизм определения высоты источника имеет некоторые отличия от способов, описанных выше. Если при оценке угла в горизонтальной плоскости основополагающим инструментом является бинауральное свойство слуха (т. е. наличие двух приемников звукового сигнала — ушей), то определение высоты в основном моноауральное — используется в первую очередь строение ушной раковины. Как уже упоминалось, ушная раковина представляет собой своеобразный частотный фильтр с параметрами фильтрации, зависящими от направления на источник. В сложном звуковом сигнале определенные частоты усиливаются ушной раковиной, а другие, наоборот, ослабляются. При изменении высоты источника частотная характеристика сигнала, поступающего в слуховой канал, также будет меняться.

Определение расстояния до источника

Помимо того, что человек может определять направление на звуковой источник, свойства слуха позволяют ему оценивать и расстояние до него. Одним из механизмов определения расстояния является оценка интенсивности звукового сигнала. Например, при относительно небольших расстояниях увеличение расстояния до источника в 2 раза соответствует изменению уровня звукового давления на 6 дБ. Однако данный механизм не всегда оказывается работоспособным, поскольку уровень звука от слабого, но близко расположенного источника может быть таким же, как от мощного, но удаленного на значительное расстояние.

При малых расстояниях до источника в действие вступает механизм оценки изменения спектральных составляющих сложного сигнала, которое происходит в связи с искажением фронта звуковой волны головой и ушными раковинами.

Одним из важнейших механизмов, позволяющих нам определять расстояние до источника в помещении, является сравнение прямых сигналов и отраженных от стен и потолка. Таким образом, эффект реверберации позволяет использовать один из наиболее точных механизмов локализации звукового источника в помещении.

Воспроизведение звука движущихся объектов

Для того чтобы правдоподобно передать звук от движущегося источника, недостаточно только тех механизмов, которые были описаны выше. В соответствии с эффектом Доплера частота звука движущегося источника изменяется (звук становится более высоким при приближении объекта и более низким при его удалении). При прохождении объекта мимо позиции слушателя его звук резко меняет тональность.

Поглощение звука в воздухе

При передаче звучания удаленных объектов необходимо учитывать, что воздух поглощает высокие частоты значительно сильнее, чем низкие. Это означает, что чем дальше от вас находится виртуальный звуковой источник, тем более глухим должен быть его звук.

Огибание препятствий

Сюжеты кинофильмов зачастую подразумевают, что звук приходит к слушателю из-за препятствия, расположенного на пути к его источнику. Для того чтобы симулировать звук из-за препятствия, необходимо учитывать, что волны с малыми по сравнению с размерами препятствия длинами не смогут его обогнуть, и будут эффективно гаситься. Таким образом, высокочастотные составляющие звука источника, расположенного за препятствием, будут сильно ослаблены по сравнению с низкочастотными.

МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ ВИРТУАЛЬНОГО ЗВУКОВОГО ОКРУЖЕНИЯ

Бинауральное воспроизведение звука

Одним из методов построения 3?мерного звукового пространства с помощью 2 громкоговорителей являются так называемые бинауральные звуковые системы. Идея бинауральной записи и воспроизведения появилась достаточно давно и заключается в следующем: предположим, что у нас есть возможность расположить два микрофона с абсолютно линейной амплитудно-частотной характеристикой непосредственно в слуховых каналах головы человека. В этом случае звуковые сигналы, воспринимаемые этими микрофонами, будут содержать в себе всю информацию, необходимую для определения месторасположения звукового источника головным мозгом (об этом мы писали выше). Предположим, что нам удалось без изменений записать эти сигналы. Если затем подать их на головные телефоны (наушники) которые мы смогли бы поместить на место микрофонов, т. е. опять непосредственно в слуховые каналы, то воспринимаемый нами звук соответствовал бы первичному звуковому полю источника и также содержал бы всю необходимую информацию для локализации его источника в 3?мерном пространстве.

Эксперименты по созданию бинауральных звуковых систем проводились с помощью специального манекена, имитирующего человеческую голову, и продолжаются по сей день. Нужно отметить, что в этом направлении были достигнуты значительные успехи. Например, отмечено, что при бинауральной схеме звуковоспроизведения значительно повышается способность слушателя к локализации звуковых источников в 3?мерном пространстве, значительно усиливается так называемый «эффект присутствия», который и является нашей целью в домашних развлекательных системах.

Однако, как легко догадаться, не все так гладко, иначе про обычную стереофонию и многоканальные системы домашнего кинотеатра мы бы уже давно забыли. Во-первых, все люди разные и у всех отличаются формы головы, тела, ушной раковины и т. д., поэтому записи, сделанные с использованием «искусственной головы», носят более чем усредненный характер, а этого порой бывает недостаточно для того, чтобы ввести в заблуждение наш мозг и создать иллюзию 3?мерности. Во-вторых, даже произведя идеальную запись сигнала непосредственно в ушных каналах «искусственной головы», мы не имеем возможности излучать записанные сигналы в слуховых каналах реального слушателя. В третьих, не существует аппаратуры, которая могла бы абсолютно точно записывать и воспроизводить звук (любая аппаратура вносит свои изменения, а в данном случае важны мельчайшие нюансы). Наконец, многие просто не любят прослушивать музыку в наушниках, испытывая при этом значительный дискомфорт. Этот дискомфорт в частности связан еще и с тем, что при использовании качественных студийных или Hi-Fi наушников закрытого типа наши ушные раковины оказываются прижатыми к голове, а такое положение является для них неестественным, что приводит к снижению точности пространственного восприятия и быстрой утомляемости.

Широкому распространению бинауральных звуковых систем мешает также и то, что записи для них, очевидно, должны быть сделаны специальным образом (обычные стерео записи не подойдут, поскольку они не несут всей необходимой для пространственной локализации информации). Такие записи в принципе есть, но их крайне немного, да и стоят они достаточно дорого, поэтому их следует рассматривать скорее как демонстрационный материал, нежели как возможность использования в системах домашнего развлечения.

Функции HRTF

Идея записи и воспроизведения 3?мерного звука с помощью бинауральных систем получила свое развитие с появлением и совершенствованием процессоров звуковой обработки. Действительно, звуковой сигнал, поступающий в слуховые каналы человека, получается за счет определенной трансформации (по частоте, фазе и уровню) сигнала, излучаемого источником звука. Функции, по которым производится данная трансформация, получили название HRTF (Head Related Transfer Function, или Передаточная Функция Головы). Стоит ли говорить, что эти функции слишком сложны для того, чтобы их можно было получить обычными вычислительными методами. Как правило, эти функции получают экспериментальным путем, измеряя параметры звукового сигнала с использованием описанных выше манекенов. Проведение многочисленных экспериментов позволило разработчикам пространственных звуковых систем создать значительную базу данных, использование которых в современных звуковых процессорах позволяет добиться впечатляющих результатов. Действительно, если звуковой процессор, занимающийся обработкой сигнала, обладает достаточным быстродействием для расчета звуковых характеристик с использованием HRTF в реальном времени, то система, в которой он работает, сможет создавать 3?мерное звучание без использования специальных бинауральных записей и головных телефонов в слуховых каналах. Кстати, библиотека HRTF фильтров создается в результате лабораторных измерений, производимых с использованием манекена, носящего название KEMAR (Knowles Electronics Manikin for Auditory Research) или с помощью специального «цифрового уха».

Crosstalk Cancellation

Современные процессоры позволяют обходиться вообще без наушников, а использовать обычные акустические системы, применяя так называемый алгоритм Crosstalk Cancellation. Суть этого алгоритма в следующем. Предположим, что мы используем сигнал, обработанный звуковым процессором с использованием функций HRTF на обычных акустических системах. Предположим также, что используемые в процессоре функции позволяют учесть тот факт, что звуковые сигналы излучаются не наушниками, а удаленными от слушателя громкоговорителями. Однако даже при этом мы не сможем просто так получить желаемый результат. Дело в том, что наушники без проблем позволяют подвести сигнал, предназначенный для правого уха, именно к этому уху и только к нему, левое ухо его слышать не будет. То же самое можно проделать с сигналом, предназначенным для левого уха. В случае использования обычных громкоговорителей это, к сожалению, невозможно. Сигнал, излучаемый левым громкоговорителем, будет восприниматься обоими ушами — и левым, и правым, и наоборот. Предположим, что при помощи 2 акустических систем необходимо спозиционировать виртуальный звуковой источник, находящийся в определенной точке слева от слушателя. Если запись звука этого источника производилась двумя микрофонами, разнесенными на расстояние, эквивалентное расстоянию между ушами, то вполне вероятна ситуация, когда правое ухо вначале услышит кросстолк-сигнал с левого громкоговорителя и лишь затем полезный сигнал с правого. В силу эффекта Хааса (или иначе, эффекта предшествования) полезный сигнал правой колонки в этом случае будет полностью проигнорирован. Эффект Хааса заключается в том, что при обработке пакета аудио информации, состоящего из отдельных звуковых импульсов, слегка разделенных во времени, наш мозг использует только первый импульс для вычисления направления на источник, приписывая всем последующим те же самые пространственные координаты. В рассмотренной выше ситуации слушателю будет казаться, что звучит только левая (т. е. ближайшая к записанному виртуальному источнику) колонка. Пространственной звуковой панорамы в этом случае получить не удастся.

Для того чтобы устранить негативное влияние кросстолк сигнала в том или ином канале на восприятие аудио информации, был разработан алгоритм Crosstalk Cancellation, который подразумевает «подмешивание» в левый громкоговоритель сигнала, предназначенного для правого громкоговорителя, но с определенной задержкой во времени. Эта задержка подбирается таким образом, чтобы звук, пришедший к правому уху от левого громкоговорителя, оказался в противофазе с «подмешанным» сигналом от правого громкоговорителя. При этом они нейтрализуют друг друга, и левое ухо будет воспринимать только сигнал с левой колонки, а правое — только с правой.

Даже в теории, как видите, все получается достаточно непросто, на практике же построение 3?D звука с помощью двух акустических систем является архисложной задачей. В частности, все расчеты, о которых мы написали выше, можно произвести только для конкретной области прослушивания, которая называется Sweet Spot (дословно — «сладкое пятно»). Как только слушатель покинет пределы этой области, алгоритм Crosstalk Cancellation, естественно, перестанет работать, поскольку требуемые сигналы перестанут приходить в противофазе. Естественно, очень многое зависит и от характеристик самого звуковоспроизводящего тракта и в первую очередь от акустических систем.

Впрочем, на практике ситуация не такая уж безнадежная. Чрезмерная чувствительность алгоритма Crosstalk Cancellation проявляется только на высоких частотах (более 1 кГц), где содержится не так уж много звуковой информации, а голова начинает служить хорошим экраном от проникновения паразитного кросстолк-сигнала и, следовательно, необходимость в его применении становится меньше.

Большинство производителей все же пока ограничивается использованием упрощенных алгоритмов построения 3?D звука с применением усредненных (подходящих для большинства людей) функций HRTF. В результате, создаваемая звуковая картина также получается весьма усредненной, либо же не получается вовсе.

Системы виртуального окружения, работающие по принципу отражения от стен комнаты прослушивания

Для того чтобы создать эффект виртуального звукового окружения, вовсе не обязательно производить сложную процессорную обработку аудиосигнала. Можно воспользоваться тем обстоятельством, что аудиосистемы в большинстве своем работают в закрытых комнатах, в которых есть отражающие звук поверхности — стены, пол и потолок. Именно этот принцип использует, к примеру, английская компания KEF, выпустившая систему громкоговорителей, состоящих из традиционного для этой компании модуля UniQ, обеспечивающего звучание фронтальных и центрального каналов, а также плоских звуковых панелей NXT, расположенных по бокам акустических систем и излучающих звук тыловых каналов. При корректном расположении акустических систем относительно места прослушивания и стен помещения звук тыловых каналов, отраженный от стен помещения, придет к слушателю не спереди, а сбоку, обеспечив таким образом правдоподобное окружение.

Системы, использующие только процессорную обработку

В принципе, к системам, использующим процессорную обработку для создания эффекта виртуального окружения, можно отнести практически любой современный AV-ресивер. Почти все эти аппараты имеют тот или иной алгоритм для имитации тыловых эффектов при помощи только двух громкоговорителей. Интересное решение предложила немецкая компания AUDICA, производящая стильные дизайнерские акустические системы. В нашем тесте приняла участие 2?канальная система виртуального окружения, однако в ней использованы не 2 фронтальных громкоговорителя, а фронтальный и тыловой. Эти акустические системы располагаются горизонтально (наподобие АС центрального канала в обычных 5?канальных театральных системах) и имеют возможность подключения сразу нескольких каналов (правого, левого и центрального для фронтальной АС и левого и правого тыла для задней колонки). При этом каждый канал звуковоспроизведения использует свой собственный набор динамических головок, заключенных в едином корпусе. Данные АС требуют подключения к обычному AV-ресиверу, и, как показал дальнейший тест, их желательно использовать с теми или иными алгоритмами расширения звукового пространства.

Системы, использующие особую конфигурацию динамиков и процессорную обработку

Как мы уже упоминали, разработка и применение комплекса функций HRTF для системы, воспроизводящей звук через обычные громкоговорители, является очень сложной задачей. В связи с этим многие производители идут на определенный компромисс, проводя обработку звука по упрощенному алгоритму, но зато используя специальную конфигурацию установки динамиков в громкоговоритель.

Например, компания POLK AUDIO предложила горизонтальный громкоговоритель Surround Bar, в котором основной сигнал виртуального тыла подается на один комплект динамиков, а корректирующий сигнал для устранения кросстолк-эффекта — на другой комплект динамиков, отстоящих от основных на расстояние, примерно равное расстоянию между человеческими ушами.

Компания ALEKS Digital Technology предложила использовать комплект, состоящий из горизонтальной АС с тремя комплектами фронтальных динамиков и двумя боковыми, расположенными на торцах колонки. Эффект виртуального окружения достигается за счет аналоговой обработки аудиосигнала, которая, манипулируя фазовыми сдвигами, позволяет подать необходимый сигнал на тот или иной комплект динамических головок.

Очень интересное решение предложила датская компания FINAL, известная производством электростатических громкоговорителей самого высокого уровня. FINAL предложил систему, в которой звук, подвергаясь процессорной обработке, подается на 2 фронтальные электростатические системы. Как известно, электростаты имеют биполярную характеристику направленности. Подавая на них дополнительный сигнал с фазовой задержкой, можно получить практически однородное звуковое пространство, окружающее слушателя в любой точке комнаты прослушивания.

Звуковые проекторы

Японская компания YAMAHA, известная своими многочисленными достижениями в области цифровой обработки звука, продолжает развивать направление звуковых проекторов, которые стали весьма успешным коммерческим продуктом в ряде стран мира. Идея звукового проектора заключается в размещении большого количества динамических головок в одной плоскости громкоговорителя. Каждый из динамиков имеет собственный усилитель и управляется цифровым процессором, который может производить фазовые манипуляции. Таким образом, звуковой проектор YAMAHA представляет собой фазированную антенную решетку. Варьируя фазы звуковых сигналов, поступающих на те или иные динамики, можно управлять направленностью звука всего проектора. При необходимости получить эффекты тыловых громкоговорителей можно направить звуковые лучи таким образом, чтобы они, отразившись от стен комнаты прослушивания, достигли зрительского места сбоку или сзади.

Теперь, изучив «матчасть», можно смело приступить к прочтению второй части данной статьи, которая заключается в тестировании нескольких комплектов виртуального звукового окружения. Как и следовало ожидать, эти системы построены с использованием различных принципов и выступают в самых разных ценовых категориях. Нам было очень интересно узнать, как теория, о которой мы столько написали, соотносится с практикой, и возможно ли уже сегодня создать по-настоящему работоспособную систему, имитирующую объемный звук при помощи одного или двух громкоговорителей.

22 мая 2007

Статья о неполном раскрытии распространении звука в относительно замкнутом пространстве, можно подумать звук распространяется в виде прямых лучей и больше никогда, и никуда не от чего не отражается. Самая обычная теория объяснения необъяснимого.

Серега

22.03.2012

Дуже толково.

Системы виртуального пространственного звучания

Человеческий слух

ОСНОВНЫЕ МЕХАНИЗМЫ СЛУХОВОГО ВОСПРИЯТИЯ

ДОПОЛНИТЕЛЬНЫЕ МЕХАНИМЫ ПРОСТРАНСТВЕННОГО ВОСПРИЯТИЯ ЗВУКА

МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ ВИРТУАЛЬНОГО ЗВУКОВОГО ОКРУЖЕНИЯ

Комментарии

Похожие статьи

Вся музыка для авто

Компания Harman напрямую занимается поставками потребительской электроники в Россию

Кремль. Ночная видеосъемка Sony Cyber-Shot DSC-RX100 M3: хороший цвет, но неуверенность при фокусировке

Мини-обзор компактной фотокамеры Samsung Galaxy Camera 2

Картридер для iOS PhotoFast 4K iReader - разумный выбор

Фестиваль «Первозданная Россия» - природа страны в фотографиях

За кадром - Павел Маркин

Лазерная дюжина

Мини-обзор компактной фотокамеры Sony Cyber-shot DSC-WX350

Курс Варвары Гладкой: «Портрет — история о человеке»