Технология 3d звука кратко

Обновлено: 05.07.2024

Строение человеческого слуха подразумевает стереоскопичность восприятия. Давайте проведем параллель с нашими органами зрения. Поднесите палец на расстояние 10 сантиметров от своего носа. Закройте правый глаз, и палец сместится несколько влево, а, закрыв левый глаз, вы получите обратный эффект. Это расстояние разницы между видимыми ощущениями правого и левого глаз именуется параллаксом. Если этот опыт повторить и расположить палец на более дальнее расстояние, параллакс станет меньше. В принципе, это и есть основа нашего трехмерного (3D-видения). Явление параллакса не случайно, поскольку позволяет не только видеть предметы в объеме, но и определять расстояние до них, что, по сути, очень взаимосвязано.

Звук мы также слышим в трехмерном пространстве, используя другие органы - парные органы слуха, но, с некоторым отличием… Воспринимаемый диапазон частот световых волн равен 4 - 7,5 * 10 в четырнадцатой степени Гц, к этому следует прибавить предельную скорость света. Звуковые волны находятся в гораздо более низком диапазоне 20 Гц - 20 КГц и скорость звука намного меньше (ок. 340 м/с). В этом заключается принципиальная разница восприятий.

Если в свете распространены длины волн во много раз меньшие, чем расстояние между глазами и предельная скорость распространения световых волн, то в звуке длины волн на низких частотах превышают расстояние между правым и левым ухом. В результате чего мы в некоторых диапазонах просто физически не можем ощутить слуховой "параллакс" или, как мы его назовем, бинауральную локазацию. Допустим, у нас есть источник, излучающий звук с частотой 20 Гц, при скорости звука в 340 м/с, длина волны будет составлять 17 м (длина волны численно равна частному скорости от частоты или произведению скорости на период).

Среднее расстояние между правым и левым ухом равняется 0,2 м. Соотвественно, если мы повернемся к источнику правой стороной, то временная разница между тем как звук пришел в правое ухо, а потом в левое будет составлять примерно 1,2 % от всего периода 20 Гц волны. Соответственно, ни о какой бинауральной локализации источника и речи быть не может. В диапазоне от 300 до 1000 Гц наш мозг может анализировать фазовый сдвиг и определять локализацию источников звука. С диапазоном выше 1КГц ситуация меняется, поскольку волны с этими частотами начинают быстро затухать и мозг производит больше не фазовую бинауральную локализацию, а амплитудную. В результате, мы имеем три зоны бинауральной локализации и два типа ее осуществления.

В принципе, данный подраздел уже говорит о получении и обработке информации нашим мозгом.

Джордж Лукас, режиссер и автор "Звездных войн" утверждал, что звук - это 50% человеческого восприятия при просмотре кинокартины, поэтому он разработал стандарт THX, который бы хоть как-нибудь уравновешивал технологии звука в записи и воспроизведении. Лукас был удивлен тому, что звук в студии при монтаже фильма сильно отличается от звука в кинотеатрах… Во-многом, поэтому многоканальные системы стали развиваться в другом направлении. Звукорежиссеры стали изучать психоакустику.

Далее…



Бинауральные модели стали испытываться еще с начала XX века. Вы видите перед собой манекен, где вместо правого и левого уха вставлены микрофоны. На базе анализа входящих данных можно было создать математический алгоритм локализации объектов в реальном пространстве и их человеческих ауральных ощущений. Об этом после…

История

Исследованиями природы звука люди стали заниматься достаточно давно. Догадаться о том, что звук имеет волновую природу совсем нетрудно - достаточно посмотреть на колебания натянутой струны, закрепленной с обоих концов. Первые серьезные исследования в этой области стал проводить Пифагор (6 в. до н. э.), который доказал зависимость высоты тона от длины струны и вывел определенный звукоряд, впоследствии долгое время применявшийся в музыке. Чуть ближе к нам по сетке времени Аристотель, который предположил, что звук - это упругие колебания воздуха. В 18 веке русский ученый М.В. Ломоносов доказал, что газы, в том числе и воздух, обладают свойством упругости. А 1807 год можно считать ключевым в истории звука, поскольку в это время английский ученый Томас Юнг окончательно установил его природу. Причем в качестве подручных средств он использовал шип розы, бокал и закопченое стекло. Прикрепив сургучом шип к бокалу и, направив конец иглы на поверхность стекла, ученый ударил по бокалу, заставив его звенеть и в это время начал смещать стекло. В результате на закопченной поверхности появилась извилистая линия, которая, как мы теперь уже знаем, соответствовала форме звуковой волны. В этом же году, Юнг создал первый самописец, состоящий из камертона и закопченного цилиндра.

Теперь перенесемся во Францию, во Французский Институт. В этом же, 1807 году, математик и физик Жан Батист Жозеф Фурье представляет доклад о синусоидальном представлении температурных распределений. Данная научная работа содержала спорное утверждение о том, что любой непрерывный периодический сигнал может быть представлен суммой выбранных должным образом сигналов синусоидальной формы. К сожалению, эта работа была отклонена, так как против предположения Фурье высказался не менее знаменитый математик Жозеф Луи Лагранж, состоявший тогда в комитете института. Он сказал, что данный метод неприменим к разрывным функциям, например, таким как сигнал прямоугольной формы. В частности правы были оба. Но работа Фурье, ставшая ключевой для современной науки, была издана на много лет позже (в 1822 году), уже после смерти Лагранжа.

В 1827-м известный немецкий физик Георг Ом высказал предположение, что воспринимаемый нами звук - это сумма синусоидальных колебаний, и человеческое ухо способно разлагать его спектр на частотные составляющие (простые тона). Впоследствии это и подтвердилось открытием Фурье, которое применили к описанию звуковых колебаний.

Трехмерная звуковая модель

Окружающие нас звуки имеют сложную структуру, поскольку состоят из множества простых частотных составляющих. Благодаря открытиям Фурье, Ома, Юнга и их последователей мы сейчас имеем дело с современным трехмерным представлением звуковой модели.

Трехмерная модель представления сложной звуковой волны.

Если посмотреть на эту проекцию слева, то можно увидеть амплитудно-временной график, практически тот же, что получил Юнг на самописце, и с которым мы привыкли работать в звуковых редакторах.

Амплитудно-временное представление сложной звуковой волны.

Если будем смотреть справа, то получим спектрограмму (то, что предложил Фурье и предположил Ом).

Амплитудно-частотное представление сложной звуковой волны (спектрограмма).

Трехмерный звук во всех своих проявлениях — многоканальные системы и наушники, записи, создающие иллюзию трехмерного звука для стереонаушников (например, такая), саундбары — прочно вошел в современный обиход.

Всё это построено на одних принципах, всё это давно стало атрибутами будущего, которое уже наступило.

Тем любопытнее, что история схожих устройств насчитывает не один век. Интересно?

Если говорить коротко и упрощенно, любая система объемного звука строится на знаниях о том, как человеческое ухо воспринимает звук и определяет его местоположение его источника.

Напомню — все дело в разности времени восприятия ушами звука и разности уровня звука в разных ушах. Искажения, позволяющие установить местоположения источника, вносятся в звук ушной раковиной, головой и торсом. Сочетание этих и других подобных факторов позволяет определять направление, откуда доносится звук.

На этом покончим с теорией.

Перейдем к практике.

И начнем мы с стетофона. Данный инструмент, представлявший собой апгрейженный стетоскоп, был представлен Королевскому Обществу в 1858 году Сомервиллем Скоттом Алисоном.

Кстати, впоследствии подобные устройства сыграли значительную роль и в изучении обработки звука человеческим мозгом.

Примером подобных опытов являются опыты Юнга — Пола Юнга, исследователя звука, а не Карла Густава, психолога, прошу заметить.

Так вот, Пол Юнг сильно увлекался этой темой. Настолько, что некоторое время проходил в подобном украшении со шлангами, завернутыми так, чтобы приемники звука находились непосредственно у противоположных ушных раковин.

Таким образом, была выявлена большая важность психологического восприятия, веры, если хотите, в восприятии направления звука.

Впрочем, перейдем к следующему экспонату — своеобразной вершине акустических инструментов познания 19-го века.

Псевдофон Томпсона — предтеча тех самых наушников за несколько сотен баксов, на которые сейчас облизывается практически каждый геймер.

Неказистое порождение сумрачного гения в своей простоте, простите за тавтологию, гениально. Настраивая углы заслонок в горизонтальной и вертикальной плоскостях, можно было добиться иллюзии звука, направленного из точки, где никаких источников звука в принципе не было. Регулируя не только уровень звука, но и искажения, псевдофон был большим скачком вперед по сравнению с стетофоном.

Статья об инструменте была опубликована изобретателем, Сильванусом Томпсоном, в 1879 году в Philosophic Magazine.

Псевдофон по сути дела хардварно выполнял то, что сейчас делается программно, путем использования HRTF-алгоритмов. Если пофантазировать в стиле стимпанка — приделайте к заслонкам механический привод — и наслаждайтесь трехмерными операми через полноценные 3d-наушники.

Хотя зачем фантазировать? Я представляю вам…

Театрофон (Théâtrophone) — гениальную систему, которая передавала по телефонным проводам в режиме фулл онлайн бинаурально записанный (хотя пока не слишком трехмерный, но стремящийся к этому, можно сказать, с расширенной виртуальной сценой!) стереофонический звук с театральных представлений. В разработке использовались те самые, только что начавшие поступать данные о том, как следует записывать звук для двух ушей.


Система была представлена в 1881 году Клементом Адером. Первое коммерческое применение бинауральных технологий, создававшее продвинутое стерео в эпоху моно. А вы говорите — virtual barber shop на ютюбе послушать, cutting, блин, edge technology, трехмерный звук из наушников…

Посмотритесь в зеркало. Примерно такое же выражение лица было у потенциальных покупателей. Неудивительно, что компания прогорела. Но начало было положено.



Так выглядел пульт управления той самой системой образца 1967

Этот концерт положил начало недолгой эпохе квадрофонического звука. К сожалению, в силу несовершенства технологии и титанических размеров четырех колонок, расставленных по всей комнате и вызывавших ужас у домашних и близких аудиофилов, мода канула в лету.

Последующий этап был этапом еще более недолгого торжества амбиофонии — одной из попыток прикрутить принципы бинаурального восприятия звука к стерео- и многоколоночным системам.


Задачей при разработке амбиофонии ставилось нивелировать так называемы ICA — внутренние слуховые перекрестные искажения, вызываемые тем, что при использовании колонок левое ухо слышит то, что предназначено только для правого и наоборот. При использовании наушников таких проблем не возникало, так как наушники позволяют четко разделить звук для каждого уха. Наиболее в этом плане отличились компании Carver Corporation и Polk Audio.

Впрочем, век амбиофонии был не слишком долог. В 1987м году дебютировала первая цифровая 5.1 система, созданная французом по имени Dominique Bertrand, установленная в знаменитом парижском Мулен Руж.

До первого использования кодека AC-3 в кино оставалось 5 лет.

Крайний на данный момент этап развития подобных систем — 2004 год.

В этом году Polk Audio выпустили в продажу первый в истории soundbar (т.н. звуковую панель), обеспечивающий звук сзади и по бокам из одной колонки спереди.


Линейка получила название Polk Audio SurroundBAR и развитие ее продолжается до сих пор.

За Polk'ом последовали Yamaha, Philips и прочие большие и малые компании — всех не перечислить.

Каким будет следующий этап развития трехмерного звука?

Кто знает? Точно не я.

Знаю одно — все они, по сути, развитие и оцифровка маленькой железяки, которую собрал Томпсон в 1879-ом.

Однако при очевидном (в прямом смысле) прогрессе на ниве визуализации звуковое сопровождение оставалось на прежнем уровне: в лучшем случае стереофонический звук, с частотой дискретизации 11…22 кГц. Разработчики игровых приложений могли управлять всего лишь двумя параметрами источников звука: панорамированием и уровнем громкости. На определенном этапе стало ясно, что постоянно возрастающие требования к реалистичности игрового действа в целом (а не только к видеоряду) должны затронуть и звуковую подсистему. Так что возникновение технологий трехмерного звука было вполне закономерным явлением.

Нельзя сказать, что технологии 3D-звука выросли на пустом месте. Исследования в этой области проводились различными исследовательскими группами еще задолго до появления компьютерных игр.

Фактически существовали два направления развития так называемого 3D-звука:

Технологии первого семейства в большинстве своем весьма просты в реализации, но не способны реализовать трехмерное позиционирование источников звука, а представители второго вследствие своей сложности не могут быть использованы в интерактивном режиме. В результате возникло новое, третье направление, называемое интерактивным трехмерным позиционируемым звуком. О нем и пойдет речь в этой статье.

3D: как много в этом звуке…

Вполне понятно, что для полноценного функционирования рассматриваемой технологии требуется как специализированное аппаратное обеспечение (звуковые карты, акустические системы и т.д.), так и наличие программной поддержки. Подобно визуализации трехмерных сцен управление позиционированием звуковыми потоками и имитация акустических условий виртуальных помещений требует значительных вычислительных ресурсов. Следовательно, на звуковой карте необходимо иметь высокопроизводительный звуковой процессор (rendering engine, или sound engine). Для наиболее полного использования потенциала такой звуковой карты, как правило, требуются многоканальные акустические системы. И наконец, необходим специализированный набор команд (API), при помощи которого разработчик программного обеспечения сможет управлять работой аппаратных ресурсов. Рассмотрим, каким образом взаимодействуют между собой эти компоненты.

Теперь стоит остановиться на наиболее значимых моментах. Очень важно понимать разницу между API и sound engine, поскольку это далеко не одно и то же. Большинство современных звуковых API аппаратно-независимы, то есть могут обеспечивать воспроизведение трехмерного позиционируемого звука при работе с различными звуковыми процессорами. предположим, например, что игра написана под DirectSound 3D (вообще говоря, разработчики могут использовать и более одного API для обеспечения большей совместимости). Это значит, что мы услышим трехмерный позиционируемый звук и на картах Creative, и на картах с чипами Aureal Vortex, и на многих других. Вполне понятно и то, что качество звукового сопровождения одной и той же игры при использовании различных звуковых карт и акустических систем может существенно различаться — подобно тому, как будет различаться звучание одного и того же MIDI-файла при проигрывании на разных синтезаторах.

В том случае если звуковая карта не имеет аппаратной поддержки функций 3D-звука2, роль rendering engine перекладывается на программный процессор — HEL (Hardware Emulation Layer), и мы слышим трехмерный звук даже на обычной стереофонической звуковой карте. Естественно, в этом случае будет задействована часть ресурсов центрального процессора, что повлечет за собой снижение частоты кадров (fps). В силу того что HEL использует упрощенные алгоритмы, качество звучания будет несколько хуже, чем при использовании специализированных аппаратных процессоров.

Теперь стоит рассмотреть проблему с точки зрения слушателя.

Что и как мы слышим

Слышимый обычным человеком частотный диапазон простирается от 20 Гц до 20 кГц. Колебания с частотами, лежащими ниже этого диапазона, называются инфразвуком, а выше — ультразвуком. Условно весь слышимый диапазон можно разделить на три области: высокочастотную, среднечастотную и низкочастотную. Сигналы низкочастотной части слышимого спектра воспринимаются не только ушами, но и телом (как вибрации). Слуховой аппарат человека имеет нелинейную АЧХ (амплитудно-частотную характеристику). Пик чувствительности приходится на область 1…3 кГц, а на краях диапазона (то есть в области низших и высших частот) наблюдается плавный спад3. Кроме того, при уменьшении громкости чувствительность слуха на краях диапазона будет снижаться быстрее, чем в середине4. При равной громкости сигналы более высокой частоты маскируются низкочастотными сигналами. Слух обладает инерционностью, то есть в течение некоторого времени после громкого звука более тихие не будут восприниматься.

Многим, наверное, кажется парадоксальным тот факт, что, обладая всего двумя ушами, мы можем определить положение источника звука в окружающем нас пространстве, имеющем три измерения. В основе механизма локализации (то есть определения местоположения источника звука) лежит сравнение звуковых сигналов, слышимых правым и левым ухом, а также анализ спектра воспринимаемого сигнала. Условно этот процесс можно разделить на две составляющие — определение направления на источник звука и степени его удаленности (иначе говоря, расстояния до него).

Наибольшую значимость для определения направления на источник звука имеют два параметра — разница по интенсивности (громкости) и по времени между сигналами, воспринимаемыми правым и левым ухом. Предположим, что некий источник звука расположен точно перед слушателем на высоте его головы (рис. 1). Сигнал от этого источника распространяется с равной скоростью во всех направлениях, поэтому звуковая волна достигнет обоих ушей одновременно, а интенсивность воспринимаемых сигналов будет одинаковой. Теперь сместим источник в какую-либо сторону по горизонтали, например влево. Теперь картина несколько изменится: путь звуковой волны до левого уха стал короче, и поэтому в правое ухо она попадает с некоторой задержкой (рис. 2). Кроме того, правое ухо в данной ситуации оказалось частично закрыто головой, и, огибая ее, звуковая волна потеряла часть своей энергии; таким образом, интенсивность сигнала, принятого этим ухом, оказалась меньше.

Несколько сложнее обстоит дело с источниками звука, расположенными позади слушателя. Помимо рассмотренных выше факторов в этом случае играет роль и изменение спектра сигнала. Обратите внимание на довольно сложную форму ушной раковины, которая выполняет функцию многополосного частотного фильтра. Именно по характерным изменениям спектра мозг может определить, спереди или сзади находится источник звука. Подобным образом определяется и местоположение источника звука, смещенного в вертикальной плоскости.

Предположим, что слушатель и источник звука находятся в закрытом помещении, имеющем форму параллелограмма. Помимо прямого звука, поступающего к слушателю по кратчайшему расстоянию непосредственно от источника, будут иметь место и так называемые отраженные звуки (рис. 3). Поскольку отраженные звуки имеют меньшую интенсивность, чем прямой звук (потому что часть энергии поглощается конструкциями помещения при отражении от них), и поскольку они проходят больший путь, они поступают к слушателю с некоторой задержкой, величина которой зависит от размеров помещения. Среди отраженных звуков различают ранние и поздние отражения. Ранние отражения (early reflections) довольно четко различимы на слух (они достаточно редки, и их можно четко отделить друг от друга), тогда как поздние (late reflections) сливаются и образуют характерное послезвучие (гулкость). Как вы уже, наверное, догадываетесь, интенсивность и длительность отраженных звуков зависят как от размеров и формы помещения, так и от свойств материалов, которыми отделаны его внутренние поверхности. Для того чтобы оценить расстояние от слушателя до источника звука, необходимо проанализировать отношение громкости прямого звука к отраженному: чем оно больше, тем ближе располагается источник. Можно создать весьма реалистичную иллюзию приближения или удаления объекта, управляя всего двумя параметрами — уровнем прямого и отраженного звука5. Исключение составляет тот случай, когда источник звука расположен в ближнем поле, то есть уровень его сигнала много больше уровня реверберации.

Теперь расположим между источником звука и слушателем какое-либо препятствие (например, колонну). Вследствие того что звук проникает не сквозь препятствие, а огибая его, параметры воспринимаемого слушателем сигнала заметно изменятся. Этот эффект называется обструкцией. В случае когда мы имеем дело со сплошным препятствием (скажем, если разделить рассматриваемое помещение деревянной стеной), то в результате прохождения через это препятствие характеристики звука (в частности, его АЧХ) также претерпят существенные изменения. Подобные явления называется окклюзиями.

Точность локализации неодинакова в различных зонах. Наилучшим образом определяется положение источников звука, расположенных в горизонтальной (точнее, проходящей через воображаемую линию между ушами и параллельной полу) и вертикальной (равноудаленной от ушей) плоскостях, при этом точность локализации в горизонтальной плоскости выше. Проще говоря, определить местоположение источника звука, расположенного строго перед слушателем, гораздо проще, чем если бы источник располагался справа вверху. Точность локализации также зависит и от спектра сигнала, излучаемого источником, — чем выше частота звука, излучаемого источником, тем лучше он локализуется. Сигналы низкой частоты, не имеющие высших гармоник6, практически не локализуются.

Теперь посмотрим, что на сегодняшний день предлагают нам ведущие компании, занимающиеся 3D-звуковыми технологиями.

Основные игроки и их разработки

A3D компании Aureal

В отличие от подавляющего большинства современных API 3D-звука, A3D был создан специально для чипов серии Vortex. Пожалуй, это единственный на сегодняшний день аппаратно-зависимый API в области 3D-звука, поэтому его работу имеет смысл рассматривать в тандеме с соответствующим аппаратным обеспечением.

На сегодняшний день это API A3D 2.0 и чип Vortex 2 (AU8830). Главным козырем Aureal является запатентованная технология wavetracing, работа которой основана на физическом моделировании распространения звуковых волн. Виртуальное помещение описывается как набор многоугольников (полигонов), для каждого из которых определено местоположение в пространстве, размер, форма и тип материала. Предусмотрено четыре заранее определенных материала: дерево, бетон, сталь, ковер. Кроме того, имеется возможность менять звукоотражающие свойства материала (от полного отражения до полного поглощения) и акустическую прозрачность (от полной прозрачности до абсолютной непроницаемости). Можно также задать такие свойства среды распространения звука, как ее тип (воздух или вода), скорость распространения звука, степень поглощения звука. Позиционирование источников звука в пространстве осуществляется по алгоритму HRTF (подробнее см. врезку).

Создание полной акустической модели помещения посредством описания всех составляющих его полигонов — процесс весьма долгий и трудоемкий (что иногда может быть оправданно качеством получаемого результата), поэтому разработчики Aureal встроили в свой API специальный модуль, оперирующий высокоуровневыми объектами (это может быть стена, проход и т.п.), — менеджер сцены (scene manager). Любое приложение может взаимодействовать с геометрическим процессором (geometry engine) как напрямую, так и через менеджер сцены. В последнем случае у разработчика есть возможность пользоваться готовыми высокоуровневыми объектами — стенами, проходами и даже целыми помещениями, не прибегая к подробному описанию их геометрии. Подобный подход значительно упрощает задачу, однако в общем случае дает худший результат.

Если говорить об объективных показателях, то на сегодняшний день перспективы технологических решений Aureal омрачаются несколькими факторами. Во-первых, имеющиеся драйверы не позволяют полностью использовать возможности чипа Vortex 2. Во-вторых, судя по данным тестирования7, часть операций по обсчету звуковой сцены выполняется при помощи центрального процессора, что влечет за собой ухудшение качества видеоряда (в частности, снижение частоты смены кадров). И, в-третьих, количество игр с поддержкой A3D 2.0 весьма невелико, и тенденции к увеличению их числа заметно ниже, чем обещали в Aureal.

EAX компании Creative

EAX (Environmental Audio eXtensions) — это API для имитации звучания окружающей среды. EAX является открытым расширением звукового API DS3D, разработанного корпорацией Microsoft. Следует пояснить, что позиционированием звуковых потоков в пространстве в данном случае управляет именно DS3D, а EAX позволяет получить пространственные эффекты, такие как реверберация или эхо. При этом используется так называемая обобщенная модель реверберации, то есть поведение отраженных звуков рассчитывается не по физической модели, а описывается посредством набора параметров (таких, как время реверберации, глубина обратной связи и т.д.), что позволяет получать различные акустические условия — как близкие к естественным, так и не существующие в природе. Разработчик приложения может заранее определить набор пресетов (предварительно запрограммированных параметров), соответствующих различным помещениям, и в ходе игры переключать их в соответствии с развитием сюжета. В уже выпущенном EAX 2.0 реализованы эффекты окклюзии и обструкции, а также возможность управления ранними отражениями отдельно для каждого источника звука. В ближайшее время Creative собирается выпустить следующую версию своего API — EAX 3.0.

Interactive Around-Sound (IAS) компании EAR

IAS — это программно реализованный звуковой процессор (audio engine), совместимый с API A3D и EAX и обеспечивающий, по словам разработчиков, одинаковое звучание 3D независимо от используемой звуковой карты. В IAS также предусмотрена поддержка многоканальных акустических систем и уникальная на сегодняшний день возможность кодирования стереопотока в форматах Dolby Pro Logic и DTS. Эта функция позволяет подключать звуковую карту, не оснащенную дополнительными выходами для тыловых колонок, к музыкальному центру или системе домашнего кинотеатра с декодером Dolby Pro Logic и прослушивать звуковое сопровождение в режиме окружающего звука. К сожалению, эти возможности доступны только в играх, поддерживающих IAS.

Q3D фирмы Qsound

Эта технология может быть реализована как в виде аппаратного ускорителя (уже выпущен чип Thunderbird128), так и программно (под названием Qsoft3D) — в виде драйвера звуковой карты. Естественно, в последнем случае бремя необходимых вычислений ложится на центральный процессор, хотя разработчики и утверждают, что их объем относительно невелик. Для управления этими звуковыми процессорами используется высокоуровневый API под названием Qmixer. Помимо Q3D Qmixer совместим с DS3D и EAX. Согласно заявлениям сотрудников Qsound, в Q3D используются собственные алгоритмы Q1 и Q2, а не HRTF и CC. К сожалению, принципы функционирования алгоритмов Qsound не раскрываются, видимо, из соображений защиты ноу-хау. Единственное, что известно, — это то, что любое технологическое решение Qsound тщательно просеивается через сито многочисленных прослушиваний (по некоторым данным, в процессе создания Qmixer их количество достигло 500 000).

Sensaura

В отличие от других компаний Sensaura не занимается производством собственных чипов, а разрабатывает технологии и лицензирует их различным производителям. Первым чипом, сделанным на основе разработок Sensaura, судя по всему, станет Canyon3D фирмы ESS Technology. За основу взяты алгоритмы HRTF и TCC (transaural crosstalk cancellation — разновидность CC, доработанного специалистами Sensaura на основе результатов реальных прослушиваний). Среди передовых достижений можно отметить две технологические новинки:

  • ZoomFX предназначен для улучшения имитации звучания объектов, расположенных вблизи от слушателя (HRTF справляется с этой задачей неважно).
  • MacroFX позволяет создавать композитные источники звука, то есть имитировать близко расположенные объекты (например, шум, создаваемый трамвайным вагоном) при помощи нескольких точечных источников звука.

В погоне за идеалом

Итак, на сегодняшний день налицо противостояние двух диаметрально различающихся подходов. Имеет ли какой-либо из них преимущество? Это весьма непростой вопрос, и однозначный ответ на него получить невозможно. Скорее всего, оптимальный результат будет получен при их комбинировании, тем более что в данной ситуации имеет смысл оценивать конечный результат, а не технологические изыски. В конце концов слушателю все равно, какие процессы протекают в недрах его компьютера, — для него гораздо важнее то, что в итоге действие игры становится более интересным и увлекательным. Именно улучшение восприятия и должно стать решающим аргументом при выборе компонентов звуковой системы.

Введение в 3D Звук: Что такое иммерсивное/пространственное аудио?

Мир технологий движется столь невероятно быстро, что порой бывает сложно не отставать от него. Аудио является огромной частью этого мира, и поскольку за последнее десятилетие музыкальная индустрия значительно выросла вместе с технологиями — наряду с игровой и видео индустрией — необходимо расширять границы развития. Производителям аудио удалось сделать это путем создания иммерсивного аудио. Иммерсивное звучание — это звучание, исходящее не только из одного источника или стационарных положений слева и справа от вас, но скорее исходящее из множества точек вокруг вас.

Пространственный звук

Что такое иммерсивное аудио?

Sony 360 Reality Audio

История объемного звука и иммерсивного аудио

Концепция иммерсивного аудио далеко не нова. Еще в годах компания Дисней экспериментировала с объемным звучанием на некоторых выборочных показах мультфильма Фантазия. Их идея заключалась в том, чтобы попытаться создать впечатление, будто по комнате летает пчела. Однако пройдут десятилетия, прежде чем объемное звучание достигнет вроде мейнстрима.

Широко принятое рождение объемного звука произошло в 1957 году. Музыкант и художник Генри Джейкобс создавал концерты аудиовизуального характера, которые проходили в планетарии Моррисона в . Считается, что эти концерты были первыми, в которых использовался объемный звук в том виде, в котором мы его знаем.

Dolby Atmos

Понятие аудио каналов

Эволюция того, сколько каналов аудио нам доступно, была очень интересной. Технология тесно связана со звукозаписью и инженерией. Еще в — начале годов многие песни и саундтреки записывались и обрабатывались в моно, то есть был только один канал звука. Даже если бы существовало два динамика, оба они играли одно и то же. Не было возможности разделить звук между правым и левым каналом.

Потом пришла смена на стерео. Внезапно у нас появилось гораздо большее звуковое поле для работы, и аудиоинженеры воспользовались этим. Вы делились с стереонаушниками и слушали музыку каждый по одному наушнику? Вы заметите, что некоторые инструменты в песне пропадают, гитара или вокал могут исчезнуть. Это происходит потому, что современное сведение звука использует , в котором некоторые инструменты микшируются в правый канал, некоторые в левый.

В настоящее время доступно все больше и больше акустических систем с дополнительными динамиками. 5.1 и 7.1 — канальные ресиверы довольно распространены, и вы можете приобрести эти акустические системы для своего дома относительно недорого. Существует множество конфигураций колонок, и они могут иметь свои собственные аудио настройки, предоставляемые инженерами для создания более захватывающего впечатления. Например, у вас может быть только один канал с одним звуковым эффектом или ударной дорожкой, так что он будет идти в одном направлении звука, в то время как другие инструменты ощущаются исходящими в других направлениях.

Теперь же, иммерсивный звук добавил еще одно измерение: высоту. Звуки могут исходить к слушателю не только слева или справа, но и сверху и снизу — и из бесконечного количества точек. Технология Dolby Atmos — один из самых популярных (и растущих) форматов иммерсивного аудио, и она не ограничивается конкретной акустической установкой. Записанный и спродюсированный в Dolby Atmos иммерсивный аудиоальбом может быть воспроизведен с использованием до 34 динамиков!

Dolby Atmos Room

В сочетании с визуальными эффектами

Возможности для игр и фильмов продолжают стимулировать инновации в аудиотехнике, но эти отрасли не единственные источники дохода.

360 Reality Audio

Иммерсивное аудио в музыкальной индустрии

На этапе звукозаписи можно использовать различные методы для записи в объемном звучании и создания эффекта погружения. Это уже настоящий вызов для звукоинженеров, но такой подход становится все более и более возможным для масс. С каждым годом выходит множество новых иммерсивных аудиорелизов, и прогнозируется, что формат будет расти.

Сегодня иметь иммерсивную аудиосистему в вашем доме — это уже реальность. Преимущества такой системы как для фильма, так и для музыки неописуемы до тех пор, пока вы сами не окажетесь в таком месте, где действительно сможете ощутить невероятную чистоту звука. Автор статьи не удивится, если в ближайшее время дома заполнят такие системы, приносящие новое удовольствие своим пользователям.

Запись и воспроизведение пространственного аудио с Sennheiser:

Микрофон Sennheiser Ambeo VR Mic

Диаграмма направленности микрофона: кардиоидная

Максимальная воспроизводимая частота микрофона, кГц: 20

А можно включить дату у статей?
Нифига же непонятно, когда это было написано, вчера или 5 лет назад. (((

Цитата
Евгений пишет:
А можно включить дату у статей?
Нифига же непонятно, когда это было написано, вчера или 5 лет назад. (((

Иммерсивный звук - чисто коммерческий продукт: купи побольше железа, получишь крутой звук.
Известные фирмы BOSE и B&O очень давно (больше 25 лет точно) используют архитектуру помещений и материалы отделки для проектирования нужных звуковых ощущений индивидуально под каждого обитателя (или их несколько обитателей).
За счет минимального количества АС.

Читайте также: