В чем суть wave table метода кодирования звука кратко

Обновлено: 04.07.2024

Таблично-волновой синтез – метод синтеза звука, основанный на последовательном воспроизведении различных волновых форм, расположенных в специальных таблицах синтезатора.

Таблично-волновой синтез похож на семплерный синтез. Но если в семплерном синтезе используются предварительно записанные семплы, которые впоследствии воспроизводятся при нажатии клавиши, то в таблично-волновом синтезе используются, лишь часть такого семпла – волновая форма (один период колебания).

Синтезаторы основанные на таблично-волновом синтезе включают в себя специальные таблицы (матрицы), в каждую ячейку которых помещается определённая волновая форма. При нажатии клавиши, звук формируется за счёт последовательного объединения различных волновых форм, находящихся в определённых ячейках таблицы. Чаще всего для формирования звука используется стадия удержания (sustain), но для более сложных звуков могут использоваться и другие стадии (атака, спад, восстановление).

Обычно таблицы имеют стандартные типы волн – синус, треугольник, пила, квадрат и специальные. Использование только стандартных типов волн приравнивает этот метод синтеза к аддитивному. А использование специальных волновых форм позволяют значительно расширить палитру звуков.

Стоит отметить, что использование волновых форм, а не целых семплов позволяет значительно снизить нагрузку на оперативную память.

Одним из первых синтезаторов основанных на таблично-волновом синтезе был Wave от компании Palm Products Gmbh. На данный момент существует VST версия данного синтезатора реализованная компанией Waldorf.

PPG Wave 2

Таблично-волновой синтез пользуется огромной популярностью среди производителей. Яркими программными представителями этого метода синтеза являются синтезаторы NI Massive и xfer Serum.

Massive

Serum

Оба эти синтезатора помимо возможности использования различных волновых форм позволяют изменять звучание с помощью фильтров, огибающих, низкочастотных генераторов волны и прочих эффектов. Serum является более усовершенствованным синтезатором, но и более требовательным к ресурсам компьютера. И Massive, и Serum прекрасно справятся с самыми необычными задачами.

Таблично-волновой синтез в своё время позволил значительно расширить горизонты синтеза, предоставив возможность продюсерам работать с большей палитрой звуков.

Способ таблично-волнового (Wave-Table) синтеза лучше подходит современному уровню развития техники. Если разговаривать упрощенно, то можно сказать, что где-то в заблаговременно приготовленных таблицах хранятся эталоны звуков для огромного количества разных музыкальных приборов (желая не только для них). В технике такие эталоны нарекают сэмплами. Числовые коды выражают тип прибора, номер его модели, вышину тона, длительность и интенсивность звука, динамику его конфигурации, некие параметры среды, в которой происходит звучание, а также остальные характеристики, описывающие необыкновенности звука. Так как в качестве образчиков используются реальные звуки, то качество звука, приобретенного в итоге синтеза, выходит очень высочайшим и приближается к качеству звучания реальных музыкальных приборов.

Эту статью можно не только прочитать, но и прослушать:

Таблично-волновой синтез: принцип и инструменты

Таблично-волновой синтез появился в начале 80-х — вместе первыми цифровыми аппаратными синтезаторами от PPG и Waldorf.

Метод сих пор не теряет актуальности за счет своей гибкости.

В этой статье постараемся разобраться, что такое таблично-волновой синтез, как он работает, и расскажем о знаковых инструментах.

Как работает таблично-волновой синтез

Таблично-волновой или Wavetable-синтез – это метод цифрового синтеза звука, когда сигнал осциллятора генерируется с помощью циклического воспроизведения таблицы значений, которые образуют форму волны.

Несмотря на сходство с семплерным методом синтеза, они различаются в том, что таблично-волновой синтез основан на циклическом проигрывании табличного набора, а не на однократном проигрывании отрезка аудиоматериала. Это позволяет трансформировать или развивать семплированный звук.

Изменяя скорость, с которой циклы проходят табличные значения, таблично-волновой осциллятор может генерировать различные частоты периодической формы волны.

Схема формирования сигнала таблично-волнового синтеза похожа на субтрактивный метод, но здесь осциллятор волновых таблиц занимает место аналогового осциллятора.

Схема формирования сигнала субтрактивного синтеза:

Таблично-волновой синтез: принцип и инструменты

Вместо электрических компонентов, которые генерируют базовые формы волны, таблично-волновые синтезаторы используют серию значений, которые хранятся в таблице.

Например, традиционная пилообразная волна сохраняется в виде файла в таблице с 256 записями. Каждая запись — это значение амплитуды для одного участка волны. Таким образом, перебирая каждый образец в таблице со скоростью 440 полных циклов в секунду, получается пилообразная волна с частотой 440 Гц.

Варианты использования

Wavetable- и субтрактивный синтез похожи. Здесь тоже можно воздействовать на амплитуду при помощи огибающей ADSR и корректировать частотный баланс с помощью фильтра.

Отличие здесь в том, что таблично-волновой синтез, образует намного больше форм, чем традиционные аналоговые генераторы (VCO). Это значит, что сигнал можно образовывать от сложных или асимметричных форм волн. Это удобно для тех, кому нужно синтезировать сложные текстуры.

Возможности таблично-волнового синтеза:

  • Более яркий или резкий звук, чем могут сформировать традиционные синтезаторные волноформы.
  • Сверхбыстрые атаки или четкие басы, которые не будут звучать мутно или рыхло.
  • Динамичные пэды с постоянно меняющейся текстурой.

Подборка лучших таблично-волновых синтезаторов

Xfer Serum. Давно и заслуженно популярный программный синтезатор. Serum объединяет активное сообщество опытных пользователей, в котором можно найти мануалы и наборы пресетов.

Waldorf Blofeld. Waldorf — разработчики первых таблично-волновых синтезаторов. Несмотря на возраст, Blofeld до сих пор остается очень ярким и функциональным представителем данного вида синтеза. Гребенчатый фильтр с положительной и отрицательной обратной связью можно использовать для сгущения басов и звуков пэдов, или для создания звуков ударных, струнных или флейты. В этом инструмент схож с моделями, в которых применяется физическое моделирование.

Ableton Wavetable. В версию Ableton Suite входит виртуальный синтезатор Wavetable. Инструмент отличается понятным интерфейсом и богатой палитрой звуков.

Modal Argon8. Один из самых интересных синтезаторов, выпущенных за последние десять лет. Благодаря простому интерфейсу Argon8 позволяет легко редактировать исходный тембр. Это удобно, когда продакшн поставлен на поток и сложные тембры нужно производить быстро. При этом синтезатор недорогой.

Arturia Pigments 3. Это универсальный программный инструмент, в котором используются аддитивный, гранулярный, wavetable-синтез и аналоговое моделирование. Wavetable-движок работает со 160 волновыми таблицами.

ASM Hydrasynth. Современный цифровой аппаратный синтезатор, который работает с 219 волноформами и матрицей модуляции на 32 слота.

Waldorf PPG Wave 3.V. Оригинальной аппаратной моделью пользовались Depeche Mode, Гари Ньюман, Ultravox и другие известные синти-поп коллективы 80-х. Waldorf PPG Wave 3.V — это точная программная эмуляция классического инструмента.

Korg Modwave. В основе Korg Modwave — осцилляторы волновых таблиц с 30 модификаторами и 13 типами морфинга. Сигнал от двух волновых таблиц можно смешивать. В основе Modwave лежит классический синтезатор Korg DW-8000 1985 года.

Vital Audio Vital. Вариация известного бесплатного синтезатора Helm. Среди особенностей — морфинг спектрального осциллятора и уникальный алгоритм преобразования сэмплов в волновые таблицы.

Наиболее распространенный сейчас метод синтеза музыкальных звуков - таблично-волновой (wave table - WT). Он заключается в записи характерных фрагментов звучания реальных инструментов - начального и среднего по времени всего звучания ноты - и использования их для синтеза всех прочих звуков, издаваемых этими инструментами. Записанные фрагменты образуют основной тембр инструмента, а различные приемы обработки в реальном времени - изменение частоты, амплитуды, добавление гармоник или их фильтрация - придают тембру оттенки и динамику, свойственные различным приемам игры. Для повышения достоверности имитации берется больше образцов (англ. samples) звучания и выполняется больше работы по их обработке во время синтеза; в простейшем случае таблично-волновой метод вырождается в так называемый сэмплерный, при котором звучание инструмента записывается и воспроизводится целиком от начала до конца. Пионером в реализации WT-синтеза стала в 1984 году фирма Ensoning. Вскоре WT-синтезаторы стали производить такие известные фирмы, как Emu, Korg, Roland и Yamaha.

В качестве образцов звучаний в таблично-волновом и сэмплерном методах могут использоваться и результаты других методов синтеза или обработки. Например, многие модные сейчас "электронные" звучания получены путем сложной обработки различных ударных звуков, звука падения капель и даже скрежета ржавого железа. Путем намеренного огрубления, внесения искажений и дополнительных призвуков изначально мягкие звуки делаются более резкими и пронзительными (яркий пример - дисторшн или овердрайв для гитары), а изначально звонкие и яркие - смягчаются и выравниваются. При помощи даже сравнительно простых операций вроде суммирования сигналов с фазовым сдвигом можно получать совершенно не похожие на оригиналы звуки.

В последнее время все большее число звуковых адаптеров оснащается таблично-волновыми синтезаторами, возможности которых приближаются к профессиональным синтезаторам, используемым на музыкальной сцене. Все они содержат заранее заданный стандартный набор звуков мелодических и ударных инструментов, что позволяет им более-менее похоже исполнять одни и те же музыкальные произведения в нотной форме, а некоторые вдобавок позволяют использовать дополнительные - готовые или самостоятельно созданные - наборы звуков. Все синтезаторы предоставляют возможности по управлению артикуляцией, амплитудной и частотной модуляцией звучания, а наиболее развитые позволяют "на ходу" в широких пределах менять спектр звука, создавать эффекты реверберации, хорового звучания, вращения звука и т.п.

Управляются компьютерные синтезаторы, как и их "старшие братья", при помощи специального музыкального цифрового интерфейса MIDI. Внутри компьютера он представляет собой просто расширение нотной системы записи музыки с дополнительными командами для управления ее исполнением; вдобавок к этому большинство звуковых адаптеров содержит внешний MIDI-интерфейс, к которому можно подключить любое количество клавишных или модульных музыкальных синтезаторов, блоков обработки звука, датчиков, систем освещения и т.п. Компьютер в этом случае выступает в роли "мозгового центра", управляющего всем этим электронным зверинцем - как дома или на дискотеке, так и в профессиональной музыкальной, театральной студии или в концертном зале. В этих областях персональные компьютеры обосновались так же давно и прочно, как в лабораториях математиков и физиков; но самое главное состоит в том, что многие вещи, которые еще недавно были возможны лишь на очень сложной и дорогой аппаратуре, становятся доступны каждому, у кого есть современный персональный компьютер со звуковым адаптером - даже самым простым и дешевым. Достаточно научиться его правильно применять - и для вас уже не будет ничего принципиально невозможного в мире звука.

ВАЖНЕЙШИЕ ПАРАМЕТРЫ ЗВУКОВЫХ КАРТ

Обзор

Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. К важнейшим параметрам относятся, в первую очередь:

> метод синтеза музыкальных звуков, реализованный в синтезаторе звуковой карты;

> разрядность АЦП/ЦАП звуковой карты;

> диапазон частот дискретизации;

> отношение сигнал/шум;

> динамический диапазон.

В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).

После первого же сравнения звучания MIDI-инструментов в FM и WT вариантах можно решить для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синтезаторах звуковых карт.

Разрядность звуковой карты

Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.

При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.

В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.

Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.

После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.

Частота дискретизации

Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].

Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой F. Теоретически все реальные сигналы имеют бесконечные спектры. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax и лишь затем производят дискретизацию. Согласно теореме Котельникова частота, с которой следует брать отсчеты, составляет Fд = 2Fmax Теорема получена для идеализированных условий. Если учесть некоторые реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.

В стандарте CD частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации. Важно, чтобы максимальное значение частоты дискретизации было не менее 44,1 кГц, в противном случае качества звучания CD достичь не удастся. Следует различать частоту дискретизации в АЦП/ЦАП, предназначенных для оцифровки внешних сигналов, и частоту дискретизации в ЦАП WT-синтезатора звуковой карты. Значение последней может не совпадать с указанными стандартными значениями.

Наиболее распространенный сейчас метод синтеза музыкальных звуков - таблично-волновой (wave table - WT). Он заключается в записи характерных фрагментов звучания реальных инструментов - начального и среднего по времени всего звучания ноты - и использования их для синтеза всех прочих звуков, издаваемых этими инструментами. Записанные фрагменты образуют основной тембр инструмента, а различные приемы обработки в реальном времени - изменение частоты, амплитуды, добавление гармоник или их фильтрация - придают тембру оттенки и динамику, свойственные различным приемам игры. Для повышения достоверности имитации берется больше образцов (англ. samples) звучания и выполняется больше работы по их обработке во время синтеза; в простейшем случае таблично-волновой метод вырождается в так называемый сэмплерный, при котором звучание инструмента записывается и воспроизводится целиком от начала до конца. Пионером в реализации WT-синтеза стала в 1984 году фирма Ensoning. Вскоре WT-синтезаторы стали производить такие известные фирмы, как Emu, Korg, Roland и Yamaha.

В качестве образцов звучаний в таблично-волновом и сэмплерном методах могут использоваться и результаты других методов синтеза или обработки. Например, многие модные сейчас "электронные" звучания получены путем сложной обработки различных ударных звуков, звука падения капель и даже скрежета ржавого железа. Путем намеренного огрубления, внесения искажений и дополнительных призвуков изначально мягкие звуки делаются более резкими и пронзительными (яркий пример - дисторшн или овердрайв для гитары), а изначально звонкие и яркие - смягчаются и выравниваются. При помощи даже сравнительно простых операций вроде суммирования сигналов с фазовым сдвигом можно получать совершенно не похожие на оригиналы звуки.

В последнее время все большее число звуковых адаптеров оснащается таблично-волновыми синтезаторами, возможности которых приближаются к профессиональным синтезаторам, используемым на музыкальной сцене. Все они содержат заранее заданный стандартный набор звуков мелодических и ударных инструментов, что позволяет им более-менее похоже исполнять одни и те же музыкальные произведения в нотной форме, а некоторые вдобавок позволяют использовать дополнительные - готовые или самостоятельно созданные - наборы звуков. Все синтезаторы предоставляют возможности по управлению артикуляцией, амплитудной и частотной модуляцией звучания, а наиболее развитые позволяют "на ходу" в широких пределах менять спектр звука, создавать эффекты реверберации, хорового звучания, вращения звука и т.п.

Управляются компьютерные синтезаторы, как и их "старшие братья", при помощи специального музыкального цифрового интерфейса MIDI. Внутри компьютера он представляет собой просто расширение нотной системы записи музыки с дополнительными командами для управления ее исполнением; вдобавок к этому большинство звуковых адаптеров содержит внешний MIDI-интерфейс, к которому можно подключить любое количество клавишных или модульных музыкальных синтезаторов, блоков обработки звука, датчиков, систем освещения и т.п. Компьютер в этом случае выступает в роли "мозгового центра", управляющего всем этим электронным зверинцем - как дома или на дискотеке, так и в профессиональной музыкальной, театральной студии или в концертном зале. В этих областях персональные компьютеры обосновались так же давно и прочно, как в лабораториях математиков и физиков; но самое главное состоит в том, что многие вещи, которые еще недавно были возможны лишь на очень сложной и дорогой аппаратуре, становятся доступны каждому, у кого есть современный персональный компьютер со звуковым адаптером - даже самым простым и дешевым. Достаточно научиться его правильно применять - и для вас уже не будет ничего принципиально невозможного в мире звука.

ВАЖНЕЙШИЕ ПАРАМЕТРЫ ЗВУКОВЫХ КАРТ

Обзор

Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. К важнейшим параметрам относятся, в первую очередь:

> метод синтеза музыкальных звуков, реализованный в синтезаторе звуковой карты;

> разрядность АЦП/ЦАП звуковой карты;

> диапазон частот дискретизации;

> отношение сигнал/шум;

> динамический диапазон.

В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).

После первого же сравнения звучания MIDI-инструментов в FM и WT вариантах можно решить для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синтезаторах звуковых карт.

Разрядность звуковой карты

Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.

При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.

В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.

Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.

После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.

Частота дискретизации

Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].

Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой F. Теоретически все реальные сигналы имеют бесконечные спектры. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax и лишь затем производят дискретизацию. Согласно теореме Котельникова частота, с которой следует брать отсчеты, составляет Fд = 2Fmax Теорема получена для идеализированных условий. Если учесть некоторые реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.

В стандарте CD частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации. Важно, чтобы максимальное значение частоты дискретизации было не менее 44,1 кГц, в противном случае качества звучания CD достичь не удастся. Следует различать частоту дискретизации в АЦП/ЦАП, предназначенных для оцифровки внешних сигналов, и частоту дискретизации в ЦАП WT-синтезатора звуковой карты. Значение последней может не совпадать с указанными стандартными значениями.

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций.

Звук представляет собой непрерывный сигнал, а именно звуковую волну с меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Амплитуда колебаний звуковых волн

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым. Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука. В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным, то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

  • одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
  • $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Готовые работы на аналогичную тему

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ — общая длительность звучания, выражаемая в секундах,

$f$ — частота дискретизации (Гц),

$k$ — глубина кодирования (бит).

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table.

Преобразование звукового сигнала в дискретный сигнал

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Преобразование дискретного сигнала в звуковой сигнал

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Читайте также: