Аппаратное и программное обеспечение для представления звука сообщение

Обновлено: 04.07.2024

Аудиопроигрыватели предназначены для воспроизведения аудиофайлов. В Windows 2000 в качестве аудиопроигрывателя может использоваться универсальный проигрыватель (Media Player), CD-плеер (или лазерный проигрыватель, CD Player). Media Player позволяет воспроизводить, редактировать и внедрять аудиофайлы в различные документы, а также - организовывать коллекцию мультимедийных файлов и поиск мультимедиа-файлов в Интернете.

Музыкальные редакторы предназначены для ввода, редактирования и вывода музыкальных произведений. По своим возможностям музыкальные редакторы делятся на игрушки (muzmaker, музыкальный редактор МГУ), любительские редакторы (SkreamTreaker) и профессиональные редакторы (Cake Walk Pro, Cool Edit и др.). В их основе лежит работа с сэмплами.

В музыкальной компьютерной литературе у термина “сэмпл” три совершенно различных значения. Какое из них имеется в виду, можно определить только из контекста излагаемого материала.

Во-первых, сэмпл - это фрагмент звукового сигнала, который в течение некоторого промежутка времени не изменяется по амплитуде. Это понятие связано с процессом “сэмплирования”, то есть перевода сигнала из обычного вида (аналоговый сигнал) в цифровой.

Во-вторых, сэмпл - это музыкальный тембр синтезатора или сэмплера, основанный на записанном (живом) звуке.

В-третьих, сэмпл - это обычный звуковой файл с записанным в него небольшим музыкальным фрагментом, рисунком, фразой (а иногда и просто одним звуком).

Будем считать, что сэмпл - это элементарный оцифрованный звук, который может быть получен с помощью музыкального редактора или другим путем. Сэмплы объединяются в библиотеки, из них набирается музыка. Любительское использование музыкальных редакторов в основном характерно для лиц, получивших музыкальное образование, но не ставших профессиональными музыкантами. Для них основная задача - “услышать свою внутреннюю музыку” и заставить ее звучать с помощью ЭВМ.

Основные возможности музыкальных редакторов представлены в табличном виде (табл. 3.1).

Основные возможности музыкальных редакторов

Режим работы программы

Ø Работа с файлами

Ø Работа в режиме реального времени

Запись, воспроизведение и редактирование файла

Например, вы поете в микрофон, подключенный к звуковой карте, а на ее выходе уже звучит ваш голос с реверберацией или другой обработкой

Операции с файлом

Обычно они находятся в меню File программы

Ø Запись файла / Новый файл

Ø Открытие или импорт файла

Ø Предварительное прослушивание

Ø Предварительная информация о файле

Ø Число одновременно открытых файлов

Ø Информация, сохраняемая в файле

Запись производится с микрофонного линейного или цифрового входа звуковой карты (это определяется при установке программы выбором соответствующего порта и драйвера). Когда записывается новый файл, его формат (частота сэмплирования, битность, число каналов) определяется непосредственно перед записью

Эта функция иногда еще называется загрузкой файла. Стандартным для всех программ Windows является WAV -файл. Но звуковая информация может храниться в файлах и других форматов. Программа может читать такие файлы (а значит, переводить их в формат WAV ), но может и игнорировать (не распознавать)

Проигрывание записанного или загруженного файла

Сохранение файла в формате WAV (с выбранными параметрами), в собственном формате программы (если таковой существует), а иногда и экспорт в звуковой файл другого формата

Прослушивание звукового файла до его загрузки в программу (обычно делается в окне open ). Некоторые программы позволяют предварительно прослушивать весь файл, другие - первые несколько секунд

Еще до загрузки файла программа определяет (и показывает в окне open ) некоторые параметры файла: частота сэмплирования, битность, стерео, моно, наличие регионов, петли и т.д. Число предварительно показанных параметров и какие именно зависят от самой программы

Большинство программ позволяет открывать несколько файлов, каждый в своем окне. Но все операции и обработки в данный момент времени производятся только с одним файлом (с тем, что находится в активном окне). Некоторые программы позволяют производить пакетную обработку файлов, т.е. несколько указанных файлов друг за другом

Некоторые программы сохраняют (и читают) в файле не только звуковые данные, но и отметки маркеров, петли, информацию о создателях файла, времени и условиях записи и многое другое

Для многих операций редактирования необходимо сначала выбрать участок файла (или весь файл), с которым будет проводиться операция. Некоторые операции - Paste , Mix и другие - работают с данными, находящимися в буфере. Это означает, что сначала нужно что-то скопировать или вырезать в буфер

Ø Стандартные операции редактирования

Ø Insert Silence

Ø Reverse / Revert

Copy - копировать, Cut - вырезать, Paste - вставлять, Undo - отменить последнюю операцию, Redo - восстановить последнюю операцию, Repeat - повторить последнюю операцию, Select All - выбрать все

Постепенное увеличение ( Fade In ) или уменьшение ( Fade Out ) амплитуды (громкости)

Смешивание двух файлов. Обычно к файлу, находящемуся в активном окне программы, добавляются звуковые данные из буфера

Перекрестное постепенное изменение амплитуды. Применяется при смешивании файла в окне и файла из буфера. Например, файл в окне постепенно затихает, а файл из буфера с той же скоростью увеличивает громкость

Из окна удаляются все данные, кроме выбранного участка

Вставляется новый участок файла с нулевой амплитудой сигнала (тишина)

Инвертирование (сэмпл в файле меняет свой знак)

Реверс - симметричная перестановка сэмплов файла (конец и начало меняются местами)

Иногда обозначается как Transform , Process , Tools или еще как-нибудь. Операции обработки по общему смыслу схожи с операциями редактирования, но из-за более сложных действий, производимых с данными, выделяются в отдельные пункты меню

Ø Normalize / Normalization

Эта операция пересчитывает файл так, чтобы максимальное значение амплитуды соответствовало заранее определенному максимальному значению

Задержка звукового сигнала на небольшой (от микросекунд до долей секунды, определенный интервал времени)

Музыкальный эффект хора, при котором сигнал несколько раздублируется, каждая копия чуть задерживается по времени, а затем все копии смешиваются. Если за сигнал взят человеческий голос, то создается ощущение хора

Ø Equalizer / Equalize

Ø Time Compress / Expand или Time Stretch

Музыкальных эффект Флэнжер, при котором копия сигнала сдвигается не на постоянный отрезок времени, а на циклически меняющийся. Когда сам сигнал и эта копия смешиваются, создается ощущение двигающегося или вращающегося источника звука

Музыкальный эффект Дистошн (искажение), применяемый гитаристами в поп- и рок-музыке - звуковой сигнал ограничивается по амплитуде на определенном уровне

Задается (а значит, и изменяется) амплитудная огибающая звукового сигнала - параметры атаки, спада и т.д.

Создаются копии звукового сигнала, которые с затиханием сдвигаются на увеличивающийся интервал времени, создается впечатление, что источник звука находится в большой пустой комнате

Этот эффект схож с предыдущим, но отличается большим временем задержки. Он создает впечатление повтора сигнала (примерно, как эхо в горах)

Создает ощущение качания или вибрации звука. Существуют различные виды вибрато: амплитудное (тремоло), частотное (по высоте звука), фазовое (флэнжер или фэйзер), тембровое (“вау-вау”)

Возможность менять амплитуду сразу для всего файла, но в зависимости от высоты звука. Существуют разные типы этой операции: графический эквалайзер, параметрический эквалайзер и др.

Изменение времени звучания без изменения высоты звука

Изменение высоты звука без изменения времени звучания

Изменение параметров звукового файла

Ø Синхронизация по MIDI - коду с MIDI - секвенсором или другой программой

Ø Возможность проигрывать создаваемые музыкальные сэмплы с внешней MIDI - клавиатуры

Ø Наличие собственной виртуальной MIDI - клавиатуры

Одновременный запуск двух программ: данной программы звукового редактора − и, например, MIDI - секвенсора

Нажимая мышью на клавиши виртуальной MIDI - клавиатуры, вы можете играть звуком создаваемого сэмпла (или обычного WAV - файла). В этом случае внешняя MIDI - клавиатура не требуется

В литературе особенности использования программных средств для создания музыкальных произведений характеризуются следующим образом.

Секвенсоры служат для программирования, т.е. для кодировки музыкальных пьес. Именно с их помощью создаются аранжировки: “прописываются” отдельные партии, назначаются тембры инструментов, выстраиваются уровни и балансы каналов (треков), вводятся тонкие нюансы, музыкальные штрихи (акценты громкости, временное смещение, отклонения от настройки, модуляция и т.д.). Эффективное использование секвенсора требует от композитора-аранжировщика специальных инженерных знаний, что сильно отличает его работу от труда академического музыканта.

Другой вид программного музыкального обеспечения ориентирован на аудиотехнологии записи музыки. Значительный рост производительности обычных компьютеров и емкости устройств хранения данных сделал для рядового пользователя возможной запись звука на жесткий диск в реальном времени. Новые технологии позволяют музыканту существенно экономить на оборудовании. Сам компьютер теперь является цифровым многоканальным магнитофоном, заветной мечтой многих музыкантов. Кроме записи и воспроизведения программы стали дополняться опциями редактирования звука: отрисовкой кривых громкости, регулировкой баланса, функциями копирования, удаления, вставки, фильтрации и пр. Известно, что обычно “комбайны” удобны в работе, но их отдельные функции не так мощны, как в специализированных продуктах. Поэтому, работая со звуком, профессионалы, да и любители, пользуются некоторым “джентльменским набором” программ. Так, если многоканальная запись осуществляется программой SAW, то обработку сигналов выполняют в специализированных звуковых редакторах, например, в Cool Edit, Sound Forge. Некоторые функции новейших редакторов звука, такие, как смещение настройки без изменения времени звучания (темпа) или гармонизация (синтез аккорда из одной ноты), кажутся фантастическими. А ведь студийные аппаратные аналоги таких программных функций стоят сотни и даже тысячи долларов. Проблема одна: многие сложные операции в звуковых редакторах не выполняются в реальном времени. Но это, очевидно, вопрос времени, если учесть, как быстро растет вычислительная мощность персональных машин.

Сейчас MIDI- и аудиотехнология идут рука об руку. Ведущие производители предлагают программные продукты, в которых обе технологии интегрированы. В процессе создания музыки часть партий “прописывается” в MIDI и воспроизводится звуковыми модулями, а часть представляет собой акустическую запись. Как видим, два главных подхода вовсе не конфликтуют, а дополняют друг друга.

Сочинение музыки на компьютере потребует от пользователя понимания ее структуры и основных законов, и многого другого. Но разработчики программного обеспечения и тут смогли упростить жизнь пользователям. Существуют программные продукты, называемые еще генераторами стилей, основанные на различных алгоритмах построения музыкальной партитуры. Часто музыку генерируют на основе исходных данных: гармонии и выбранной стилевой модели. По этому принципу построены такие продукты, как Jammer Professional for Windows, Yamaha Visual Arranger for Windows, Voyetra Digital Orchestrator Plus, SuperJam, Rhythm Brainz Plus. Мнения композиторов о таких программах неоднозначны. Одни считают, что автогенерация сковывает творческую фантазию, другие видят положительные стороны в том, что каждый такой продукт включает колоссальную базу музыкальных данных. В конце концов, это неплохой способ развивать собственные художественные ориентиры, изучать отлаженные профессионалами музыкальные модели.

Таким образом, наиболее благоприятный путь для начинающих компьютерных композиторов выглядит следующим образом: использовать генератор стилей для создания музыкальной основы произведения - ритмического рисунка и рефренов в выбранном стиле, а затем добавить мелодию с помощью одной из программ-секвенсоров.

Разработка мелодии потребует от пользователя большого труда, творческих способностей и интуиции. На общем фоне выделяется программа Jammer Professional for Windows. Возможности функций создания мелодий генераторов стилей остальных программ значительно беднее.

Программа Koan X Silver предоставляет достаточно простой способ создания небольших музыкальных пьес. Основным инструментом является мышь. Никаких MIDI-клавиатур или их замены с помощью обычной компьютерной клавиатуры. Все значительно проще. В центре экрана находится прямоугольник с надписью “Koan X”. Справа от него расположены шаблоны с записями звуков конкретных музыкальных инструментов.

При этом также доступны различные средства управления инструментами: автоматическое смешивание фрагментов, различные регулировки и индивидуальное управление функциями реверберации и хора для каждого шаблона. Включены 30 шаблонов музыкальных инструментов, существует возможность сохранить произведение в формате SKP, который может быть воспроизведен любым браузером с помощью специально подключаемых модулей.

Сочинение музыки на компьютере - тема интересная и многообразная, но перейдем к программному обеспечению для обработки звука.

Программное обеспечение для многодорожечной записи на жесткий диск является неотъемлемой частью любой музыкальной студии на базе персонального компьютера. Именно с помощью таких программ можно от начала до конца записать готовую музыкальную композицию, выполняя все операции, связанные с записью, нелинейным монтажом, наложением эффектов, компоновкой дорожек, сведением и архивированием записанного материала. Одним из лидеров в этой области является редактор SAW, выпускаемый в различных модификациях.

Неплохими возможностями обладает редактор WaveLab компании Steinberg, позволяющий вести обработку звука в реальном времени. Особый интерес для пользователей может представлять программа для улучшения качества фонограмм CoolEdit, которая обладает всеми основными возможностями профессиональных звуковых редакторов.

Поскольку человечество уже много лет имеет дело с различными проигрывателями, магнитофонами и плеерами, основные функции при работе со звуковыми файлами - запись и воспроизведение - не являются сложными даже для начинающего пользователя.

В то же время редактирование записанного звука всегда было уделом высоких профессионалов. Оно требовало больших студий и дорогого оборудования. Но компьютерная технология, ворвавшись в сферу работы со звуком, произвела настоящую революцию. Разумеется, для качественной обработки звука нужны достаточно мощный компьютер и хорошая программа, но речь уже не идет о десятках и сотнях тысяч долларов.

Кроме того, многие программы обладают универсальностью и многофункциональностью. Уже нет необходимости изучать несколько различных узкоспециализированных устройств, и достаточно порой освоить всего одну из программ. А большинство из них включают в себя развитые средства по изучению их работы - интерактивные видеошколы, руководства, презентационные ролики. Единственное, что, пожалуй, не купишь - это опыт и навыки работы.

В начале своего развития звуковые редакторы были весьма непохожи друг на друга. Но одинаковые цели, схожие средства, команды и инструменты постепенно сближают идеологию и внешний вид как текстовых, так и звуковых программ.

Не существует “официального” определения, что такое звуковой редактор. Под этим термином обычно понимают программу, которая позволяет производить над файлом стандартные редакторские функции: выделить, копировать, вырезать и вставить. Но чаще программа помогает осуществлению над файлом и специфической “звуковой” обработки: реверберации, изменения тембра, частотного спектра и так далее. И третий вид действий, который обычно имеется в арсенале звуковых редакторов,- работа с форматом звукового файла, то есть изменение частоты сэмплирования, числа каналов (стерео - моно), переводов в другой формат и т.п.

"Говорящая машина" представляет собой программу, управляющую акустической аппаратурой. Она выполняется либо в виде резидентной программы, либо в виде драйвера. Перед началом работы такая программа должна быть активизирована. Обычно говорящая машина работает в паре с синтезатором речи.

Синтезатор речи - это программа, преобразующая текстовую информацию в сигналы управления говорящей машиной. Простые синтезаторы речи воспроизводят в виде речи указанный им текст (в виде строки символов на экране или в виде текстового файла). Более сложные способны реализовать часть функций речевого редактора, например, позволяют оперативно регулировать параметры речи.

Речевые редакторы предназначены, в основном, для установки таких параметров, как громкость, темп речи, высота и тембр голоса, скорость воспроизведения текста и др. Причем в процессе установки осуществляется демонстрация того, как будет звучать речь в данном режиме.

Аудиоредакторы предназначены для общей обработки звука: ввести голос, убрать шумы, переставить слова местами, наложить речь на фоновую музыку, включить звуковые эффекты и так далее. Именно эти функции выполняются аудиоредакторами, например, такими, как программа "Звукозапись" (Sound Recorder) операционной системы Windows 2000.

Утилиты предназначены для специальной обработки звуковых сигналов: шумоподавление, смешивание разных видов аудиосигналов, преобразование форматов, организация и ведение звуковых библиотек. Существуют, например, утилиты, позволяющие создавать волновые таблицы с их помощью можно создать сэмплы, содержащие не отдельные звуки, а целые слова, произнесенные своим голосом.

Тема программного обеспечения очень широка, поэтому здесь мы только вкратце обсудим основные представители программ для обработки звука.

Наиболее важный класс программ – редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами (как встроенными, так и подключаемыми извне – об этом позже), очистка от шумов, имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторые из таких программ: Cool Edit Pro (Syntrillium), Sound Forge (Sonic Foundry), Nuendo (Steinberg), Samplitude Producer (Magix), Wavelab (Steinberg).


Основные возможности редактора Cool Edit Pro 2.0 (см. скриншот - пример рабочего окна программы в многодорожечном режиме): редактирование и сведение аудио на 128 дорожках, 45 встроенных DSP-эффектов, включая инструменты для мастеринга, анализа и реставрации аудио, 32-битная обработка, поддержка аудио с параметрами 24 бит / 192 КГц, мощный инструментарии для работы с петлями (loops), поддержка DirectX, а также управление SMPTE/MTC, поддержка работы с видео и MIDI и прочее.


Основные возможности редактора Sound Forge 6.0a (см. скриншот - пример рабочего окна программы): мощные возможности не деструктивного редактирования, многозадачная фоновая обработка заданий, поддержка файлов с параметрами до 32 бит / 192 КГц, менеджер предустановок, поддержка файлов более 4 Гб, работа с видео, большой набор эффектов обработки, восстановление после зависаний, предпрослушивание примененных эффектов, спектральный анализатор и прочее.

Не менее важная в функциональном смысле группа программ – секвенсоры (программы для написания музыки). Чаще всего, такие программы используют MIDI-синтезатор (аппаратный внешний или встроенный почти в любую звуковую карту, либо программный, организуемый специальным программным обеспечением). Такие программы предоставляют пользователю либо привычный нотный стан (как, например, программа Finale от CODA), либо более распространенный способ редактирования аудио на компьютере, так называемый, piano-roll (это более понятное представление музыки для людей, не знакомых с нотами; в таком представлении вертикально имеется ось с изображением клавиш пианино, а горизонтально откладывается время, таким образом, ставя на пересечении штрихи разной длинны, добиваются звучания определенной ноты с определенной продолжительностью). Встречаются и программы, позволяющие просматривать и редактировать аудио в обоих представлениях. Развитые секвенсоры помимо редактирования аудио во многом могут дублировать возможности редакторов цифрового аудио – осуществлять запись на CD, совмещать MIDI-дорожки с цифровыми сигналами и осуществлять мастеринг. Яркие представители такого класса программ: Cubase (Steinberg), Logic Audio (Emagic), Cakewalk (Twelve Tone Systems) и уже упомянутый Finale.


Основные возможности редактора Cubase 5.1 (см. скриншот – пример рабочего окна программы в режиме просмотра MIDI дорожек): редактирование музыки в реальном времени используя графическое представление информации, высокое разрешение редактора (15360 пульсов на четверть), практически не лимитированное количество дорожек, 72 аудио канала, поддержка VST32, 4 эквалайзера на канал и другие поканальные эффекты, встроенные инструменты обработки с использованием аналогового моделирования (виртуальные инструменты, эффект процессоры, инструменты микширования и записи) и множество других возможностей.


Основные возможности редактора Logic Audio 5 (см. скриншот – пример рабочего окна программы): работа со звука при точности в 32 бита, высокое временное разрешение событий, самоадаптируемый микшер аудио и MIDI, оптимизируемый интерфейс пользователя, синхронизация с видео, виртуально неограниченное число MIDI-дорожек, обработка звука в реальном времени, полная синхронизация с MTC, MMC, SMPTE, встроенные модули обработки и автоинструменты, поддержка большого количество аппаратного оборудования, а также множество других возможностей.


Из интересных плаг-инов можно вспомнить, например iZotope Vinyl, - он позволяет придать звучанию эффект виниловой пластинки (см. скриншот – пример рабочего окна плаг-ина в среде Cool Edit Pro), Antares AutoTune позволяет в полуавтоматическом режиме корректировать звучание вокала, а Orange Vocoder являет собой замечательный вокодер (механизм для придания звучанию различных инструментов схожести со звучанием голоса человека).

Обработка звука и написание музыки – это не только творческий процесс. Иногда нужен скрупулезный анализ данных, а также осуществление поиска огрехов их звучания. Кроме того, аудио материал, с который приходится иметь дело, не всегда желаемого качества. В этой связи нельзя не вспомнить о целом ряде программ-анализаторов аудио, специально предназначенных для осуществления измерительных анализов аудио данных. Такие программы помогают представить аудио данные удобнее, чем обычные редакторы, а также внимательно изучить их с помощью различных инструментов, таких как FFT-анализаторы (построители динамических и статических амплитудно-частотных характеристик), построители сонограмм, и прочих. Одна из наиболее известных и развитых программ подобного плана – программа SpectraLAB (Sound Technology Inc.), чуть более простые, но мощные – Analyzer2000 и Spectrogram.


Программа SpectraLAB – наиболее мощный продукт подобного рода, существующий на сегодня (см. скриншот – пример рабочего окна программы, на экране: спектральная картина в трез представлениях и фазовая картина). Возможности программы: 3 режима работы (пост режим, режим реального времени, режим записи), основной инструментарий – осциллограф, спектрометр (двухмерный, трехмерный, а также построитель сонограмм) и фазометр, возможность сравнения амплитудно-частотных характеристик нескольких сигналов, широкие возможности масштабирования, измерительные инструменты: нелинейных искажений, отношения сигнал/шум, искажений и прочие.

Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудио-кассет, и провести другую корректировку аудио. Программы подобного рода: Dart, Clean (от Steinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

Трекеры. Трекеры – это отдельная категория звуковых программ, предназначенных именно для создания музыки. Ранее мы рассмотрели два принципиально отличных способа хранения звуковых данных (музыки): первый - хранение звука в виде сжатого или несжатого потока аудио, второй - хранение музыки в виде MIDI-файлов (в виде набора команд MIDI-синтезатору). Структура и концепция построения трекерных файлов очень похожа на принцип хранения MIDI-информации. В трекерных модулях (файлы, созданные в трекерах, принято называть модулями), также, как и в MIDI-файлах, содержится партитура в соответствии с которой должны проигрываться инструменты. Кроме того, в них содержится информация о том, какие эффекты и в какой момент времени должны быть применены при проигрывании того или иного инструмента. Однако, принципиальное отличие трекерных модулей от MIDI-файлов заключается в том, что проигрываемые в этих модулях инструменты (или, точнее сказать, сэмплы) хранятся в самих модулях (то есть внутри файлов), а не в синтезаторе (как это происходит в случае с MIDI). Такой способ хранения музыки имеет массу преимуществ: размер файлов невелик по сравнению с непрерывной оцифрованной музыкой (поскольку записываются только использованные инструменты и партитура в виде команд), нет зависимости звучания от компьютера, на котором происходит воспроизведение (в MIDI, как мы говорили, есть зависимость звучания от используемого синтезатора), имеется большая свобода творчества, поскольку автор музыки не ограничен наборов инструментов (как в MIDI), а может использовать в качестве инструмента любой оцифрованный звук. Основные программы-трекеры Scream Tracker, Fast Tracker, Impulse Tracker, OctaMED SoundStudio, MAD Tracker, ModPlug Tracker.


Программа ModPlug Tracker является сегодня одним из тех трекеров, сумевших стать универсальной рабочей средой для множества типов трекерных модулей (см. скриншот7 – пример рабочего окна программы, на экране: содержание дорожек одного загруженного модуля и рабочее окно сэмплов другого модуля). Основные возможности: поддержка до 64 физических каналов аудио, поддержка почти всех существующих форматов трекерных модулей, импорт инструментов во множестве форматов, 32-битное внутреннее микширование, высококачественный ресэплирующий фильтр, поддержка MMX/3dNow!/SSE, автоматическое удаление потрескиваний, расширение басов, ревербератор, расширение стерео, 6-полосный графический эквалайзер и другие возможности.


Перспективы и проблематика

Перспективы развития и использования цифрового аудио видятся авторам статьи очень широкими. Казалось бы, все, что можно было сделать в этой области, уже сделано. Однако это не так. Остается масса еще совсем незатронутых проблем.

Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

В области синтеза звука также есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли – существует масса нюансов звучания, которые почти невозможно воссоздать искусственно.

Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.


Глоссарий терминов

1) DSP – Digital Signal Processor (цифровой сигнальный процессор). Устройство (или программный механизм) предназначенное для цифровой обработки сигналов.

2) Битрейт – применительно к потокам данных - количество бит в секунду (bits per second). Применительно в звуковым файлам (например, после lossy-кодирования) – каким количеством бит описывается одна секунда аудио.

3) Звук - акустическая волна, распространяющаяся в пространстве; в каждой точке пространства может быть представлена функцией амплитуды от времени.

4) Интерфейс - совокупность программных и аппаратных средств, предназначенных для организации взаимодействия различных устройств.

5) Интерполяция - отыскание промежуточных значений величины по некоторым известным ее значениям; отыскание значений функции f(x) в точках x, лежащих между точками xo

Нажмите, чтобы узнать подробности

Аппаратные средства обеспечения звуковых технологий. Интерфейсы для подключения звукового оборудования.

Аппаратное обеспечение звуковой подсистемы ПК Звуковая карта (плата) Устройства ввода звукового сигнала Устройства вывода звукового сигнала Микрофон Колонки Наушники

Аппаратное обеспечение звуковой подсистемы ПК

Звуковая карта (плата)

Устройства ввода звукового сигнала

Устройства вывода звукового сигнала

Звуковая карта Звуковая карта конструктивно может быть выполнена в виде отдельной платы, может быть интегрирована в системную плату (звуковой адаптер), а может быть выполнена в виде внешнего устройства.

Звуковая карта

Звуковая карта конструктивно может быть выполнена в виде отдельной платы, может быть интегрирована в системную плату (звуковой адаптер), а может быть выполнена в виде внешнего устройства.

Основные компоненты звуковой платы

Основные компоненты звуковой платы

Основные компоненты звуковой платы Микшеры Преобразователи Аналоговый входной микшер Аналоговый выходной микшер АЦП – аналого-цифровой преобразователь ЦАП- цифро-аналоговый преобразователь Служат для регулировки уровня сигнала по каждому каналу. Аудио-процессор – центральный блок, который осуществляет цифровую обработку сигнала. Цифровой эквалайзер – служит для компенсирования недостатков преобразования звука, акустики и помещения.

Основные компоненты звуковой платы

Преобразователи

  • Аналоговый входной микшер
  • Аналоговый выходной микшер
  • АЦП – аналого-цифровой преобразователь
  • ЦАП- цифро-аналоговый преобразователь

Служат для регулировки уровня сигнала по каждому каналу.

  • Аудио-процессор – центральный блок, который осуществляет цифровую обработку сигнала.
  • Цифровой эквалайзер – служит для компенсирования недостатков преобразования звука, акустики и помещения.

Разъемы звуковой платы

Колонки и микрофон Колонки Микрофон небольшие громкоговорители, через которые проигрывается звук. Колонки бывают пассивные и активные. Пассивные колонки работают за счет мощности встроенного усилителя звуковой карты, а активные сами содержат усилитель. Звучание активных колонок обычно лучше. В зависимости от физических принципов действия подразделяются на угольные, динамические, электромагнитные, пьезоэлектрические, конденсаторные. Сферы применения в ПК самые разнообразные: реализация возможностей телефона, автоответчика, работа с мультимедийными программами, переговоры по сети (видеоконференции) и т.д..

Колонки и микрофон

Колонки

Микрофон

  • небольшие громкоговорители, через которые проигрывается звук. Колонки бывают пассивные и активные. Пассивные колонки работают за счет мощности встроенного усилителя звуковой карты, а активные сами содержат усилитель. Звучание активных колонок обычно лучше.
  • В зависимости от физических принципов действия подразделяются на угольные, динамические, электромагнитные, пьезоэлектрические, конденсаторные. Сферы применения в ПК самые разнообразные: реализация возможностей телефона, автоответчика, работа с мультимедийными программами, переговоры по сети (видеоконференции) и т.д..

Акустические системы

Акустические системы - это совокупность излучателей, каждому из которых отводится воспроизведение своей части звукового частотного диапазона.

Излучатели самого верхнего диапазона частот (от 4000 до 20000 Гц) называются твитерами . Они в большей степени формируют стереоэффект в звуковой картине. Мембрана высокочастотных излучателей изготавливаются из жестких материалов (керамика, алюминивые или титановые сплавы).

За воспроизведение средних частот (от 400 до 5000Гц) отвечают мидвуферы . Этот диапазон частот наиболее важен для человеческого уха, поэтому конструктивному исполнению мидвуферов уделяется самое большое внимание.

За низкочастотное излучение (от 20 до 1000Гц) отвечают вуферы и сабвуферы . Здесь амплитуда колебаний диффузора достаточно высока, поэтому для изготовления мембраны чаще всего используют картон, полипропилен или кевлар. Вообще говоря сабвуферы для ПК представляют собой отдельную акустическую систему, которая нужна лишь для того, чтобы продлить амплитудно-частотную характеристику в область самых низких частот для хорошего звучания "басов".




Полезные ссылки:





Адрес колледжа:
Республика Беларусь
223610, Минская обл.
г. Слуцк, ул. Виленская, 45
Телефон/факс
8 (01795) 2 09 33
E-mail:
SGMK@Slutskmedkol.by

Аппаратные и программные средства мультимедиа



Остановимся на некоторых аппаратных средствах поподробнее.
Звуковые Карты
С течением времени перечень задач выполняемых на ПК вышел за рамки просто использования электронных таблиц или текстовых редакторов. Компакт- диски со звуковыми файлами, подготовка мультимедиа презентаций, проведение видеоконференций и телефонные средства, а также игры и прослушивание аудио CD для всего этого необходимо чтобы звук стал неотъемлемой частью ПК. Для этого необходима звуковая карта.
Наличие дисковода CD-ROM позволяет только прослушивать звуковые компакт-диски. Звуковая карта необходима, чтобы получить профессиональное качество звукового сопровождения, создавать и записывать звуки, синтезировать сложные аудиоэффекты, смешивать звуковую информацию от нескольких источников, самостоятельно включать звуковое сопровождение в мультимедийные презентации, дополнять документы голосовыми аннотациями и др. Звуковая карта (или Sound Blaster) устанавливается, как правило, в виде электронной платы в разъём материнской платы компьютера.
История развития звуковых карт начинается с выпуском самых первых моделей компьютеров фирмы IBM. Изначально компьютеры были снабжены только PC Speaker-ом (Динамиком), который не предназначен для воспроизведения нормального звука.
В то время ни о каких мультимедиа программах никто и не помышлял, и практически единственным применением хорошему звуку были компьютерные игры. Первой звуковую карту для IBM PC сделала фирма TANDY. Звучание этой карты было примерно аналогично звучанию карт в игровых компьютерах (3 музыкальных голоса). Звуковые карты стали выпускать и другие фирмы. Наиболее известные из них Adlib, Creative и Roland. Звуковые карты Adlib - это одни из самых простых и дешёвых из использующихся на сегодняшний день звуковых карт. Их звучание основано, как и у большинства распространённых карт, на модуляции частоты (Frequency Modulation — FM).
Карта содержит 11 голосов FM и может достаточно неплохо воспроизводить музыку. Но цифровой (или оцифрованный) звук ей не под силу. Карты этого типа - монофонические, но они часто используют принцип псевдостерео. На сегодняшний день карты, поддерживающие только стандарт Adlib, морально устарели. Звуковые карты фирмы Creative Labs стали стандартом для современных систем мультимедиа. Важным отличием этих карт является возможность воспроизводить цифровой звук, то есть практически все, что только можно услышать. Качество же воспроизведения зависит от двух важнейших параметров - разрядности и частоты дискретизации (это частота обновления данных). Разрядность карт обычно составляет 8 и 16 бит, а частота дискретизации — 4 до 44.1 кГц.
Цифровой звук карты воспроизводят и записывают благодаря цифро-аналоговому и аналого-цифровому преобразователям (ЦАП и АЦП).
Файлы, содержащие видеоизображения и звук, имеют расширения *.avi, *.mov, *.mpg. Специальный фонограф — Sound Recorder, предназначен для записи и воспроизведения звука, а также для редактирования звуковых файлов.
Звуковые файлы имеют расширения *.wav, *.mid, *.mod, *.voc, *.fli.

Лазерные диски, CD-ROM
В связи с ростом объемов и сложности программного обеспечения, широким внедрением мультимедиа приложений, сочетающих движущиеся изображения, текст и звук, огромную популярность в последнее время приобрели устройства для чтения компакт- дисков CD-ROM.
Компакт- диски изначально разработанные для любителей высоко качественного звучания, прочно вошли на рынок компьютерных устройств. Оптические компакт- диски перешли на смену виниловым в 1982 году. Было решено, что стандарт рассчитан на 74 минуты звучания "Red Book". Когда 74 минуты пересчитали в байты получилось 640 Мбайт. Первые приводы имели единичную скорость (Single speed) равную 150 Кбайт/с. Модели накопителей с удвоенной скоростью появились в 1992 году. Приводы с утроенной и с учетверенной скоростью в начале 1994 году. Сегодня речь уже идет о скорости увеличенной в шесть и даже восемь раз. Коэффициент увеличения скорости не обязательно целый.
Как и в компакт-дисках, применяемых в бытовых СD-плейерах, информация на компьютерных компакт-дисках кодируется посредством чередования отражающих и не отражающих свет участков на подложке диска. При промышленном производстве компакт-дисков эта подложка выполняется из алюминия, а не отражающие свет участки делаются с помощью продавливания углублений в подложке специальной пресс-формой. При единичном производстве компакт-дисков (так называемых СD-R дисков, см. ниже) подложка выполняется из золота, а нанесение информации на нее осуществляется лучом лазера. В любом случае сверху от подложки на компакт-диске находится прозрачное покрытие, защищающее занесенную на компакт-диск информацию от повреждений. Хотя по внешнему виду и размеру используемые в компьютерах компакт-диски не отличаются от дисков, применяемых в бытовых СD плейерах, однако компьютерные устройства для чтения компакт-дисков стоят существенно дороже. Это не удивительно, ведь чтение программ и компьютерных данных должно выполняться с гораздо высокой надежностью, чем та, которая достаточна при воспроизведении музыки. Поэтому чтение используемых в компьютере компакт-дисков осуществляется с помощью луча лазера небольшой мощности. Однако скорость чтения данных с компакт-дисков значительно ниже, чем с жестких дисков. Одна из причин этого состоит в том, что компакт-диски при чтении вращаются не с постоянной угловой скоростью, а так, чтобы обеспечить неизменную линейную скорость отхождения информации под читающей головкой. Стандартная скорость чтения данных с компакт-дисков всего 150-200 Кбайт/с, а время доступа 0,4 с. Впрочем, в последнее время выпускаются в основном устройства с двойной, тройной и даже четвертой скоростью вращения, они обеспечивают соответственно более высокие скоростные показатели: время доступа 0,2-0,3 с, скорость считывания 500 Кбайт/с. Заметим, однако, что устройства с тройной скоростью в реальных задачах увеличивают скорость работы с компакт-диском не в полтора и не в два раза по сравнению с устройством с двойной скоростью, а всего на 30 - 60%.
Дисководы для CD производят такие известные фирмы, как Sony, NEC, Panasonic, Plextor, Creative, LG и др.
Видеокарты
При смешении сигналов основные проблемы возникают с видеоизображением. Различные ТВ–стандарты, существующие в мире (NTSC, PAL, SECAM), применение разных мониторов и видеоконтроллеров диктует разнообразие подходов в разрешении возникающих проблем. Однако в любом случае требуется синхронизация двух изображений, для чего служит устройство генлок (genlock). С его помощью на экране монитора могут быть совмещены изображение, сгенерированное компьютером (анимированная или неподвижная графика, текст, титры), и “живое” видео. Если добавить еще одно устройство — кодер (encoder), компьютерное изображение может быть преобразовано в форму ТВ–сигнала и записано на видеопленку. "Настольные видеостудии”, являющиеся одним из примеров применения систем мультимедиа, позволяют готовить совмещенные видео–компьютерные клипы, титры для видеофильмов, помогают при монтаже кинофильмов.
Системы такого рода не позволяют как-то обрабатывать или редактировать само аналоговое изображение. Для того, чтобы это стало возможным, его необходимо оцифровать и ввести в память компьютера. Для этого служат так называемые платы захвата (capture board, frame grab­bers). Оцифровка аналоговых сигналов порождает огромные массивы данных. Так, кадр стандарта NTSC (525 строк), преобразованный платой типа Truevision, превращается в компьютерное изображение с разрешением 512x482 пиксель. Если каждая точка представлена 8 битами, то для хранения всей картинки требуется около 250 Кбайт памяти, причем падает качество изображения, так как обеспечивается только 256 различных цветов. Считается, что для адекватной передачи исходного изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения цветной картинки, а необходимый размер памяти возрастает. Оцифрованный кадр может затем быть изменен, отредактирован обычным графическим редактором, могут быть убраны или добавлены детали, изменены цвета, масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д. Естественно, интерактивная экранная обработка возможна лишь в пределах разрешения, обеспечиваемого данным конкретным видеоадаптером.
Обработанные кадры могут быть записаны на диск в каком–либо графическом формате и затем использоваться в качестве реалистического неподвижного фона для компьютерной анимации. Возможна также покадровая обработка исходного изображения и вывод обратно на видеопленку для создания псевдореалистического мультфильма.
Запись последовательности кадров в цифровом виде требует от компьютера больших объемов внешней памяти: частота кадров в американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM — 25 кадров/с), так что для запоминания одной секунды полноцветного полноэкранного видео требуется 20–30 Мбайт, а оптический диск емкостью 600 Мбайт вместит менее полминуты изображения. Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на экран в соответствующем темпе. Подобной скоростью передачи информации — около 30 Мбайт / с — не обладает ни одно из существующих внешних запоминающих устройств. Чтобы выводить на экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых данных, (вывод уменьшенного изображения в небольшом окне, снижение частоты кадровой развертки до 10–15 кадров / с, уменьшение числа бит / пиксель), что, в свою очередь приводит к ухудшению качества изображения.
Более радикально обе проблемы — памяти и пропускной способности — решаются с помощью методов сжатия / развертки данных, которые позволяют сжимать информацию перед записью на внешнее устройство, а затем считывать и разворачивать в реальном режиме времени при выводе на экран. Так, для движущихся видеоизображений существующие адаптивные разностные алгоритмы могут сжимать данные с коэффициентом порядка 100:1— 160:1, что позволяет разместить на CD–ROM около часа полноценного озвученного видео. Работа этих алгоритмов основана на том, что обычно последующий кадр отличается от предыдущего лишь некоторыми деталями, поэтому, взяв какой–то кадр за базовый, для следующих можно хранить только относительные изменения. При значительных изменениях кадра, например, при монтажной склейке, наезде или панорамировании камеры, автоматически выбирается новый базовый кадр. Для статических изображений коэффициент сжатия, естественно, ниже — порядка 20–30:1. Для аудиоданных применяют свои методы компрессии.
При использовании специальных видео–адаптеров (видеобластеров) мультимедиа–ПК становятся центром бытовой видео–системы, конкурирующей с самым совершенным телевизором.
Новейшие видеоадаптеры имеют средства связи с источниками телевизионных сигналов и встроенные системы захвата кадра (компрессии / декомпрессии видеосигналов) в реальном масштабе времени, т.е. практически мгновенно.
Видеоадаптеры имеют быструю видеопамять до 512 Мбайт и специальные графические 3D-ускорители процессоры. Это позволяет получать до 100 кадров в секунду и обеспечить вывод подвижных полноэкранных изображений.
Имеется большое количество устройств, предназначенных для работ с видеосигналами на IBM PC совместимых компьютеров. Условно можно разбить на несколько групп: устройства для ввода и захвата видеопоследовательностей (Cupture play), фреймграбберы (Framegrabber), TV-тюнеры, преобразователи сигналов VGA-TV и др..


TVтюнеры
Эти устройства выполняются обычно в виде карт или бокса (небольшой коробочки). Они преобразуют аналоговый видеосигнал поступающий по сети кабельного телевидения или от антенны, от видеомагнитофона или камкордера (camcorder). TV-тюнеры могут входить в состав других устройств таких как MPEG-плейеры или фреймграбберы. Некоторые из них имеют встроенные микросхемы для преобразования звука. Ряд тюнеров имеют возможность для вывода телетекста.


Фреймграбберы
Как правило они объединяют графические, аналогово-цифровые и микросхемы для обработки видеосигналов, которые позволяют дискретизировать видеосигнал, сохранять отдельные кадры изображения в буфере с последующей записью на диск либо выводить их непосредственно в окно на мониторе компьютера. Содержимое буфера обновляется каждые 40 мс. То есть с частотой смены кадров. Вывод видеосигналов происходит в режиме наложения (overby). Для реализации окна на экране монитора с "живым" видео карта фреймграббера соединена с графическим адаптером через 26 контактный Feature коннектор. С ним обычно поставляется пакет Video for Windows вывод картинки размером 240*160 пикселов при воспроизведении 256 цветов и больше. Первые устройства - Video Blaster, Video Spigot.

Преобразователи VGA-TV
Данные устройства транслируют сигнал в цифровом образе VGA изображения в аналоговый сигнал пригодный для ввода на телевизионный приемник. Производители обычно предлагают подобные устройства выполненные либо как внутренние ISA карта либо как внешний блок. Ряд преобразователей позволяют накладывать видеосигнал например для создания титров. При этом осуществляется полная синхронизация преобразованного компьютерного сигнала по внешнему(gtnlok). При наложении формируется специальный ключевой (key) сигнал трех видов lumakey, chromakey или alpha chenol.

MPEG-плейеры
Данные устройства позволяют воспроизводить последовательности видеоизображения (фильмы) записываемых на компакт- дисках, качеством VNS. Скорость потока сжатой информации не превышает обычно 150 Кбайт/с. Основная сложность задачи решаемой MPEG кодером, состоит в определении для каждого конкретного видеопотока оптимального соотношения между тремя видами изображения: (I)ntra, (P)redicted и (B)idirectional. Первым MPEG –плейером была плата Reel Magic компании Sigina Desing в 1993 году.

Мультимедиа презентации
Мультимедиа презентация представляет собой мультимедийный продукт, в состав которого могут входить текст и текстовые спецэффекты, речевое и музыкальное сопровождение, анимации, видеоклипы, галереи картин и слайдов (слайд-шоу) и т.д.
Мультимедиа презентации широко используются при создании обучающих программ, в том числе и на на лазерных дисках, при создании рекламных роликов, видеоклипов и т.д. Существует ряд программ, позволяющих создавать мультимедиа презентации, например MicroSoft PowerPoint (4.0, 7.0, 97). Среди этих программ большое значение имеют программы, которые могут захватывать видеоролики с экрана и преобразовывать их в AVI и EXE видеофайлы. К таким программам относятся программы MicroSoft Camcorder, Hiper Cam, Lotus ScreenCam. Однако, такие презентации не являются интерактивными, но они могут стать частью большой интерактивной презентации.
Большие возможности при создании мультимедиа презентаций даёт применение Интернет-технологий, например использование редактора языка HTML и просмотрщика Web-страниц MicroSoft Internet Explorer, который установлен на большинстве современных компьютеров. В простейшем случае в качестве редактора языка HTML можно использовать редактор Блокнот (Notepad) для Windows. Такая технология значительно проще, чем использование программы PowerPoint, а эффективность её достаточно высока (на уровне возможностей компьютерной сети Интернет).
Можно на языке HTML создавать Web-страницы — файлы формата htm или html, содержащие текст, картинки, анимации, речевое и музыкальное сопровождение, видеоклипы, связанные между собой гипертекстовыми ссылками. Переходя от одной Web-страницы к другой при помощи гипертекстовых ссылок, можно создавать при помощи кнопок и других элементов диалога интерактивную мультимедиа презентацию (мультимедиа проект) на любую тему.


Программные средства мультимедиа

Графика и фотоизображения
Один из способов представления изображения в компьютере — растровая графика (bitmap). В этом случае изображение делится на элементы (pixels), которые определяют размер картинки — X пикселов по ширине и Y пикселов по высоте. Важной характеристикой является цветовое разрешение растровой графики, определяемое числом битов, используемых для кодирования цвета каждого пиксела (его называют также числом битовых плоскостей). Понятно, что чем больше битовых плоскостей в файле, тем больше места требуется на диске для его сохранения.
Другой способ представления — векторные изображения, которые сохраняются в виде геометрического описания объектов, составляющих рисунок. Эти изображения могут также включать в себя данные в формате растровой графики. В векторных форматах число битовых плоскостей заранее не определено.
Сетевая графика представлена преимущественно двумя форматами файлов - GIF (Graрhics Interchange Format) и JРG (Joint Рhotograрhics Exрerts Grouр). Оба этих формата являются компрессионными, то есть данные в них уже находятся в сжатом виде.

Читайте также: