Кодирование звуковой информации реферат

Обновлено: 05.07.2024

Среди средств мультимедиа звук - явление особое. Вроде кошки, которая ухитряется существовать сама по себе наперекор всему. Текст и графика вроде бы неплохо сдружились друг с другом и постоянно идут рука об руку. Но при этом и часть своей самобытности потеряли - текст и графика сегодня редко встречаются по отдельности. В связке - другое дело, а вот порознь.

Звук, напротив, постоянно пребывает в одиночном плавании. А всё потому, что слишком жаден до внимания этот вид информации - всё на себя перетягивает. Звучит, к примеру, на странице Internet какая-нибудь мелодия - и вот уже и текст в голову не лезет, и картинки уже не так радуют глаз.

А с другой стороны, по этой же самой причине звук не прощает дилетантского подхода. Огрехи текста или картинки далеко не всякий разглядит. А вот фальшь, низкое качество созданной или обработанной нами композиции любой слушатель с не отдавленным русским медведем ухом в момент почувствует.

1. Природа звука

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, шелест листьев и завывание ветра, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют, люди начали догадываться очень давно. Замечали, к примеру, что звук создают вибрирующие в воздухе тела. Ещё древнегреческий философ и учёный - энциклопедист Аристотель, исходя из наб- людений, верно объяснил природу звука, полагая, что звучащее тело создаёт попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то уплотняет, то разрежает воздух, а, благодаря упругости воздуха, эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны, достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

2. Восприятие звуковых раздражений

3. Частота, амплитуда - характеристики звука

Каждый звук характеризуется частотой (высотой звука), интенсивностью (громкостью). Частота -это количество звуковых колебаний в секунду; измеряется она в герцах (Гц). Чем больше частота, тем выше звук.

Человеческое ухо воспринимает не все частоты. Очень немногие слышат звуки с частотами ниже 16 Гц и выше 20 Гц. Частота звука самой низкой ноты на рояле равна 27 Гц, а самой высокой - чуть больше кГц. Наивысшая звуковая частота, которую могут передать вещательные ЧМ-радиостанций –15 кГц.

Громкость определяется амплитудой колебаний. Амплитуда звуковых колебаний зависит, в свою очередь, от мощности источника звука. Например, струна пианино при слабом ударе по клавише звучит тихо, поскольку размах её колебаний невелик. Если же ударить по клавише посильнее, размах колебаний струны увеличится. Громкость звука измеряется в децибелах (дБ). Шорох листьев имеет громкость около 20 дБ, обычный уличный шум-около 70, а близкий удар грома-до 120 дБ.

Важными параметрами являются частота квантования звуковых сигналов и раз рядность квантования. Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 Кгц до 45–48 Кгц. Разрядность квантования характеризует число ступеней квантования и измеряется степенью числа 2.

Частотный диапазон Вид сигнала Частота квантования
400 – 3500 Гц Речь (едва разборчива) 5.5 Кгц
250 – 5500 Гц Речь (среднее качество) 11.025 Кгц
40 – 10000 Гц Качество звучания УКВ–приемника 22.040 Кгц
20 – 20000 Гц Звук высокого качества 44.100 Кгц

4. Информация аналоговая и цифровая

В природе информация распространяется в виде сигналов, а все сигналы, как известно, имеют энергетическую природу. Они могут быть сильнее или слабее, им свойственно явление затухания. Сигналы разной интенсивности несут разную информацию. Информацию такого рода называют аналоговой. Аналоговая информация непрерывна, и мы никогда не встретим два листа на дереве, имеющих одинаковый цвет, или два облака на небе, имеющих одинаковую форму.

В компьютерах информация представляется в виде данных, которые имеют другую природу. Аналоговые сигналы заменяются числовым представлением. Чем больше яркость зелёного цвета на фотографии, тем большим числом в памяти компьютера представляется этот сигнал. То же относится и к красному, и к синему, и к серому цвету. То же относится и к звукам и к другим видам сигналов. Информацию, представленную в такой форме, называют цифровой. Цифровая информация дискретна, поскольку для представления бесконечного многообразия цветов, звуков и форм используется вполне определённое и конечное количество чисел.

Представление аналоговой информации в цифровом виде называется аналого-цифровым преобразованием. Чем больше разных чисел используется для такого преобразования, тем выше дискретность цифровой информации и тем выше её точность, то есть тем ближе цифровая информация к аналоговой.

4.1 Представление и способы передачи цифровой информации

Представление информации в виде цифровых данных не случайно выбрано в качестве основополагающего принципа работы компьютера. У аналоговых сигналов слишком многое зависит от интенсивности, а она постепенно уменьшается в процессе затухания. Другое дело-цифровые данные. Здесь всё просто: сигнал либо есть, либо его нет.

Цифровые данные по проводнику передаются путём смены текущего напряжения: нет напряжения-"0",есть напряжение-"1". Существует два способа передачи информации по физически передающей среде: цифровой и аналоговый.

При цифровом (узкополосном способе передачи) данные.

Передаются в их естественном виде на единой частоте. Он позволяет передавать только цифровую информацию, обеспечивает в каждый данный момент времени возможность использования передающей среды только двумя пользователями и допускает нормальную работу только на ограниченные расстояния. В то же время узкополосной способ передачи обеспечивает высокую скорость обмена данными - до 10 Мбит/с и позволяет создавать легко конфигурируемые вычислительные сети. Подавляющее число локальных вычислительных сетей использует узкополосную передачу.

Аналоговый способ передачи цифровых данных обеспечивает широкополосную передачу за счёт использования в одном канале сигналов различных несущих частот.

При аналоговом способе передачи происходит управление параметрами сигнала несущей частоты для передачи по каналу связи цифровых данных. Сигнал несущей частоты представляет собой гармоническое колебание, описываемое уравнением:

X = Xmax * sin ,

где Xmax -амплитуда колебаний; - частота; t -время; -начальная фаза колебаний.

Передать цифровые данные по аналоговому каналу можно, управляя одним из параметров сигнала несущей частоты: амплитудой, частотой или фазой. Так как необходимо передавать данные в двоичном виде, то можно предложить следующие способы управления: амплитудный, частотный, фазовый.

Амплитудная модуляция:"0"-отсутствие сигнала, то есть отсутствие колебаний несущей частоты;"1"-наличие сигнала, то есть наличие колебаний несущей частоты.

Частотная модуляция предусматривает передачу сигналов 0 и 1 на разной частоте. При переходе от 0 к 1 и от 1 к 0 происходит изменение сигнала несущей частоты.

Фазовая модуляция: при переходе от 0 к 1 и от 1 к 0 меняется фаза колебаний, то есть их направление.

5. Дискретизация

Процесс записи и воспроизводства звука в компьютере в самых общих чертах выглядит следующим образом.

6. Способы записи аудиоинформации

Длительность звучания стандартного компакт-диска составляет 74 минуты. Структура информации на диске следующая. В начале диска располагается так называемая вводная зона. Здесь располагается различная специальная информация о формате диска, структуре и адресах звуковых фрагментов. За этой областью располагается небольшой зазор (около двух секунд) и начинается программная зона, содержащая в себе, собственно, звуковые данные. Выводная зона служит границей диска.

6.1 Бит в бит

Информацию на диск в данном случае записывается как есть, то есть её помещают на 74 минуты. В этом случае получаем большой размер файлов. На обычном компакт-диске, например, частота дискретизации аудио составляет-441000 Гц, а значение сигнала описано 16 битами. Таким образом, на описание одной секунды аудио в формате CD-DA тратится 176400 байт(172 Кбайт), одной минуты-10 Мбайт.

Применение сжатия позволяет уменьшить размеры файлов. Есть два типа сжатия-с потерями качества и без потерь качества. При упоминании о сжатии аудио подразумевается сжатие с потерями качества. Любое сжатие информации приводит к ухудшению её качества. Однако в процессе эволюции человеческий слух научился адаптироваться к некоторым видам помех, не замечая их присутствия в принимаемой аудиоинформации.

6.3 Структура болванки CD-R

Прежде чем начать описание форматов записи, необходимо обрисовать саму структуру записываемого диска, чтобы понять, какие процессы происходят при его записи. Итак, в структуре CD-R диска можно выделить четыре основных слоя (пятый - изображение, нанесенное на поверхность диска), наносимых поэтапно. Изначально изготавливается пластмассовая основа диска - поликарбонат (Е), которая составляет основную часть CD-R и придает ему необходимую прочность и форму. Далее, на готовую пластмассовую форму наносится активный слой (D) /dye/. Именно этот слой позволяет осуществлять запись на диск и определяет его надежность и качество считывания информации в дальнейшем. На сегодняшний день широко используется два типа активного слоя: цианин и фталоцианин. Цианиновый краситель обладает сине-зеленым (цвет "морской волны") или насыщенно синим оттенком рабочей поверхности, фталоцианин, в большинстве случаев, практически бесцветен, с бледным оттенком салатового или золотистого цвета. Цианиновый краситель более терпим к предельным сочетаниям мощности чтения/записи, чем "золотой" фталоцианиновый, поэтому зачастую диски на основе цианинового слоя проще считывать на некоторых дисководах. Фталоцианин - несколько более современная разработка. Диски на основе этого активного слоя менее чувствительны к солнечному свету и ультрафиолетовому излучению, что способствует увеличению долговечности записанной информации и несколько более надежному хранению в неблагоприятных условиях. После того, как на поликарбонатовую заготовку был нанесен dye, диск покрывается специальным слоем светоотражающего материала (C). В обычных CD-ROM для этой цели применяется алюминий, в CD-R дисках же применяется чистое серебро, позволяющее добиться 65-80%-го коэффициента отражения. Завершающим этапом изготовления диска является нанесение защитного слоя (В), на который в дальнейшем возможно нанесение изображений (А). Наиболее распространенным и простым в изготовлении защитным слоем является специальный лак.

В проигрывателе имеется электродвигатель со следящей систе, мой, обеспечивающей точное считывание дорожки лазерным лучом и неизменную линейную скорость считывания. Поэтому скорость вращения диска непостоянна и изменяется от 500 об. / мин. для внутренней части диска, с которой начинается считывание, до 200 об. / мин. для внешней. Специальный оптико-электронный блок имеет устройства для стабилизации излучения лазера, автоматической фокусировки, слежения за дорожкой при биении диска и выбора треков диска для считывания.

Для считывания информации с CD–ROM используется полупроводниковый диод с фокусирующей и следящей оптической системой. Внутренняя поверхность диска, на которую кладут диск на подставку (в кассету) дисковода, находится не в фокусе оптической системы лазерного излучателя. Диаметр светового пятна от лазера, создающего сходящийся конус света, порядка 1 мм. Поэтому умеренные загрязнения нерабочей поверхности, например, пылинки на ней, отпечатки пальцев и даже небольшие царапины практически не влияют на воспроизведение.

6.4 Запись CD-R

На СD-R информация записывается при помощи CD рекодера. Энергия луча лазера поглощается органическим красителем болванки, вследствие чего он меняет свою отражательную способность. Иногда этот процесс называют "прожигом", что на самом деле не совсем точно отражает процесс формирования "питов" - участков слоя с ухудшенной прозрачностью. Считываются такие болванки немного хуже, чем обычные CD-ROM диски, из-за наличия дополнительного слоя, уменьшающего коэффициент отражения. Большое значение имеет и качество формирования "питов" на диске, что зависит как от свойств органического красителя, так и от самого CD рекордера. Когда лазерный луч высокой интенсивности фокусируется на этом слое, цвет красителя меняется, что, в свою очередь, ведет к изменению отражающей способности данной точки. Под воздействием луча стандартного лазера CD-ROM- с меньшей мощностью, чем записывающий луч CD-R, - изменившие цвет точки отражают меньше света, и это позволяет накопителю распознавать записанные данные. Процесс изменения цвета слоя красителя необратим, поэтому диски CD-R допускают только однократную запись. (Строго говоря, писать на CD-R можно и в несколько сеансов, но всякий раз начинать запись нужно на новом участке диска).

6.5 Запись CD-RW

CD-RW, стандарт перезаписываемых CD-дисков, - это сокращение от CD-Rewritable, т.е. перезаписываемый CD. Разница между CD-RW и CD-R заключается в том, что диски CD-RW могут быть стерты и повторно записаны, в то время как на дисках CD-R возможна только однократная запись. В остальном, они используются так же, как и диски CD-R. Технология записи информации на CD-RW диски немного отличается от CD-R. Приводы CD-RW используют технологию изменения фазы. Вместо создания "пузырьков" и деформаций записываемого слоя красителя используется тонкого слоя материала, отражающая способность которого меняется при внешних воздействиях. Под влиянием лазерного луча умеренной мощности, которая называется мощностью записи (writepower), этот слой нагревается, а при остывании его материал кристаллизуется. При нагревании лучом большей мощности (мощность стирания, или erasepower) происходит переход материала в аморфное состояние. В кристаллическом состоянии слой лучше отражает свет, и накопитель получает возможность считывать данные. Для считывания данных в накопителях CD-RW используется лазерный луч, мощность которого (мощность чтения, или readpower) меньше, чем у записывающих и стирающих лучей.

Список используемых источников

1. Новейший самоучитель работы на компьютере под редакцией С. Симоновича, Москва, 1999, 656 с.

4. Популярная медицинская энциклопедия главный редактор Б.В. Петровский-Москва,"Советская энциклопедия", 1984, 704 с.

5. Энциклопедический словарь юного физика-Москва, 1984, 352 с.

6. Н.Е. Ковалёв, Л.Д. Шевчук, О.И. Щуренко Биология для подготовительных отделений медицинских институтов-Москва, "Высшая школа", 1986, 384 с.

7. Кинтуель Т. "Руководство программиста по работе со звуком": Перевод с англ. - Москва: ДМК, 2000.

8. Секунов Н.Ю. "Обработка звука на РС: Наиболее полное руководство в подлиннике ". - Санкт-Петербург, 2001.

Изучение зависимости громкости и высоты тона звука от интенсивности и частоты звуковой волны. Характеристика принципов оцифровки звука. Ознакомление с особенностями временной дискретизации звука. Рассмотрение схемы полного цикла преобразования звука.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 13.11.2014
Размер файла 518,5 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

1. Кодирование и обработка звуковой информации

2. Цифро-аналоговое и аналого-цифровое преобразование звуковой информации

3. Принципы оцифровки звука

4. Кодирование звуковой информации

5. Временная дискретизация звука

6. Глубина кодирования звука

7. Линейное (однородное) квантование амплитуды

8. Другие способы оцифровки

9. Аналогово-цифровые преобразователи (АЦП)

10. Кодирование оцифрованного звука перед его записью на носитель

11. Хранение звуковой информации

12. Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя

13. Помехоустойчивое и канальное кодирование

14. Принцип действия цифро-аналогового преобразователя

15. Таблично-волновой синтез

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно.

Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

В учении о звуке важны такие понятия как тон и тембр звука. Всякий реальный звук, будь то игра музыкальных инструментов или голос человека, - это своеобразная смесь многих гармонических колебаний с определенным набором частот.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1).

Рис. 1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Колебание, которое имеет наиболее низкую частоту, называют основным тоном, другие - обертонами.

Тембр - разное количество обертонов, присущих тому или иному звуку, которое придает ему особую окраску. Отличие одного тембра от другого обусловлено не только числом, но и интенсивностью обертонов, сопровождающих звучание основного тона. Именно по тембру мы легко можем отличить звуки рояля и скрипки, гитары и флейты, узнать голос знакомого человека.

Музыкальный звук можно характеризовать тремя качествами: тембром, т. е. окраской звука, которая зависит от формы колебаний, высотой, определяющейся числом колебаний в секунду (частотой), и громкостью, зависящей от интенсивности колебаний.

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10^14 раз (в сто трилионов раз). Для измерения громкости звука применяется специальная единица "децибел" (дБ) (табл. 1). Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 1. Громкость звука

Нижний предел чувствительности человеческого уха

1. Кодирование и обработка звуковой информации

Компьютер широко применяют в настоящее время в различных сферах. Не стала исключением и обработка звуковой информации, музыка.

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала.

До 80-х годов все записи музыки выходили на виниловых пластинках и кассетах. В настоящее время широкое распространение получили компакт-диски. Если имеется компьютер, на котором установлена студийная звуковая плата, с подключенными к ней MIDI-клавиатурой и микрофоном, то можно работать со специализированным музыкальным программным обеспечением.

Условно его можно разбить на несколько видов:

1. всевозможные служебные программы и драйверы, предназначенные для работы с конкретными звуковыми платами и внешними устройствами;

2. аудиоредакторы, которые предназначены для работы со звуковыми файлами, позволяют производить с ними любые операции - от разбиения на части до обработки эффектами;

3. программные синтезаторы, которые появились сравнительно недавно и корректно работают только на мощных компьютерах. Они позволяют экспериментировать с созданием различных звуков и другие.

К первой группе относятся все служебные программы операционной системы. Так, например, Windows имеет свои собственные программы микшеры и утилиты для воспроизведения/записи звука, проигрывания компакт-дисков и стандартных MIDI - файлов. Установив звуковую плату можно при помощи этих программ проверить ее работоспособность. Если необходимо сделать звукозапись, то нужно определиться с качеством звука, так как именно от нее зависит продолжительность звукозаписи. Возможная продолжительность звучания тем меньше, чем выше качество записи.

А как же происходит кодирование звука? С самого детства мы сталкиваемся с записями музыки на разных носителях: грампластинках, кассетах, компакт-дисках и т.д. В настоящее время существует два основных способах записи звука: аналоговый и цифровой. Но для того чтобы записать звук на какой-нибудь носитель его нужно преобразовать в электрический сигнал.

Это делается с помощью микрофона. Самые простые микрофоны имеют мембрану, которая колеблется под воздействием звуковых волн. К мембране присоединена катушка, перемещающаяся синхронно с мембраной в магнитном поле. В катушке возникает переменный электрический ток. Изменения напряжения тока точно отражают звуковые волны.

Виниловая пластинка является примером аналогового хранения звуковой информации, так как звуковая дорожка свою форму изменяет непрерывно. Но у аналоговых записей на магнитную ленту есть большой недостаток - старение носителя. За год фонограмма, которая имела нормальный уровень высоких частот, может их потерять. Виниловые пластинки при проигрывании их несколько раз теряют качество. Поэтому преимущество отдают цифровой записи.

В начале 80-х годов появились компакт-диски. Они являются примером дискретного хранения звуковой информации, так как звуковая дорожка компакт - диска содержит участки с различной отражающей способностью. Теоретически эти цифровые диски могут служить вечно, если их не царапать, т.е. их преимуществами являются долговечность и неподверженность механическому старению. Другое преимущество заключается в том, что при цифровой перезаписи нет потери качества звука.

2. Цифро-аналоговое и аналого-цифровое преобразование звуковой информации

Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука).

3. Принципы оцифровки звука

Цифровой звук -- это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.

Оцифровка звука -- технология деления временным шагом и последующей записи полученных значений в численном виде.

Другое название оцифровки звука -- аналогово-цифровое преобразование звука.

4. Кодирование звуковой информации

Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Он проходит через звуковой тракт и попадает в аналого-цифровой преобразователь (АЦП) - устройство, которое переводит сигнал в цифровую форму.

Оцифровка звука включает в себя два процесса:

процесс дискретизации (осуществление выборки) сигнала по времени

процесс квантования по амплитуде

5. Временная дискретизация звука

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации.

Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором наивысшая частота спектра равна Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm.

На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (0 -- 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).

Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек" (рис. 2).

Рис. 2. Временная дискретизация звука

6. Глубина кодирования звука

Разрядность указывает с какой точностью происходят изменения амплитуды аналогового сигнала. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени, определяет качество сигнала после цифро-аналогового преобразования. Именно от разрядности зависит достоверность восстановления формы волны.

7. Линейное (однородное) квантование амплитуды

Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от -1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды -- динамический диапазон сигнала -- в виде 2N -1 равных промежутков, разделив его на 2N уровней -- квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде -- процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).

Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит * 24 000 * 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

8. Другие способы оцифровки

Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией -- неоднородной ИКМ (Nonuniform PCM).

9. Аналогово-цифровые преобразователи (АЦП)

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).

Это преобразование включает в себя следующие операции:

1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.

2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени -- отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП -- устройства выборки-хранения.

3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин -- уровней квантования.

4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

10. Кодирование оцифрованного звука перед его записью на носитель

Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования.

11. Хранение звуковой информации

Для хранения цифрового звука существует много различных способов.

Оцифрованный звук представляет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел - значений амплитуды. В этом случае существуют два способа хранения информации.

Первый - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)

Второй - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) - запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.

Кодирование данных без потерь (lossless coding) - способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

Содержание

Введение 3
Кодирование звуковой информации 4
Компьютерное представление звуковой информации4
Аналого-цифровой преобразователь4
одмешивание псевдослучайного сигнала6
2.3. Кодирование оцифрованного звука перед его записью на носитель7
2.4. Цифро-аналоговый преобразователь9
2.5. Теорема Котельникова10
3. Помехоустойчивое и канальное кодирование11
4. Основные звуковые форматы12
5. Цифровые синтезаторы музыкальных звуков14
6. Анализ музыкальных инструментов14
7. Синтез музыкальных звуков17
8. Обработка звука17
Заключение19
Список литературы20

Вложенные файлы: 1 файл

тертычный реферат.docx

  1. Кодирование звуковой информации 4
  2. Компьютерное представление звуковой информации4
    1. Аналого-цифровой преобразователь4
    2. одмешивание псевдослучайного сигнала6

    2.3. Кодирование оцифрованного звука перед его записью на носитель7

    2.4. Цифро-аналоговый преобразователь9

    2.5. Теорема Котельникова10

    3. Помехоустойчивое и канальное кодирование11

    4. Основные звуковые форматы12

    5. Цифровые синтезаторы музыкальных звуков14

    6. Анализ музыкальных инструментов14

    7. Синтез музыкальных звуков17

    8. Обработка звука17

    Заключение19

    Список литературы20

    Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

    На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду). В соответствии с этим упругие волны в любой среде, частоты которых лежат в указанных пределах, называют звуковыми волнами или просто звуком. В учении о звуке важны такие понятия как тон и тембр звука. Всякий реальный звук, будь то игра музыкальных инструментов или голос человека, - это своеобразная смесь многих гармонических колебаний с определенным набором частот.

    Колебание, которое имеет наиболее низкую частоту, называют основным тоном, другие - обертонами.

    Тембр - разное количество обертонов, присущих тому или иному звуку, которое придает ему особую окраску. Отличие одного тембра от другого обусловлено не только числом, но и интенсивностью обертонов, сопровождающих звучание основного тона. Именно по тембру мы легко можем отличить звуки рояля и скрипки, гитары и флейты, узнать голос знакомого человека.

    Музыкальный звук можно характеризовать тремя качествами: тембром, т. е. окраской звука, которая зависит от формы колебаний, высотой, определяющейся числом колебаний в секунду (частотой), и громкостью, зависящей от интенсивности колебаний.

    Компьютер широко применяют в настоящее время в различных сферах. Не стала исключением и обработка звуковой информации, музыка. До 1983 года все записи музыки выходили на виниловых пластинках и компакт-кассетах. В настоящее время широкое распространение получили компакт-диски. Если имеется компьютер, на котором установлена студийная звуковая плата, с подключенными к ней MIDI-клавиатурой и микрофоном, то можно работать со специализированным музыкальным программным обеспечением.

    Из курса физики известно, что звук является волной, т.е. колебанием среды. В повседневной жизни средой является воздух, но на самом деле это необязательное условие. К примеру, звук хорошо распространяется по поверхности земли и в одной среде. Напротив, в вакууме и космосе звук не распространяется.

    Звуковые колебания легко преобразуются в электрические с помощью микрофона. Сигнал микрофона является очень слабым, но на современном уровне развития техники его усиление не представляет проблемы. Форму полученных колебаний, т.е. зависимость интенсивности сигнала от времени, можно наблюдать на экране осциллографа - электроннолучевого, прибора для наблюдения функциональной связи между двумя или несколькими величинами (параметрами и функциями; электрическими или преобразованными в электрические).

    В эпоху аналоговой записи звука, для сохранения полученного электрического сигнала его преобразовывали в ту или иную форму другой физической природы, которая зависела от применяемого носителя.

    Например, при изготовлении грампластинок сигнал вызывал механические изменения размеров звуковой дорожки ( с помощью специальной аппаратуры сигнал преобразовался в механические колебания сапфирового резца, который нарезал на слое материала концентрические звуковые канавки).

    Для старых киноаппаратов звук на пленку наносился оптическим методом (запись электрических колебаний звуковой частоты, осуществлялась фотографическим способом на движущейся киноплёнке).

    Наибольшее распространение в быту получил процесс магнитной звукозаписи (запись производилась с помощью специального устройства - записывающей магнитной головки, создающей переменное магнитное поле на участке движущегося носителя (зачастую магнитной ленты), обладающего магнитными свойствами).

    Во всех случаях интенсивность звука была строго пропорциональна какой-либо величине, например, ширине оптической звуковой дорожки, причем эта величина имела непрерывный диапазон значений.

    1. Компьютерное представление звуковой информации.
      1. . Аналого-цифровой преобразователь

      Переход к записи звука в компьютерном виде потребовал принципиально новых подходов. При цифровой записи зависимости интенсивности звука от времени возникает принципиальная трудность: исходный сигнал непрерывен (т.е. его параметр может принимать любе значение в пределах некоторого интервала), а компьютер способен хранить в памяти только дискретные (параметр может принимать только конечное число значений в пределах некоторого интервала). Отсюда следует, что в процессе сохранения звуковой информации она должна быть “оцифрована”, т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты компьютера, который называется АЦП -- аналого-цифровой преобразователь.

      Основные принципы работы АЦП:

      • АЦП производит дискретизацию записываемого звукового сигнала по времени. Это означает, что измерение уровня интенсивности звука в определенные фиксированные моменты времени (чаще всего через равные временные промежутки). Частоту, характеризующую периодичность измерения звукового сигнала, принято называть частотой дискретизации. Её выбор в значительной степени зависит от частотного спектра сохраняемого сигнала: существует специальная теорема Найквиста, согласно которой частота оцифровки звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала. Считается, человек слышит звук частотой не более 20 000 Гц = 20 кГц, поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц. Частота при таких требованиях должна быть не ниже 44 кГц. Такая частота чаще всего используется, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты 8 кГц. Результат при этом получается хотя и не блестящий, но вполне разборчивый, к примеру такое качество у голоса в телефоне.

      Качество воспроизведения тем лучше, чем выше частота дискретизации, но в то же время и объем занимаемое памяти звуковых данных при этом тоже возрастает, так что оптимального “на все случаи” значения частоты не существует и частота всегда выбирается из расчета что более важно качество или объем занимаемой памяти.

      • АЦП производит дискретизацию амплитуды звукового сигнала Это следует понимать так, что при измерении имеется “сетка” стандартных уровней (например, 256 или 65 536 -- это количество характеризует глубину кодирования (количество бит на кодировку звука)), и текущий уровень измеряемого сигнала округляется до ближайшего из них. В итоге появляется линейная зависимость между величиной входного сигнала и номером уровня. То есть в том случае, когда, например, громкость возрастает в 2 раза, то ожидается, что и соответствующее ему число возрастет вдвое. Но такое распределение применяется только в простейших случаях. Чаще всего при записи звука используют неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон.

      Таким образом, в ходе оцифровки звука мы получаем поток целых чисел, причем величина числа соответствует силе звука в данный момент.

      Данный метод преобразования показывает, что звук, как и любая другая информация, для возможности хранения в памяти компьютера, нуждается в представлении его в числовом форме и в последующем переводе в двоичную систему счисления.

      Некоторые характеристики АЦП могут быть улучшены путём использования методики подмешивания псевдослучайного сигнала. Она заключается в добавлении к входному аналоговому сигналу случайного шума ( белый шум ) небольшой амплитуды. Амплитуда шума, как правило, выбирается на уровне половины МЗР . Эффект от такого добавления заключается в том, что состояние МЗР случайным образом переходит между состояниями 0 и 1 при очень малом входном сигнале (без добавления шума МЗР был бы в состоянии 0 или 1 долговременно). Для сигнала с подмешанным шумом вместо простого округления сигнала до ближайшего разряда происходит случайное округление вверх или вниз, причём среднее время, в течение которого сигнал округлён к тому или иному уровню зависит от того, насколько сигнал близок к этому уровню. Таким образом, оцифрованный сигнал содержит информацию об амплитуде сигнала с разрешающей способностью лучше, чем МЗР, то есть происходит увеличение эффективной разрядности АЦП. Негативной стороной методики является увеличение шума в выходном сигнале. Фактически, ошибка квантования размазывается по нескольким соседним отсчётам. Такой подход является более желательным, чем простое округление до ближайшего дискретного уровня. В результате использования методики подмешивания псевдослучайного сигнала мы имеем более точное воспроизведение сигнала во времени. Малые изменения сигнала могут быть восстановлены из псевдослучайных скачков МЗР путём фильтрации. Кроме того, если шум детерминирован (амплитуда добавляемого шума точно известна в любой момент времени), то его можно вычесть из оцифрованного сигнала, предварительно увеличив его разрядность, тем самым почти полностью избавиться от добавленного шума.

      Звуковые сигналы очень малых амплитуд, оцифрованные без псевдослучайного сигнала, воспринимаются на слух очень искажёнными и неприятными. При подмешивании псевдослучайного сигнала истинный уровень сигнала представлен средним значением нескольких последовательных отсчётов.

      Однако, в последнее время ( 2009 год ), в связи с удешевлением 24-битных АЦП, имеющих даже без dihter’а динамический диапазон более 120 дБ, что на несколько порядков превышает полный воспринимаемый человеком диапазон слуха, данная технология потеряла актуальность в звукотехнике. При этом, она используется в ВЧ и СВЧ технике, где битность АЦП обычно мала из-за высокой частоты дискретизации.

        1. Кодирование оцифрованного звука перед его записью на носитель

        Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

        Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел – значений амплитуды. В этом случае существуют два способа хранения информации.

          • Первый – PCM (Pulse Code Modulation – импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
          • Второй – ADPCM (Adaptive Delta PCM – адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

          Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.

          Кодирование данных без потерь (lossless coding) – способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.

          Развитие способов кодирования звуковой информации, а также движущихся изображений – анимации и видеозаписей – происходило с запаздыванием относительно рассмотренных выше разновидностей информации.

          Итак, каким же образом можно описать аналоговый аудио сигнал в цифровой форме? Реальный аудио сигнал – это сложное по форме колебание, некая сложная зависимость амплитуды звуковой волны от времени. На рис. 2 представлен график реальной звуковой волны.


          Рис.2. Изображение реальной звуковой волны

          Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Поступим следующим образом. Будем измерять напряжение через равные промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой).

          Преобразование аналогового звукового сигнала в цифровой вид называется аналогово-цифровым преобразованием или оцифровкой. Процесс такого преобразования заключается в:

          · осуществлении замеров величины амплитуды аналогового сигнала с некоторым временным шагом – дискретизация,

          · последующей записи полученных значений амплитуды в численном виде – квантование.

          Процесс дискретизации по времени - это процесс получения мгновенных значений преобразуемого аналогового сигнала с определенным временным шагом, называемым шагом дискретизации.

          Чем выше частота дискретизации (т. е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.

          Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс называется квантованием по амплитуде. Говоря более формальным языком, квантование по амплитуде – это процесс замены реальных (измеренных) значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Квантование значений сигнала привносит в спектр сигнала дополнительную помеху, называемую шумом квантования или шумом дробления. Шумом (ошибкой) квантования называют сигнал, составляющий разницу между восстановленным цифровым и исходным аудио сигналами. Эта разница образуется в результате округления измеренных значений сигнала. При этом выполняется следующая закономерность: чем выше разрядность квантования, тем ниже уровень шума квантования (поскольку тем на меньшее значение требуется округлять каждое измеренное значение сигнала). Природа шума квантования такова, что ширина спектральной области, в которой он простирается, пропорциональна значению частоты дискретизации.


          Рис. 3. Процесс оцифровки звукового сигнала

          Устройство, выполняющее оцифровку называют аналого-цифровым преобразователем (АЦП). Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь (ЦАП), а затем сгладить получившийся ступенчатый сигнал.


          Рис.4. Процесс кодирования и декодирования звуковой волны

          Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами.

          В современное время все упирается в вычислительную мощность современной цифровой техники. С возрастанием точности оцифровки одновременно возрастает скорость потока цифровых данных, увеличивается вычислительная нагрузка на процессор и требуется повышенный объем памяти для хранения цифровых отчетов. Имеются и серьезные схемотехнические трудности. Вместе со стремительным ростом компьютерных технологий становится возможным применять более высокие частоты дискретизации и разрядность. Цифровой звук широко применяется в современной звукозаписывающей индустрии благодаря хорошему качеству звучания, высокой помехозащищенности и удобству хранения и архивирования материала.

          В настоящее время при записи звука в мультимедийных технологиях применяются частоты 8, 11, 22 и 44 кГц. Так, частота дискретизации 44 килогерца означает, что одна секунда непрерывного звучания заменяется набором из сорокачетырех тысяч отдельных отсчетов сигнала. Чем выше частота дискретизации, тем лучше качество оцифрованного звука.

          Как отмечалось выше, каждый отдельный отсчет можно описать некоторой совокупностью чисел, которые затем можно представить в виде некоторого двоичного кода. Качество преобразования звука в цифровую форму определяется не только частотой дискретизации, но и количеством битов памяти, отводимых на запись кода одного отсчета. Этот параметр принято называть разрядностью преобразования.

          Методов сжатия (форматов), а также программ реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3),MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA),TwinVQ (VQF), MPEGPlus, TAC, и прочие.

          В настоящее время обычно используется разрядность 8,16 и 24 бит.

          На описанных выше принципах основывается формат WAV (от WAVeform-audio – волновая форма аудио) кодирования звука. Получить запись звука в этом формате можно от подключаемых к компьютеру микрофона, проигрывателя, магнитофона, телевизора и других стандартно используемых устройств работы со звуком. Однако формат WAV требует очень много памяти. Так, при записи стереофонического звука с частотой дискретизации 44 килогерца и разрядностью 16 бит – параметрами, дающими хорошее качество звучания, – на одну минуту записи требуется около десяти миллионов байтов памяти.

          Кроме волнового формата WAV, для записи звука широко применяется формат с названием MIDI (Musical Instruments Digital Interface – цифровой интерфейс музыкальных инструментов). Фактически этот формат представляет собой набор инструкций, команд так называемого музыкального синтезатора – устройства, которое имитирует звучание реальных музыкальных инструментов. Команды синтезатора фактически являются указаниями на высоту ноты, длительность ее звучания, тип имитируемого музыкального инструмента и т. д. Таким образом, последовательность команд синтезатора представляет собой нечто вроде нотной записи музыкальной мелодии. Получить запись звука в формате MIDI можно только от специальных электромузыкальных инструментов, которые поддерживают интерфейс MIDI. Формат MIDI обеспечивает высокое качество звука и требует значительно меньше памяти, чем формат WAV.

          Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3). Формат завоевал свою популярность совершенно заслуженно – это был первый распространенный кодек, который достиг столь высокого уровня компрессии при отличном качестве звучания. Сегодня этому кодеку имеется множество альтернатив, но выбор остается за пользователем. Преимущества MP3 – широкая распространенность и достаточно высокое качество кодирования,

          На сегодня совершенно очевидно лишь одно – цифровые технологии находятся лишь в начале своего пути, и нам еще только предстоит понять, что значит их повсеместное внедрение совместно с миниатюризацией, наращиванием вычислительных мощностей и объемов памяти.

          Совершенно ясно, что цифровые технологии очень скоро завоюют новые, еще не захваченные рубежи, и что от повсеместного применения этих технологий никуда не деться. Опасаться этого процесса можно, но сопротивляться ему бесполезно.

          Читайте также: