Представление звуковой информации в компьютере реферат

Обновлено: 05.07.2024

Одной из основных задач информатики является представление данных в виде удобном для хранения и передачи. Эти данные могут быть разного типа – звуковые, текстовые, графические и т.д. В этой статье мы расскажем про кодирование звуковой информации. Из этой статьи Вы узнаете основные принципы и определения. Также после прочтения сможете посчитать объем аудио файла. Читайте!

Основные определения

Для того чтобы разобраться в теме надо знать, что представляет собой звуковая информация (звук).

Звук – это непрерывная аналоговая волна, которая распространяется в окружающей среде. В роли среды может выступать воздух, жидкость, твердое тело, электричество и т.д.

Звук, как непрерывную волну, характеризуют две характеристики – частота и амплитуда.

От амплитуды зависит громкость аудио сигнала . Чем выше амплитуда, тем громкость больше.

Частота же характеризует тональность аудиоинформации . Чем больше частота, тем тональность выше. Человеческий слух улавливает волны от 20 Гц до 20 кГц. 1 Гц равен 1 колебанию аудио сигнала в секунду.

Представление и кодирование звуковой информации в компьютере

Для представления и кодирования звука используются специальное оборудование и программы. Рассмотрим весь процесс более подробно.

  1. Аудиоинформация, поступая из окружающей среды (например, по воздуху), преобразуется в электрический сигнал. Для этого используется такое устройство, как микрофон.
  2. После этого звук поступает на АЦП (аналого-цифровой преобразователь), где подвергается оцифровке.
  3. На последнем этапе информация (уже в двоичном виде) кодируется при помощи специальной программы – аудиокодека. На выходе получается файл в специальном формате (например, mp3), который можно хранить, воспроизводить и передавать.

Кодирование звуковой информации

Наибольший интерес представляет процесс оцифровки, также называемым аналого-цифровым преобразованием. В результате него аналоговый сигнал заменяется на цифровой.

Основной принцип аналогово-цифрового преобразования заключается в том, что через равные промежутки времени измеряется амплитуда волны. Также этот процесс называется дискретизация.

Дискретизация – это процесс в результате, которого непрерывная функция представляется в виде дискретной последовательности её значений. Схематично дискретизацию можно представить так:

Кодирование звуковой информации

Дискретизация характеризуется двумя такими величинами, как:

  • Частота шага по времени;
  • Шаг квантования.

Первая величина отображает, как часто берутся дискреты и измеряется в Герцах (количество измерений за одну секунду). Частота шага по времени находится по теореме Котельникова.

Шаг квантования характеризуется количеством уровней , до которых округляются величины амплитуды волны.

Количество уровней (ступенек) до которых округляются значения сигнала, зависит от аналого-цифрового преобразователя. На данный момент используются 16, 32 и 64 битные устройства.

Количество бит, затрачиваемое для номеров уровней, называется глубиной кодирования звуковой информации.

Глубина кодирования связано с количеством уровней по формуле:

Где i разрядность АЦП в битах.

Чем чаще берутся дискреты за единицу времени и больше глубина кодирования, тем выше качество звуковых данных на выходе и дороже АЦП.

Расчет объема аудио файла

  • N – длительность звучания в секундах;
  • K – разрядность АЦП (глубина кодирования) в битах;
  • F – частота взятия дискрет в герцах;
  • Z – количество каналов ( 1- моно, 2 — стерео).

Пример: рассчитать объем аудио файла со следующими характеристиками – моно звучание, частота дискретизации 8 кГц, глубина — 8 бит (телефонная связь) и длительностью 60 секунд.

​ \[V = 60*1*8000*8=3840000 \ бит \] ​

Форматы аудио

Форматов для хранения аудио много, однако, все они делятся на две большие группы в зависимости от того, какой из методов сжатия используется – LOSELESS или LOSSY.

  1. LOSELESS – метод сжатия без потерь. Качество звуковой информации остается без изменений, однако за него приходится платить большим объемом компьютерной памяти. Используется для хранения музыки и других данных, где важно качество. Форматы, которые основаны на данном методе сжатия: FLAC, APE, TAC, ALAC и другие. На данный момент зарабатывают все большую популярность в связи с увеличением дискового пространства.
  2. LOSSY – сжатие с потерями. При таком методе файл сохраняются с искажениями относительно оригинала. В основном эти искажения не воспринимаются человеческим слухом, а также не замечаются при плохом аудио оборудовании. LOSSY позволяет существенно сэкономить дисковое пространство. На данный момент этот метод сжатия является доминирующим.

Форматы кодирования использующие алгоритмы LOSSY:

  • MP3 (MPEG-1,2,2.5) – самый популярный аудио формат. Проигрывается на всех аудио и видео системах, по умолчанию поддерживается всеми операционными системами. Искажения заметны на высокоточной дорогостоящей аппаратуре.
  • AAC – формат, который разрабатывался и позиционировался, как приемник mp3. Не получил широкого распространения. Преимущества перед mp3: большая гибкость кодирования, возможность использовать до 48 звуковых каналов.
  • HE-AAC (High-Efficiency Advanced Audio Coding) – используется в цифровом радио и телевиденье.

Заключение

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека.

Чем больше частота сигнала, тем выше тон.

hello_html_2ccc5f24.jpg

Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz).

Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука.

Современные звуковые карты обеспечивают 16 -, 32 - или 64 -битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц).

Процесс перевода звуковых сигналов от непрерывной формы представления к дискретной, цифровой форме называют оцифровкой.

Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1 секунду:

- 1 (одно) измерение в секунду соответствует частоте 1 Гц;

- 1000 измерений в секунду соответствует частоте 1 кГц.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценить информационный объём моноаудиофайла ( V ) можно следующим образом: V = Nfk , где N — общая длительность звучания (секунд), f — частота дискретизации (Гц), k — глубина кодирования (бит).

Например, при длительности звучания 1 минуту и среднем качестве звука ( 16 бит, 24 кГц):

V = 60 ⋅ 24000 ⋅ 16 бит = 23040000 бит = 2880000 байт = 2812,5 Кбайт = 2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука ( 16 битов, 24000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду и умножить на 2 (стереозвук):

V =16 бит ⋅ 24000 ⋅ 2 = 768000 бит = 96000 байт = 93,75 Кбайт.

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и, следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

hello_html_m1f9e707.jpg

Преобразование звукового сигнала в дискретный сигнал: a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП.

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. ниже. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

hello_html_m607e2dad.jpg

Преобразование дискретного сигнала в звуковой сигнал: а — дискретный сигнал на входе ЦАП; б — звуковой сигнал на выходе ЦАП.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

ЭВМ первых двух поколений могли обрабатывать только числовую информацию, полностью оправдывая свое название вычислительных машин. Лишь переход к третьему поколению принес изменения: к этому времени уже назрела настоятельная необходимость использования текстов.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.

Каждый символ хранится в виде двоичного кода, который является номером символа. Можно сказать, что компьютер имеет собственный алфавит, где весь набор символов строго упорядочен. Количество символов в алфавите также тесно связано с двоичным представлением и у всех ЭВМ равняется 256 . Иными словами, каждый символ всегда кодируется 8 битами , т.е. занимает ровно один байт .

Как видите, хранится не начертание буквы, а ее номер. Именно по этому номеру воспроизводится вид символа на экране дисплея или на бумаге. Поскольку алфавиты в различных типах ЭВМ не полностью совпадают, при переносе с одной модели на другую может произойти превращение разумного текста в "абракадабру". Такой эффект иногда получается даже на одной машине в различных программных средах: например, русский текст, набранный в MS DOS, нельзя без специального преобразования прочитать в Windows. Остается утешать себя тем, что задача перекодировки текста из одной кодовой таблицы в другую довольно проста и при наличии программ машина сама великолепно с ней справляется.

Наиболее стабильное положение в алфавитах всех ЭВМ занимают латинские буквы, цифры и некоторые специальные знаки. Это связано с существованием международного стандарта ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). Русские же буквы не стандартизированы и могут иметь различную кодировку.

Желающие могут в качестве примера ознакомится с таблицей стандартной части алфавита ЭВМ - символы с шестнадцатеричными кодами с 20 до 7F.

Нельзя также пройти мимо еще одного интересного факта: каждый символ текста имеет свой числовой код, но не каждому коду соответствует отображаемый на экране символ. Речь идет о существовании так называемых УПРАВЛЯЮЩИХ КОДОВ , величина которых меньше шестнадцатеричного числа 20 (т.е. 32 в десятичной системе счисления). При получении этих кодов внешние устройства не изображают какого-либо символа, а выполняют те или иные управляющие действия. Так, код 07 вызывает подачу стандартного звукового сигнала, а код 0C - очистку экрана. Особую роль играют коды 0A (перевод строки, обозначаемый часто LF ) и 0D (возврат каретки - CR ). Первый вызывает перемещение в следующую строку без изменения позиции, а второй - на начало текущей строки. Таким образом, для перехода на начало новой строки требуются оба кода и в любом тексте эта "неразлучная пара" кодов хранится после каждой строки.

Обратим внимание читателя на то, что названия возврат каретки и перевод строки имеют историческое происхождение и связаны с устройством пишущей машинки.

Представление графической информации.

Растровое представление:

В отличии текстового представления информации, когда минимальной единицей является символ, при отображении графики картинка строится из отдельных элементов - ПИКСЕЛОВ (от английских слов PIC ture EL ement, означающих "элемент картинки ").

Очень часто пиксел совпадает с точкой дисплея, но это совсем необязательно: например, в некоторых видеорежимах 1 пиксел может состоять из 2 или 4 точек экрана.

Каждый пиксел характеризуется цветом . Как и вся остальная информация в ЭВМ, цвет кодируется числом . В зависимости от количества допустимых цветов, число двоичных разрядов на один пиксел будет различным.

Так, для черно-белой картинки закодировать цвет точки можно одним битом: 0 - черный, 1 - белый. Для случая 16 цветов требуется уже по 4 разряда на каждую точку, а для 256 цветов - 8 , т.е. 1 байт.

Растр - прямоугольная сетка пикселей на экране.

Число цветов, воспроизводимых на экране дисплея (K), и число бит, отводимых в видеопамяти под каждый пиксель (N), связаны формулой:

В режиме 16 -цветной графики это же самое изображение потребует памяти в 4 раза больше.

Наконец, при 256 цветах на каждую точку требуется уже по байту и наш квадратик разрастется еще вдвое.

Обратите внимание на то, что белый цвет, как самый яркий, обычно имеет максимально возможный номер. Поэтому для черно-белого режима он равен 1 , для 16-цветного - 15 , а для 256 цветов - 255 .

Все многообразие красок на экране получается путем смешивания трех базовых цветов: красного , синего и зеленого . Каждый пиксель на экране состоит из трех близко расположенных элементов, святящихся этими цветами. Цветные дисплеи, использующие такой принцип, называются RGB (Red - Green - Blue) - мониторами.

Код цвета пикселя содержит информацию о доле каждого базового цвета.

Если все три составляющие имеют одинаковую интенсивность (яркость), то из их сочетаний можно получить 8 различных цветов (2 3 ).

Желающие могут в качестве примера ознакомится с таблицей кодирующей 8 - цветную палитру с помощью трехразрядного двоичного кода

Шестнадцатицветная палитра получается при использовании 4 - разрядной кодировки пикселя: к трем битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трех цветов одновременно.

Например:
если в 8 - цветовой палитре код 100 обозначает красный цвет , то в 16 - цветной палитре : 0100 - красный , 1100 - ярко - красный цвет ; 0110 - коричневый , 1110 - ярко коричневый (желтый ).

Большее количество цветов получается при раздельном управлении интенсивностью базовых цветов. Причем интенсивность может иметь более двух уровней, если для кодирования каждого из базовых цветов выделять больше одного бита.

При использовании битовой глубины 8 бит / пиксель количество цветов: 2 8 = 256. Биты такого кода распределены следующим образом:КККЗЗЗСС.

Это значит, что под красную и зеленую компоненты выделено по 3 бита , под синюю - 2 бита . Следовательно, красная и зеленая компоненты имеют по 2 8 = 256 уровней яркости, а синяя - 4 уровня.

Векторное представление:

При векторном подходе изображение рассматривается как совокупность простых элементов: прямых линий, дуг, окружностей, эллипсов, прямоугольников, закрасок и пр., которые называются графическими приметивами.

Графическая информация - это данные, однозначно определяющие все графические приметивы, составляющие рисунок.

Положение и форма графических примитивов задаются в системе графических координат, связанных с экраном. Обычно начало координат расположено в верхнем левом углу экрана. Сетка пикселей совпадает с координатной сеткой. Горизонтальная ось X направлена слева направо; вертикальная ось Y - сверху вниз.

Отрезок прямой линии однозначно определяется указанием координат его концов; окружность - координатами центра и радиусом; многоугольник - координатами его углов, закрашенная область - граниной линией и цветом закраски.

Таким образом, графическая информация, также как числовая и текстовая, в конечном счете заносится в память в виде двоичных чисел.

Представление звуковой информации

звук есть колебания среды.

Для их записи с целью последующего воспроизведения необходимо как можно точней сохранить форму кривой зависимости интенсивности звука от времени. При этом возникает одна очень важная и принципиальная трудность: звуковой сигнал непрерывен, а компьютер способен хранить в памяти только дискретные величины. Отсюда следует, что в процессе сохранения звуковой информации она должна быть "оцифрована", т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты, который называется аналого-цифровой преобразователь – АЦП .

Каковы основные принципы работы АЦП ?

Во-первых , он производит дискретизацию записываемого звукового сигнала по времени. Это означает, что измерение уровня интенсивности звука ведется не непрерывно, а, напротив, в определенные фиксированные моменты времени (удобнее, разумеется, через равные временные промежутки). Частоту, характеризующую периодичность измерения звукового сигнала принято называть частотой дискретизации . Вопрос о ее выборе далеко не праздный и ответ в значительной степени зависит от спектра сохраняемого сигнала: существует специальная теорема Найквиста , согласно которой частота "оцифровки" звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала .

Считается, что редкий человек слышит звук частотой более 20 000 Гц (20 кГц ). Поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц . Отсюда немедленно следует, что частота звукозаписи в таких случаях должна быть не ниже 44 кГц . Названная частота используется, в частности, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты дискретизации 8 кГц . Заметим, что результат при этом получается хотя и не блестящий, но легко разборчивый – вспомните, как вы слышите голоса своих друзей по телефону.

Во-вторых , АЦП производит дискретизацию амплитуды звукового сигнала. Это следует понимать так, что при измерении имеется "сетка" стандартных уровней (например, 256 или 65 536 – это количество характеризует глубину кодирования), и текущий уровень измеряемого сигнала округляется до ближайшего из них. Напрашивается линейная зависимость между величиной входного сигнала и номером уровня. Иными словами, если громкость возрастает в 2 раза, то интуитивно ожидается, что и соответствующее ему число возрастет вдвое. В простейших случаях так и делается, но, как показывает более детальное изучение, это не самое лучшее решение. Проблема в том, что в широком диапазоне громкости звука человеческое ухо не является линейным. Например, при очень громких звуках, увеличение или уменьшение интенсивности звука почти не дает эффекта, в то время как при восприятии шепота очень незначительное падение уровня может приводить к полной потере разборчивости. Поэтому при записи цифрового звука, особенно при 8 - битном кодировании, часто используют различные неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон.

Итак, в ходе оцифровки звука мы получаем поток целых чисел, представляющих собой стандартные амплитуды сигналов через равные промежутки времени.

На рисунке представлен процесс "оцифровки" зависимости интенсивности звукового сигнала I от времени t. Отчетливо видна дискретизация по времени (равномерные отсчеты на горизонтальной оси) и по интенсивности сигнала (требуемое при этом округление схематически изображено "изломами" горизонтальных линий разметки). Подчеркнем, что на рисунке степень дискретизации для наглядности сознательно утрирована: реально различие между соседними уровнями дискретизации по обеим осям значительно меньше и, следовательно, форма сигнала передается гораздо точнее.

Мы рассмотрели лишь наиболее общие принципы записи цифрового звука. На практике для получения качественных звуковых файлов используется целый ряд дополнительных технических приемов.

Изложенный метод преобразования звуковой информации для хранения в памяти компьютера в очередной раз подтверждает уже неоднократно обсуждавшийся ранее тезис: любая информация для хранения в компьютере приводится к цифровой форме и затем переводится в двоичную систему.

Остается рассмотреть обратный процесс – воспроизведение записанного в компьютерный файл звука. Здесь имеет место преобразование в противоположном направлении – из дискретной цифровой формы представления сигнала в непрерывную аналоговую, поэтому вполне естественно соответствующий узел компьютерного устройства называется ЦАП – цифро-аналоговый преобразователь . Процесс реконструкции первоначального аналогового сигнала по имеющимся дискретным данным нетривиален, поскольку никакой информации о форме сигнала между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала могут использоваться различные способы.

Наиболее наглядный и понятный из них состоит в том, что по имеющимся точкам рассчитывается степенная функция, проходящая через заданные точки, которая и принимается в качестве формы аналогового сигнала. Чтобы понять, как это делается, возьмем, например, интерполяцию параболой I = at 2 + bt + c по трем заданным точкам. Подставив в эту формулу известные значения времени и приравняв их к сохраненным в файле значениям интенсивности звука I, получим три линейных уравнения с тремя неизвестными a, b и c.

Качественный вид результата представлен на рисунке:

Видно, что на интерполируемом участке даже для параболы совпадение получается вполне удовлетворительное. Кроме того, технические возможности современных микросхем позволяют значительно увеличить степень полинома (многочлена), а вместе с ней и точность реконструкции формы сигнала.

Представление видео информации.

Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы, причем не только процессора, но и CD-ROM, с которого считываются данные, конечно, видеосистемы, а также всех информационных шин, по которым данные передаются от одного устройства к другому.

В частности, когда при весьма скромном размере окна видеоизображения 360x240 и 16 битах цветовой информации на каждый пиксел скорость передачи данных превышает один мегабайт в секунду. То есть за десять минут должно быть передано более 600 Мбайт данных, что эквивалентно немного немало почти целому диску CD-ROM!

Таким образом, если для прочих видов информации сжатие лишь повышает удобства работы, то для видеоинформации технологии сжатия имеют поистине жизненно важное значение.

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные. В любительской киносъемке использовалась частота 16 кадров/сек., в профессиональной – 24.

Традиционный кадр на кинопленке "докомпьютерной" эпохи выглядел так, как показано на рисунке.

Основную его часть, разумеется, занимает видеоизображение, а справа сбоку отчетливо видны колебания на звуковой дорожке. Имеющаяся по обоим краям пленки периодическая система отверстий (перфорация) служит для механической протяжки ленты в киноаппарате с помощью специального механизма.

Казалось бы, если проблемы кодирования статической графики и звука решены, то сохранить видеоизображение уже не составит труда. Но это только на первый взгляд, поскольку, как показывает разобранный выше пример, при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой. Достаточно очевидное усовершенствование состоит в том, чтобы первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять лишь отличия от начального кадра (разностные кадры).

Принцип формирования разностного кадра поясняется на следующем рисунке, где продемонстрировано небольшое горизонтальное смещение прямоугольного объекта.

Отчетливо видно, что при этом на всей площади кадра изменились всего 2 небольшие зоны: первая сзади объекта возвратилась к цвету фона, а на второй – перед ним, фон перекрасился в цвет объекта. Для разноцветных предметов произвольной формы эффект сохранится, хотя изобразить его будет заметно труднее.

Конечно, в фильме существует много ситуаций, связанных со сменой действия, когда первый кадр новой сцены настолько отличается от предыдущего, что его проще сделать ключевым, чем разностным. Может показаться, что в компьютерном фильме будет столько ключевых кадров, сколько новых ракурсов камеры. Тем не менее, их гораздо больше. Регулярное расположение подобных кадров в потоке позволяет пользователю оперативно начинать просмотр с любого места фильма: "если пользователь решил начать просмотр фильма с середины, вряд ли он захочет ждать, пока программа распаковки вычислит все разности с самого начала". Кроме того, указанная профилактическая мера позволяет эффективно восстановить изображение при любых сбоях или при "потере темпа" и пропуске отдельных кадров на медленных компьютерных системах.

Заметим, что в современных методах сохранения движущихся видеоизображений используются и другие типы кадров.

Существует множество различных форматов представления видеоданных. Рассмотрим некоторые из них:

В среде Windows , например, уже более 10 лет (начиная с версии 3.1) применяется формат Video for Windows , базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave – чередование аудио и видео ). Суть AVI файлов состоит в хранении структур произвольных мультимедийных данных, каждая из которых имеет простой вид, изображенный на рисунке.

Файл как таковой представляет собой единый блок, причем в него, как и в любой другой, могут быть вложены новые блоки. Заметим, что идентификатор блока определяет тип информации, которая хранится в блоке.

Внутри описанного выше своеобразного контейнера информации (блока) могут храниться абсолютно произвольные данные, в том числе, например, блоки, сжатые разными методами. Таким образом, все AVI -файлы только внешне выглядят одинаково, а внутри могут различаться очень существенно.

Наиболее популярные программы проигрывания видеофайлов позволяют использовать замещаемые подсистемы сжатия и восстановления видеоданных – кодеки (от англ. compression/decompression – codec).

Такой подход позволяет легко адаптировать новые технологии, как только те становятся доступными. Замещаемые кодеки хороши как для пользователей, так и для разработчиков программного обеспечения. Тем не менее, большое разнообразие кодеков создает определенные трудности для производителей видеопродукции. Часто в качестве выхода из создавшегося положения необходимые кодеки помещают на компакт-диск с фильмами или даже поставляют видеоматериалы в нескольких вариантах, предоставляя тем самым возможность выбрать подходящий. Все больше распространяется автоматизация распознавания, когда плейер, обнаружив информацию об отсутствующем кодеке, загружает его из Интеренет.

Среди средств мультимедиа звук – это особое явление. Вроде кошки, которая ухитряется существовать сама по себе наперекор всему. Текст и графика вроде бы неплохо сдружились друг с другом и постоянно идут рука об руку. Но при этом и часть своей самобытности потеряли - текст и графика сегодня редко встречаются по отдельности. В связке - другое дело, а вот порознь.

Содержание

1. Природа звука
2. Восприятие звуковых раздражений
3. Частота, амплитуда, фаза - характеристики звука
4. Информация аналоговая, цифровая
4.1 Представление и способы передачи цифровой информации
5. Дискретизация звука
6. Способы записи информации
6.1 Бит в бит
6.2 Сжатие
6.3 Структура болванки CD-R
6.4 Запись CD-R
6.5 Запись CD-RW
Список используемых источников

Прикрепленные файлы: 1 файл

информатика.doc

1. Природа звука

2. Восприятие звуковых раздражений

3. Частота, амплитуда, фаза - характеристики звука

4. Информация аналоговая, цифровая

4.1 Представление и способы передачи цифровой информации

5. Дискретизация звука

6. Способы записи информации

6.3 Структура болванки CD-R

Список используемых источников

Среди средств мультимедиа звук – это особое явление. Вроде кошки, которая ухитряется существовать сама по себе наперекор всему. Текст и графика вроде бы неплохо сдружились друг с другом и постоянно идут рука об руку. Но при этом и часть своей самобытности потеряли - текст и графика сегодня редко встречаются по отдельности. В связке - другое дело, а вот порознь.

Звук, напротив, постоянно пребывает в одиночном плавании. А всё потому, что слишком жаден до внимания этот вид информации - всё на себя перетягивает. Звучит, к примеру, на странице Internet какая-нибудь мелодия - и вот уже и текст в голову не лезет, и картинки уже не так радуют глаз.

А с другой стороны, по этой же самой причине звук не прощает дилетантского подхода. Огрехи текста или картинки далеко не всякий разглядит. А вот фальш, низкое качество созданной или обработанной нами композиции любой слушатель с не отдавленным русским медведем ухом в момент почувствует.

1. Природа звука

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, шелест листьев и завывание ветра, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют, люди начали догадываться очень давно. Замечали, к примеру, что звук создают вибрирующие в воздухе тела. Ещё древнегреческий философ и учёный - энциклопедист Аристотель, исходя из наб- людений, верно объяснил природу звука, полагая, что звучащее тело создаёт попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то уплотняет, то разрежает воздух, а, благодаря упругости воздуха, эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны, достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

2. Восприятие звуковых раздражений

3. Частота, амплитуда - характеристики звука

Каждый звук характеризуется частотой (высотой звука), интенсивностью (громкостью). Частота-это количество звуковых колебаний в секунду; измеряется она в герцах (Гц). Чем больше частота, тем выше звук.

Человеческое ухо воспринимает не все частоты. Очень немногие слышат звуки с частотами ниже 16 Гц и выше 20 Гц. Частота звука самой низкой ноты на рояле равна 27 Гц, а самой высокой - чуть больше кГц. Наивысшая звуковая частота, которую могут передать вещательные ЧМ-радиостанций –15 кГц.

Громкость определяется амплитудой колебаний. Амплитуда звуковых колебаний зависит, в свою очередь, от мощности источника звука. Например, струна пианино при слабом ударе по клавише звучит тихо, поскольку размах её колебаний невелик. Если же ударить по клавише посильнее, размах колебаний струны увеличится. Громкость звука измеряется в децибелах (дБ). Шорох листьев имеет громкость около 20 дБ, обычный уличный шум-около 70, а близкий удар грома-до 120 дБ.

Важными параметрами являются частота квантования звуковых сигналов и раз рядность квантования. Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в цифровой код. Обычно они лежат в пределах от 4–5 Кгц до 45–48 Кгц. Разрядность квантования характеризует число ступеней квантования и измеряется степенью числа 2.

Частотный диапазон Вид сигнала Частота квантования
400 – 3500 Гц Речь (едва разборчива) 5.5 Кгц
250 – 5500 Гц Речь (среднее качество) 11.025 Кгц
40 – 10000 Гц Качество звучания УКВ–приемника 22.040 Кгц
20 – 20000 Гц Звук высокого качества 44.100 Кгц

4. Информация аналоговая и цифровая

В природе информация распространяется в виде сигналов, а все сигналы, как известно, имеют энергетическую природу. Они могут быть сильнее или слабее, им свойственно явление затухания. Сигналы разной интенсивности несут разную информацию. Информацию такого рода называют аналоговой. Аналоговая информация непрерывна, и мы никогда не встретим два листа на дереве, имеющих одинаковый цвет, или два облака на небе, имеющих одинаковую форму.

В компьютерах информация представляется в виде данных, которые имеют другую природу. Аналоговые сигналы заменяются числовым представлением. Чем больше яркость зелёного цвета на фотографии, тем большим числом в памяти компьютера представляется этот сигнал. То же относится и к красному, и к синему, и к серому цвету. То же относится и к звукам и к другим видам сигналов. Информацию, представленную в такой форме, называют цифровой. Цифровая информация дискретна, поскольку для представления бесконечного многообразия цветов, звуков и форм используется вполне определённое и конечное количество чисел.

Представление аналоговой информации в цифровом виде называется аналого-цифровым преобразованием. Чем больше разных чисел используется для такого преобразования, тем выше дискретность цифровой информации и тем выше её точность, то есть тем ближе цифровая информация к аналоговой.

4.1 Представление и способы передачи цифровой информации

Представление информации в виде цифровых данных не случайно выбрано в качестве основополагающего принципа работы компьютера. У аналоговых сигналов слишком многое зависит от интенсивности, а она постепенно уменьшается в процессе затухания. Другое дело-цифровые данные. Здесь всё просто: сигнал либо есть, либо его нет.

Цифровые данные по проводнику передаются путём смены текущего напряжения: нет напряжения-"0",есть напряжение-"1". Существует два способа передачи информации по физически передающей среде: цифровой и аналоговый.

При цифровом (узкополосном способе передачи) данные.

Передаются в их естественном виде на единой частоте. Он позволяет передавать только цифровую информацию, обеспечивает в каждый данный момент времени возможность использования передающей среды только двумя пользователями и допускает нормальную работу только на ограниченные расстояния. В то же время узкополосной способ передачи обеспечивает высокую скорость обмена данными - до 10 Мбит/с и позволяет создавать легко конфигурируемые вычислительные сети. Подавляющее число локальных вычислительных сетей использует узкополосную передачу.

Аналоговый способ передачи цифровых данных обеспечивает широкополосную передачу за счёт использования в одном канале сигналов различных несущих частот.

При аналоговом способе передачи происходит управление параметрами сигнала несущей частоты для передачи по каналу связи цифровых данных. Сигнал несущей частоты представляет собой гармоническое колебание, описываемое уравнением:

где Xmax -амплитуда колебаний; - частота; t -время; -начальная фаза колебаний.

Передать цифровые данные по аналоговому каналу можно, управляя одним из параметров сигнала несущей частоты: амплитудой, частотой или фазой. Так как необходимо передавать данные в двоичном виде, то можно предложить следующие способы управления: амплитудный, частотный, фазовый.

Амплитудная модуляция:"0"-отсутствие сигнала, то есть отсутствие колебаний несущей частоты;"1"-наличие сигнала, то есть наличие колебаний несущей частоты.

Частотная модуляция предусматривает передачу сигналов 0 и 1 на разной частоте. При переходе от 0 к 1 и от 1 к 0 происходит изменение сигнала несущей частоты.

Фазовая модуляция: при переходе от 0 к 1 и от 1 к 0 меняется фаза колебаний, то есть их направление.

5. Дискретизация

Процесс записи и воспроизводства звука в компьютере в самых общих чертах выглядит следующим образом.

6. Способы записи аудиоинформации

Длительность звучания стандартного компакт-диска составляет 74 минуты. Структура информации на диске следующая. В начале диска располагается так называемая вводная зона. Здесь располагается различная специальная информация о формате диска, структуре и адресах звуковых фрагментов. За этой областью располагается небольшой зазор (около двух секунд) и начинается программная зона, содержащая в себе, собственно, звуковые данные. Выводная зона служит границей диска.

6.1 Бит в бит

Информацию на диск в данном случае записывается как есть, то есть её помещают на 74 минуты. В этом случае получаем большой размер файлов. На обычном компакт-диске, например, частота дискретизации аудио составляет-441000 Гц, а значение сигнала описано 16 битами. Таким образом, на описание одной секунды аудио в формате CD-DA тратится 176400 байт(172 Кбайт), одной минуты-10 Мбайт.

Применение сжатия позволяет уменьшить размеры файлов. Есть два типа сжатия-с потерями качества и без потерь качества. При упоминании о сжатии аудио подразумевается сжатие с потерями качества. Любое сжатие информации приводит к ухудшению её качества. Однако в процессе эволюции человеческий слух научился адаптироваться к некоторым видам помех, не замечая их присутствия в принимаемой аудиоинформации.

Представление звука в памяти компьютера основано на принципе дискретизации, т.е. в разбиении звуковых колебаний на конечные малые элементы с определенным диапазоном частот, что аналогично разбиению графического изображения на пиксели.


Звуковая плата или аудиоадаптер (аналого-цифровой преобразователь) – это специальное устройство, преобразующее при записи звука электрические колебания звуковой частоты в числовой двоичный код. Она используется и для обратного преобразования при воспроизведении звука. На вход звуковой платы подается непрерывный аналоговый сигнал от микрофона, амплитуда которого измеряется через определённые промежутки времени, а на выходе получают численные значения амплитуды этого сигнала. Эти промежутки времени называются шагом дискретизации, а количество измерений амплитуды звука в секунду называют частотой дискретизации.

Численные значения амплитуды сигнала измеряют и представляют в двоичном коде.

Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудио данных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:

· аудиоформаты без сжатия, такие как WAV, AIFF

· аудиоформаты со сжатием без потерь (APE, FLAC)

· аудиоформаты, с применением сжатия с потерями (mp3, ogg)

Для определения качества оцифрованного звука наиболее часто применяется такой показатель, как битрейт – скорость звукового потока, получившаяся после сжатия и измеряемая в килобитах в секунду (kbps).

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Различают неискажающую (копирование, наложение, монтаж) и искажающую обработку. Искажающая обработка подразделяется на:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: производится обработка необходимых частотных составляющих.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или "объёмности" звука.

Читайте также: