Какие параметры участвуют в кодировании звуковой информации кратко информатика

Обновлено: 04.07.2024

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Аналоговый и дискретный способы представления звука

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.

При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.

При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Восприятие звука человеком

Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервной системе в головной мозг, создавая ощущение звука.

Колебания барабанной перепонки в свою очередь передаются во внутреннее ухо и раздражают слуховой нерв. Так образом человек воспринимает звук.

В аналоговой форме звук представляет собой волну, которая характеризуется:

Высота звука определяется частотой колебаний вибрирующего тела.
Г ромкость звука определяется энергией колебательных движений, то есть амплитудой колебаний.
Длительность звука - продолжительность колебаний.
Тембром звука называется окраска звука.

Герц (Гц или Hz) — единица измерения частоты колебаний. 1 Гц= 1/с

Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).

Кодирование звуковой информации

Для того чтобы комп ьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала.

Качество кодирования звуковой информации зависит от :

1)частотой дискретизации, т.е. количества измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

2)глубиной кодирования, т.е. количества уровней сигнала.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2 i = 2 16 = 65536, где i — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц — качеству звучания аудио-С D . Следует также учитывать, что возможны как моно-, так и стерео-режимы.

РСМ. РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.

WAV. Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

RIFF. Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

IFF. Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплернойэмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

MOD. Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.

AIF или AIFF. Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

МР3. Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.

VQF. Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

RA. Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Звук представляет собой непрерывный сигнал, а именно звуковую волну с меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым. Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука. В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным, то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
$1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Готовые работы на аналогичную тему

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ — общая длительность звучания, выражаемая в секундах,

$f$ — частота дискретизации (Гц),

$k$ — глубина кодирования (бит).

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table.

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

Информатика. 10 класса. Босова Л.Л. Оглавление

§ 16. Кодирование звуковой информации

16.1. Звук и его характеристики

Звук — это распространяющиеся в воздухе, воде или другой среде волны с непрерывно меняющейся амплитудой и частотой (рис. 3.12).

Рис. 3.12. Звуковая волна

Амплитуду звуковых колебаний называют звуковым давлением или силой звука. Эта величина характеризует воспринимаемую громкость звука. Абсолютную величину звукового давления измеряют в единицах давления — паскалях (Па). Самые слабые, едва различимые звуки имеют амплитуду около 20 мкПа (2 • 10 -5 Па, так называемый порог слышимости). Самые сильные звуки, не выводящие слуховые органы из строя, могут иметь амплитуду до 200 Па (так называемый болевой порог).

На практике вместо абсолютной используют относительную силу (уровень) звука, измеряемую в децибелах (дБ). Вот некоторые значения уровня звука:

Частота определяется как количество колебаний в секунду и выражается в герцах (Гц). Чем больше частота, тем выше звук, и наоборот. Человек способен слышать звук в широком частотном диапазоне, но важное для жизни значение имеют только звуки от 125 до 8000 Гц.

Например, звуковые волны в диапазоне 500-4000 Гц соответствуют человеческому голосу. Звучание детского голоса, пение птиц, шёпот относятся к высоким частотам. Звук контрабаса, рычание зверей, раскаты грома — к низким.

16.2. Понятие звукозаписи

Звукозапись — это процесс сохранения информации о параметрах звуковых волн.

Аналоговый способ записи звука

Цифровой способ записи звука

16.3. Оцифровка звука

Чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму. Для этого его подвергают временной дискретизации и квантованию: параметры звукового сигнала измеряются не непрерывно, а через определённые промежутки времени (временная дискретизация); результаты измерений записываются в цифровом виде с ограниченной точностью (квантование).

Вообще говоря, в компьютер приходит не сам звук, а электрический сигнал, снимаемый с какого-либо устройства: например, микрофон преобразует звуковое давление в электрические колебания, которые в дальнейшем и обрабатываются.

Если записывается стереозвук (ведётся двухканальная запись), то оцифровке подвергается не один электрический сигнал, а сразу два и, следовательно, количество сохраняемой цифровой информации удваивается.

Сущность временной дискретизации заключается в том, что аналоговый звуковой сигнал разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определённая величина интенсивности звука (рис. 3.13). Другими словами, через какие-то промежутки времени мы измеряем уровень аналогового сигнала. Количество таких измерений за одну секунду называется частотой дискретизации.

Частота дискретизации — это количество измерений громкости звука за одну секунду.

Рис. 3.13. Временная дискретизация звукового сигнала (А(t) — амплитуда, t — время)

Частота дискретизации измеряется в герцах (Гц) и килогерцах (кГц). 1 кГц = 1000 Гц. Частота дискретизации, равная 100 Гц, означает, что за одну секунду проводилось 100 измерений громкости звука.

Качество звукозаписи зависит не только от частоты дискретизации, но также и от глубины кодирования звука.

Глубина кодирования звука или разрешение — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Пусть под запись одного результата измерения громкости в памяти компьютера отведено n бит. Вы знаете, что это позволяет закодировать ровно 2 n разных результатов измерений. Так, при n = 8 можно закодировать 256 разных результатов измерений громкости звука. Поэтому весь диапазон, в котором могут находиться результаты измерений громкости звука, можно разбить на 256 разных поддиапазонов — уровней громкости звука, каждому из которых присвоить свой уникальный код. После этого каждый имеющийся результат измерений громкости звука можно соотнести с некоторым поддиапазоном, в который он попадает, и кодировать его номером (кодом) соответствующего уровня громкости.

В зависимости от ситуации на практике используются разные значения частоты дискретизации и глубины кодирования (табл. 3.13).

Таблица 3.13

Примеры параметров оцифровки звука

Пример. Оценим объём звукового стереоаудиофайла с глубиной кодирования 16 бит и частотой дискретизации 44,1 кГц, который хранит звуковой фрагмент длительностью звучания 15 секунд.

Объём такого звукового фрагмента равен:

2 (канала) • 16 бит • 44 100 Гц • 15 с = 2 646 000 байт ? 2 584 Кбайта.

Увеличивая частоту дискретизации и глубину кодирования, можно более точно сохранить и впоследствии восстановить форму звукового сигнала. При этом объём сохраняемых данных будет увеличиваться.

Важно понимать, каких параметров оцифровки достаточно, чтобы сохраняемый звук был достаточно близок к исходному, а содержащий его файл имел минимально возможный объём. В начале 30-х годов прошлого века было установлено, что это возможно, если частота временной дискретизации будет в два раза выше максимальной частоты измеряемого сигнала.

В 1928 году американский учёный Гарри Найквист высказал утверждение, что частота дискретизации должна быть в два или более раза выше максимальной частоты измеряемого сигнала. В 1933 году наш соотечественник В. А. Котельников и независимо от него американец Клод Шеннон в 1949 году сформулировали и доказали теорему, более сильную чем утверждение Найквиста, о том, при каких условиях и как по дискретным значениям можно восстановить форму непрерывного сигнала.

САМОЕ ГЛАВНОЕ

Звук — это распространяющиеся в воздухе, воде или другой среде волны с непрерывно меняющейся амплитудой и частотой.

Таким образом, при оцифровке звука искажение сохраняемого сигнала происходит дважды: во-первых, при дискретизации теряется информация об истинном изменении звука между измерениями, а во-вторых, при квантовании сохраняются не точные, а близкие к ним дискретные значения.

Объём оцифрованного звукового фрагмента в битах находится как произведение частоты дискретизации в Гц, глубины кодирования звука в битах, длительности звучания записи в секундах и количества каналов.

Вопросы и задания

1. Каким образом происходит преобразование непрерывного звукового сигнала в дискретный цифровой код?

2. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

3. Производится четырёхканальная (квадро) звукозапись с частотой дискретизации 32 кГц и 32-битным разрешением. Запись длится 4 минуты, её результаты заносятся в файл, сжатие данных не производится. Определите приблизительно размер полученного файла (в мегабайтах). В качестве ответа укажите ближайшее к размеру файла целое число, кратное 10.

4. Музыкальный фрагмент был записан в формате моно, оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла — 49 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате стерео (двухканальная запись) и оцифрован с разрешением в 4 раза выше и частотой дискретизации в 3,5 раза меньше, чем в первый раз. Сжатие данных не производилось. Укажите в мегабайтах размер файла, полученного при повторной записи.

5. Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 32 секунды. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 3 раза выше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б. Пропускная способность канала связи с городом Б в 2 раза выше, чем канала связи с городом А. Сколько секунд длилась передача файла в город Б?

6. Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 96 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 4 раза выше и частотой дискретизации в 3 раза ниже, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 16 секунд. Во сколько раз пропускная способность канала связи с городом Б больше пропускной способности канала связи с городом А?

7. В сети Интернет найдите информацию о записи музыкальных произведений в формате MIDI. Почему запись звука в этом формате считают аналогичной векторному методу кодирования графических изображений?

Дополнительные материалы к главе смотрите в авторской мастерской.

Кодирование звуковой информации

Введение

Не до конца понимаете, как происходит кодирование звуковой информации? Запутались в аналогово-цифровых и цифро-аналоговых преобразователях? Записывайтесь ко мне на индивидуальный урок по информатике и ИКТ. Кроме рассмотрения теоретических сведений мы с вами прорешаем колоссальное количество тематических примеров.

Общие сведения о звуковой информации

В течение дня обычный человек слышит большое количество различных звуков. Давайте попытаемся кратко понять, что же такое звук. Звук – колебания воздуха, которые были созданы неким источником.
Под источником звука можно понимать любой предмет, объект, который способен генерировать звуковые волны:

Человек, который что-то произнес.

Проезжающий поезд, от которого исходит шум.

Музыкальные инструменты, на которых играет музыкант.

В самом широком физическом смысле под звуком следует понимать простую волну. Если говорить о графической интерпретации звука, то звуковые волны следует представлять, как множество синусоидальных графиков функций, каждый из которых имеет ряд обязательных параметров.

Звук обладает множеством характеристик, но ключевыми являются лишь две:

Амплитуда звуковой волны.

Частота звуковой волны.

Об этих свойствах будет детально рассказано в следующем разделе данной статьи.

Сейчас я вам покажу график функций идеальной звуковой волны, которой в природе физически не существует.

Графическое представление идеальной звуковой волны

Также хочу продемонстрировать график функций неидеальной звуковой волны, которая является речью обыкновенного человека.

Графическое представление неидеальной звуковой волны, которая является речью человека

Посмотрев на оба выше представленных графика функций, у вас должны возникнуть следующие мысли и закономерный вопрос: если перед нами изображен график функций, то где координатная ось, координатная сетка, градуированные шкалы осей ОХ и оси ОY, а также нужно понять, на основании каких закономерностей построены данные графики функций? То есть, какие параметры выступают значением по оси абсцисс и по оси ординат. О данных характеристиках, параметрах будет рассказано ниже.

Характеристики звуковой информации

Как было сказано выше, что звук обладает двумя ключевыми характеристиками: амплитудой и частотой.

Амплитуда – по сути, громкость или сила звука, измеряемая в децибелах. В физике принято сокращение единицы децибел до дБ. Человек в дневное время суток способен воспринимать звуки громкостью от 10-15 дБ. Уровень громкости звука является относительной величиной. Болевой порог для человека составляет уровень громкости звука в 120-130 дБ.

Влияние частоты на тип звука

Давайте вернемся к графикам функций идеальной и неидеальной звуковой волны.

Наша задача – разобраться, какая величина откладывается на оси абсцисс, а какая – на оси ординат.

Очевидно, что одной из осей является популярнейшая характеристика большинства физических графиков функций – время. Мы не сможем исследовать поведение звуковой волны, если не будем рассматривать ее в различные отрезки времени. Следовательно, осью абсцисс является параметр время. Единицей измерения является, например, секунда или миллисекунда.

Осью ординат выступает амплитуда или громкость рассматриваемой звуковой волны. Чем больше громкость или выше амплитуда, тем выше проходит график функций, соответствующий анализируемой звуковой волне.

Представим те же самые графики функций звуковых волн, но уже с обозначениями осей координат и их градуировкой.

Частота дискретизации звука

Необходимо знать, что процессор персонального компьютера взаимодействует с любыми данными на уровне двоичного кода. Двоичный или бинарный код – цепочки битов, которые принимают только одно из двух предопределенных значений, – 0 или 1.

Под кодированием звуковой информации следует понимать преобразование аналогового звукового сигнала в формат, понятный процессору персонального компьютера, то есть в двоичный код. Аналоговый или непрерывный звуковой сигнал у нас представлен в виде графика функций, как зависимость амплитуды от времени.

Чтобы оцифровать аналоговый звуковой сигнал разобьем ось, выражающую время, на некоторое количество равных отрезков и произведем замеры амплитуды/громкости в каждом отрезке. Предлагаю произвести разбивку с шагом 0.1 секунды.

Дискретизация – процесс преобразования непрерывного сигнала в дискретный, то есть прерывный сигнал. Под частотой дискретизации следует понимать частоту взятия отсчетов непрерывного во времени сигнала при его дискретизации. В нашем случае дискретизация – операция, связанная с разбивкой оси абсцисс, отвечающей за время, на отдельные одинаковые участки. А частотой дискретизации является значение, равное 10 Гц. То есть мы производим 10 замеров амплитуды звуковой волны за 1 секунду.

Дискретизация неидеальной звуковой волны

Таблица значений громкости звуковой волны при частоте дискретизации 10 Гц:

Звук представляет собой волну с меняющейся интенсивностью и частотой (громкостью и его тональностью соответственно). Чем больше амплитуда, тем громче звук. Чем больше частота, тем больше тон.

Хранение и передача аналогового звукового сигнала осуществляется за счёт представления его в виде электрического сигнала с помощью модуляции.

Модуляция – процесс изменения одного или нескольких параметров (амплитуды, частоты или фазы) высокочастотного колебания по закону низкочастотного сигнала (несущей частоты).

Существуют разные виды модуляции:

Амплитудная (АМ, amplitude modulation ) – изменение высокочастотных колебаний с частотой, равной частоте звукового сигнала. Например, несущей частотой может быть питание сети – 50 Гц. Или радиоволна СВ (MW) диапазона от 300 кГц до 3 МГц.

Частотная (FM, frequency modulation) – модуляция при которой информационный сигнал управляет несущей частотой. По сравнению с амплитудной модуляцией здесь амплитуда остаётся постоянной.

Цифровой сигнал

Для того чтобы аналоговый (непрерывный) сигнал представить последовательностью чисел определённой разрядности, его необходимо превратить в дискретный (прерывистый) сигнал, а затем подвергнуть квантованию.

На современном ПК карта всегда интегрирована в материнской плате, и имеет разрядность не ниже 24 бит.

Оцифровка звука – дискретизация и квантование аналогового сигнала.

1-й этап: Дискретизация сигнала по времени

Допустим, Вы, с помощью микрофона записали свой голос длительностью 5 сек. Этот фрагмент можно разбить на равные малые временный отрезки, которые в сумме дают нам 5 сек. Получаем частоту дискретизации (f, Гц), которая является обратной величиной времени: t сек. При частоте дискретизации 8 кГц=8 000 Гц, из формулы получаем отрезок, равный 0,000125 сек. или 125 миллисекунд.

2-й этап: Квантование сигнала по уровню

Чем больше уровней будет доступно для кодирования временных отрезков, тем ближе к аналогу будет закодированный файл, но при этом объём файла увеличится.

Например, возьмём 8 уровней, чтобы их закодировать в двоичный код нам достаточно 3 бита, что мы получаем из формулы Хартли:

2³=8 – комбинаций двоичного ряда чисел от 000 до 111.

Параметр (i) – называется глубина кодирования. 8 бит – 256 уровней, 16 бит – 65 536 уровней, 24 бита – более 16 млн. уровней.

3 этап: Определяем скорость потока звука

Частота дискретизации – 22 кГц, глубина кодирования – 16 бит. Произведение этих двух величин дает нам скорость потока 352 кбит/сек.

Именно такой канал передачи данных потребуется для воспроизведения звукового файла в режиме он-лайн.

Расчёт количество звуковой информации

Для определения информационного объёма звуковой информации, нам необходимы следующие параметры:

Задача 1:

Одна минута записи цифрового аудиофайла занимает 1,3 МБ, разрядность звуковой платы — 8 бит. С какой частотой дискретизации записан звук?

Воспользуемся формулой: I=f∙t∙i∙n , из формулы видно что для нахождения частоты дискретизации формула примет вид: f=I/t∙i∙n.

1,3 МБ = 13,31,2 КБ = 1 363 148,8 Байт. Принимая во внимание что 8 бит = 1 Байту, делим 1 363 148,8 на 60, канал у нас записан 1, поэтому n=1.

Ответ: 22719,1 Гц или 22 050 Гц, см. основные настройки параметров звукового файла в программе Audacity

Задача 2:

Две минуты записи цифрового аудиофайла занимают на диске 5,1 МБ. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера?

Решение: 5,1 МБ = 5 347 737,6 Байт, делим по формуле: i = I / f∙ t ∙ n.

5 347 737,6 / 22 050 ∙ 120 = 2,02 Байт.

Ответ: 16 бит.

Кодирование видео

Информация хранится на различных носителях в виде файлов. Файл занимает память и может быть измерен в единицах измерения информации: бит, Байт, КБ и т.д.

Стремительное развитие интернета резко увеличило обмен информацией между людьми, для оптимизации хранения данных люди стали использовать специальные алгоритмы сжатия.

В основе цифрового видео лежит графический и звуковой файлы. Если рассчитать объём видеофайла без сжатия, нам необходимо учитывать тот факт, что человек начинает воспринимать смену кадров (картинок), как непрерывное плавное движение, если за 1 сек. будет мелькать 24 кадра.

Основы ТВ

Для приёма телевизионного сигнала используется антенна и приёмник. Приёмник – это электронная схема, которая преобразует сигнал в изображение на экране. В этом процессе участвует генератор кадровой развёртки и строчной.

Кадровая развёртка формируется на частоте, близкой к частоте переменного тока в бытовых электросетях – 50 Гц.

Кадровая развёртка, в сочетании со строчной служит для преобразования плоского двумерного изображения в одномерную последовательность, то есть, видеосигнал, а в телевизоре или мониторе компьютера для преобразования видеосигнала обратно в изображение на экране.

Для создания такой последовательности, используются специальные стандарты разложения:

480i, 525/60 — стандарт разложения, принятый в США, число активных строк составляет 480.

Существует также прогрессивная (p) кадровая развёртка, где все строки каждого кадра отображаются последовательно. Прогрессивная развертка стала широко распространена с появлением персональных компьютеров. Для комфортного чтения мелкого текста с экрана монитора, чересстрочная развертка стала малопригодна, так как мерцание строк вызывало быстрое утомление глаз.

Помимо развёртки существует ещё и соотношение сторон: аналоговое ТВ – 4:3, цифровое ТВ – 16:9, широкоформатное.

Форматы со сжатием

Давайте для начала посчитает объём видеофайла без сжатия, длительность 1 час 30 мин., 576i, 16:9. Звук записан с частотой дискретизации – 44 100 Гц, глубина кодирования 24 бит.

Решение:

Видео: I = 576 ∙ 1024 ∙ 25 ∙ 5400 ∙ 24 = 1 911 029 760 000 бит = 222,5 ГБ

Звук: I = 44 100 ∙ 5400 ∙ 24 = 5 715 360 000 бит = 681,3 МБ = 0,665 ГБ

Ответ: 223,2 ГБ.

Графический формат JPEG

Алгоритм JPEG (от англ. Joint Photographic Experts Group) в большей степени пригоден для реалистичных изображений с плавными переходами яркости и цвета, таковыми являются фотографии.

В основу алгоритма заложен переход от цветового пространства RGB к цветовому пространству YCbCr. Y – компонент яркости, Cb и Cr – синий и красный цветоразностные компоненты. Суть сжатия состоит в том что для каждого блока пикселей 2х2 записывается не 12 значений, а 6, за счёт использования усреднённого компонента цвета.

Видео и аудио форматы MPEG

Алгоритм MPEG (англ. Moving Picture Experts Group) – стандарты сжатия и передачи цифровой видео и аудио информации. Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра.

При сжатии аудио используются хорошо разработанные психоакустические модели, чтобы выбросить звуки, которые не слышны человеческому уху.

Современные цифровые стандарты

Современные дисплеи и мониторы уже давно вышли за рамки старых добрых стандартов.

Читайте также: