Доклад на тему представление видеоинформации

Обновлено: 28.06.2024

Звук – это механические колебания среды: воздуха, воды и т.д, воспринимаемые слуховым аппаратом человека. То, что мы слышим – это результат обработки колебательных движений барабанной перепонки уха, представленный в виде сигналов нервной системы. Вне среды переноса звуковых волн звук не существует. Однако звуковые колебания можно перевести на другой носитель: изменить представление информации, не теряя ее фактически. Обычно звуковые колебания переносят на сигналы радиоволн.

З
вуковую информацию можно также представить в математической форме, в виде периодических функций времени. Это представление обычно записывают в виде формулы

Здесь A ( t ) – амплитуда звукового сигнала, а t – время.

Все слышимые звуки являются результатом воздействия звуковых волн. На магнитной ленте, виниловой пластинке звук сохраняется в виде непрерывного электрического сигнала, определяющего изменение звуковых волн. Звук, создаваемый электрическими волнами, называют аналоговым.

Звук может храниться на цифровых носителях, т.е. быть представленным в виде набора цифр. Любая цифровая техника или программа работают со звуком, представленным в цифровом виде. Таким образом, для переноса звука на цифровой носитель, необходимо осуществить его аналогово-цифровое преобразование. Такое преобразование состоит из трех этапов:

дискретизация – представление непрерывного сигнала в виде последовательного набора отдельных амплитуд;

квантование – разделение каждой амплитуды на заданное число уровней;

кодирование – запись данных позиции и уровня амплитуды в цифровом виде.

На практике преобразования звуковой информации из непрерывной формы в дискретную выполняются электронными устройствами, называемыми аналого-цифровыми преобразователями (АЦП) и цифро-аналоговыми преобразователями (ЦАП). Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний. Для определения количества бит, необходимых для кодирования, решим показательное уравнение: 65536 = 2 I , т.к. 65536 = 2 16 , то I = 16 бит.

Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц. При частоте 8 Кгц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте
48 Кгц – качеству звучания аудио-CD. Следует также учитывать , что возможны как моно-, так и стерео-режимы.

Можно оценить информационный объем моно-аудио-файла длительностью звучания 1 секунду при среднем качестве звука (16 бит,
24 Кгц). Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду:

16 бит * 24000 = 384000 бит = 48000 байт  47 Кбайт.

Устройства для работы со звуком

Основным параметром звуковой карты является разрядность, определяющая количество битов, используемых при преобразовании сигналов из аналоговой в цифровую форму и наоборот. Чем выше разрядность, тем меньше погрешность, связанная с оцифровкой, тем выше качество звучания. Минимальным требованием сегодняшнего дня являются 16 разрядов, а наибольшее распространение имеют 32-разрядные и 64-разрядные устройства.

Форматы звуковых файлов.

Звук в компьютере хранится в файлах, имеющих различные способы представления информации. Перечислим основные форматы хранения звуковой информации.

WAVE (*.wav) – наиболее широко распространенный звуковой формат. Используется операционной системой Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять данные в структурированном виде.

Стандарт MPEG-1 представляет собой, целый комплект аудио и видео стандартов. Согласно стандартам ISO ( International Standards Organization), аудио часть MPEG-1 включает в себя три алгоритма различных уровней сложности: Layer 1 (уровень 1), Layer 2 (уровень 2) и Layer 3 (уровень 3). Общая структура процесса кодирования одинакова для всех уровней MPEG-1 . Вместе с тем, несмотря на схожесть уровней в общем подходе к кодированию, уровни различаются по целевому использованию и задействованным в кодировании внутренним механизмам. Для каждого уровня определен свой формат записи выходного потока данных и, соответственно, свой алгоритм декодирования.

MPEG Layer 3 (*.мр3) - формат звуковых файлов с потерями качества, разработанный для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей.

Windows Media Audio (*.wma) - формат звуковых файлов, предложенный фирмой Мiсrosоft. Кодек Windows Media Audio 8 обеспечивает качество, аналогичное mрЗ, при размерах файлов втрое меньших.

MIDI (*.mid) - цифровой интерфейс музыкальных инструментов (Musical Instгument Digital Interface). MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком: это сокращенная форма записи музыки в числовой форме.

Программное обеспечение для редактирования звука.

Наиболее известными в настоящее время являются следующие программы для обработки звука: Sound Forge, GoldWave, Adobe Audition и др.

Основные операции со звуком.

Добавление/удаление звуковой дорожки.

Изменение размера звуковой дорожки.

Разбиение звуковой дорожки на фрагменты.

Редактирование звуковой кривой.

Изменение громкости звучания.

2. Представление видео в ЭВМ

Количество (частота) кадров в секунду — это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным — примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном плёночном кинематографе используется частота 24 кадра в секунду. Системы телевидения PAL и SÉCAM используют 25 кадров в секунду (англ. 25 fps или 25 Герц), а система NTSC использует 29,97 кадров в секунду. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду.

Оборудование для обработки видео на компьютере.

Для записи видеоинформации необходимо:

специальная плата или устройство для оцифровки видеоизображения;

видеомагнитофон или видеокамера;

программное обеспечение для записи и редактирования цифрового видео.

звуковая карта (если плата видеозахвата не поддерживает возможности захвата звука).

Видеокарта (видеоадаптер ). Совместно с монитором видеокарта образует видеоподсистему персонального компьютера. Физически видеоадаптер выполнен в виде отдельной дочерней платы, которая вставляется в один из слотов материнской платы и называется видеокартой. Видеоадаптер взял на себя функции видеоконтроллера, видеопроцессора и видеопамяти.

За время существования персональных компьютеров сменилось несколько стандартов видеоадаптеров: MDA (монохромный); CGA (4 цвета); EGA (16 цветов); VGA (256 цветов). В настоящее время применяются видеоадаптеры SVGA , обеспечивающие по выбору воспроизведение до 16,7 миллионов цветов с возможностью произвольного выбора разрешения экрана из стандартного ряда значений.

Плата оцифровки видео

Можно воспользоваться простейшей аналоговой картой видеозахвата или ТV-тюнером. При этом существуют следующие особенности такой платы. Она должна:

показывать и захватывать аналоговое видео со скоростью потока данных, ограничиваемым только устройством записи;

захватывать видео с произвольными размерами кадра, в частности, с разрешением 352×288 (необходимое для стандарта МРЕG-1);

захватывать видео как через композитный вход, так и через S- Video.

Основные форматы видео файлов

Audio Video Interleaved (*.AVI) - формат, разработанный Мiсrоsоft для записи и воспроизведения видео в операционной системе Windows. При записи в этом формате используются несколько различных алгоритмов сжатия (компрессии) видеоизображения. Среди них Cinepak, Indeo video, Motion-JPEG (M-JPEG) и др. Но только M-JPEG был признан среди них как международный стандарт для сжатия видео. Первоначально для захвата и воспроизведения видео использовались возможности программного комплекта Video fоr Windows, разработанного Microsoft. Компания Мicrоsоft разработала два формата, призванных заменить формат АVI: Advanced Streaming Format (*. ASF) и Advanced Authoring Format (*. AAF).

Windows Media Video (*.WМV) - новый формат видео от Microsoft, который приходит на смену формату АVI. В его основе Wiцdоws Video Codec, разработанный на базе стандарта MPEG-4.

Quick Time Моvе (*.MOV) - наиболее распространенный формат для записи и воспроизведения видео, разработанный фирмой Аррlе для компьютеров Macintosh в рамках технологии Quick Time. Включает поддержку не только видео, но и звука, текста, потоков MPEG, расширенного набора команд MIDI, векторной графики, панорам и объектов (QT) и трехмерных моделей. Поддерживает несколько различных форматов сжатия видео, в том числе MPEG, а также свой собственный метод компрессии.

MPEG (*.MPG, *.MPEG) - формат для записи и воспроизведения видео, разработанный группой экспертов по движущимся изображениям (MPEG). Имеет собственный алгоритм компрессии. В настоящее время активно используются для записи цифрового видео. Наиболее широкое распространение нашли два формата: MPEG-I и MPEG-2. Они различаются по объему и качеству получаемой видеоинформации и признаны международными стандартами для сжатия видео. В настоящее время наряду с MPEG-l и MPEG-2 используется новый формат MPEG-4. Он позволяет сжать информацию с большим коэффициентом сжатия.

Digital Video (*.DV) - формат, разработанный для цифровых видеокамер и видеомагнитофонов. Кодер-декодер (кодек) определен ведущими мировыми производителями электроники, чтобы его могли поддерживать производители в своих платах с интерфейсом FireWare и комплексных решениях для редактирования цифрового видео. Формат не является компактным, поэтому необходимо его преобразование в MPEG.

Кодеки для видеоинформации

Кодек является сокращением от слов компрессор и декомпрессор, это любая технология для сжатия и обратного восстановления данных. Кодеки могут быть реализованы на уровне программного обеспечения, аппаратной части или в их комбинации. Кодеки используются для того, чтобы сделать большие видео файлы намного меньше, делая их пригодными для распространения по сети, локальной или всемирной, или любого другого метода передачи файлов.

Часть кодеков пользователь получает при установке операционной системы Windows. Это те кодеки, которые используются в файлах формата АVI. Если требуется пользоваться для записи форматом QuickТimе, то нужно установить его поддержку.

Cinepak - cоздавался фирмой SuperMac для компьютеров с процессорами Motorola 68030 и Inte1386 и с односкоростными дисководами CD-ROM. Файлы АVI, в которых использован этот кодек, могут быть переведены в формат QuickТimе и, наоборот, без переупаковки.

Sorenson Video - использует усовершенствованные алгоритмы векторного квантования и компенсации движения и адаптивное управление потоком. Оптимизирован для работы со скоростями от 2 до 100 Кбайт/с. Качество изображения значительно превышает Cinepak даже при меньших размерах файла. Сжатие очень медленное. Включен в стандартную поставку QuickТimе.

Indeo Video Interactive (IVI) - видеокодек для форматов АVI и МОV требует компьютеры класса Реntium. Кодек основан на wаvеlеt - компрессии.

MPEG - кодек, который, является официальным стандартом для сжатия и видеоинформации. В нем применяется дискретное косинусное преобразование (DCT, или ДКП) с межкадровым предсказанием. Существует несколько версий этого стандарта (MPEG-l, MPEG-2; MPEG-4).

MPEG-4 задает правила организации объектно-ориентированной среды. Он имеет дело не просто с потоками и массивами медиаданных, а с медиа объектами, например, аудио, видео, аудио/видео, графическими (плоскими и трехмерными), текстовыми. При этом MPEG-4 обеспечивает наилучшую эффективность сжатия. Используется алгоритм "сжатия повышенной эффективности" (АСЕ - Advanced Coding Efficiency). Можно обрабатывать звуковые сигналы в диапазоне от 2 до 24 Кбит/с, а видеосигнал - от 5 до 10 Мбит/с. Благодаря такой масштабируемости, аудио и видеоданные можно адаптировать к реальному применению. Этим обусловлен более универсальный характер MPEG-4 по сравнению с MPEG-2. Наиболее интересны практические достижения в создании видеокодеков, построенных на основе стандарта MPEG-4. Среди них - Windows Media Codec и DivX.

Программы для видеомонтажа

Чтобы превратить оцифрованную информацию в готовый продукт, ее необходимо обработать: разместить монтажные эпизоды, задать эффекты и переходы между ними, добавить титры и пояснительные тексты, отредактировать звуковое сопровождение, наконец, смонтировать готовый фильм. Для этого можно использовать следующие программы: Windows Movie Maker, Pinnacle Studio, VideoStudio, Video Wave, Media Studio Pro, Adobe Premiere, Speed Razor Pro, Adobe After Effects, Cannopus Edius и др.

Для учеников 1-11 классов и дошкольников
Бесплатные сертификаты учителям и участникам

С точки зрения информатики фильм представляет собой сочетание звуковой и графической информации. При традиционных видео-технологиях для создания на экране эффекта движения используется технология быстрой смены статических картинок. В традиционном кадре на кинопленке основную его часть, разумеется, занимает видеоизображение, а сбоку размещена звуковая дорожка – графически зафиксированные колебания.

При использовании традиционных методов сохранения информации компьютерная (оцифрованная) версия фильма получится слишком большой.

До 90-х годов основными методами представления видеоданных были аналоговые методы. Обработка и редактирование данных выполнялись с помощью подхода, который сейчас называется линейный видеомонтаж (Linear Video Editing). При этом подходе данные всегда поступают на вход системы обработки последовательно, и система не может произвольно выбирать материалы, то есть монтаж из нескольких фрагментов выполняется всегда линейно.

Существенным шагом в технологии обработки видеозаписей было появление специализированных плат видеозахвата, выполнявших функции аналого-цифрового преобразования (для ввода), цифро-аналогового (для вывода) и имевших в своем составе средства аппаратного сжатия. Наличие таких плат позволило сжимать видеопоток до приемлемой величины с той скоростью, с которой он поступал на вход. С появлением таких плат появились и получили широкое распространение средства нелинейного видеомонтажа, т.е. средства, позволяющие в любой момент обратиться к любому фрагменту обрабатываемых материалов и преобразовывать их для получения итогового видеоизображения.

При захвате видеосигнала его необходимо сохранить на некотором цифровом носителе. Формат хранения видеофайлов подразумевает обязательное использование средств сжатия видеоизображения.

Группой специалистов был разработан специальный формат и способ сжатия, получивший название JPEG (Joint Photographic Expert Group - объединенная группа экспертов-фотографов). Алгоритм, предложенный ими, применял сжатие с потерей качества. Его достоинство – “силу” сжатия можно указывать при создании файла, получая компромисс между качеством и объемом изображения. Первый стандарт этого алгоритма был принят в 1991 году.

Алгоритм JPEG предусматривает перевод изображения в цветовую модель – YСrCb (Яркость, Хроматический красный, Хроматический синий). За счет того, что человеческий глаз более чувствителен к яркости, чем к цвету, появляется возможность сжимать цветовые компоненты сильнее. При этом цветность прорежена по вертикали и горизонтали в два раза по сравнению с яркостью. Изображение в дальнейшем разбивается на фрагменты размером 8 ´ 8 пикселей, и внутри объектов выполняется целый ряд преобразований (дискретно-косинусное), некоторые из которых сглаживают разницу между пикселями. В зависимости от заданного параметра степени сжатия можно сглаживать разницу сильнее или слабее.

Следующим шагом стала разработка группы методов, предназначенных для сжатия потоковых данных (видео и аудио). Потоковые данные имеют очень большой объем и постепенное изменение, из-за высокой частоты между двумя соседними кадрами (или звуками разница невелика. Сжатый видео - и/или аудио-поток характеризуется общим показателем - битрейтом (bit rate - битовая скорость) — количеством битов на одну секунду использования, которое получается после упаковки.

В рамках этого подхода рассматриваются три вида кадров: ключевой кадр, сохраняемый в потоке полностью, кадры, сжатые со ссылкой на предыдущее изображение, и кадры, ссылающиеся на два кадра.

В случае использования ссылок на кадры записывается и сжимается не весь кадр, а только его изменившиеся части. Двунаправленные и ключевые кадры позволяют сократить накапливающиеся ошибки. Во время сжатия каждое изображение разбивается на макроблоки, разбивающие кадр на отдельные квадраты по 16 пикселей. Отсюда вытекает ограничение - размеры кадра должны быть кратны 16.

Кодирование и декодирование выполняется набором программ, получившим название кодеков (compression/decompression).

Современные форматы хранения видеоматериалов предполагают обязательное использует средства сжатия.

- .AVI - Audio Video Interleave (Чередование аудио и видео) – хранит структуры произвольных мультимедийных данных. Файл как таковой представляет собой контейнер, единый блок, в который могут быть вложены новые блоки и произвольные данные. Таким образом, все AVI-файлы только внешне выглядят одинаково, а внутри могут различаться очень существенно.

- .MP4 - Moving Picture Experts Group - это международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео.

- . IVF Indeo Video Technology – видеофайлы, упакованные с помощью кодека, компании Ligos Corporation

- . MOV ( Quick Time Content ) – разработан Apple Computer для создания, редактирования, просмотра и публикации мультимедиа. Могут содержать авидео- и аудио-, анимацию, графику, и т.д. требуется проигрыватель Apple Quick Time

- .VOB - Video OBject. Контейнер, содержащий видеофильм в формате MPEG-2. Один из форматов для DVD.

Технология DivX (сокращение слов Digital Video Express) дала возможность достигнуть степени сжатия, позволившей вмесить качественную запись полнометражного фильма на один компакт-диск, сжать 4,7 Гб DVD-фильма до 650 Мб.

Презентация на тему: " Видеоинформация-это изображение, зафиксированное на магнитной ленте, кинопленке, фотоснимке или оптическом диске, с которых оно может быть воспроизведено." — Транскрипт:

2 Видеоинформация-это изображение, зафиксированное на магнитной ленте, кинопленке, фотоснимке или оптическом диске, с которых оно может быть воспроизведено.

3 Представление видеоинформации в последнее время компьютере все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы.

4 Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более кадров, то человеческий глаз воспринимает изменения на них как непрерывные.

5 Видеоинформация может быть как статической, так и динамической. Статическая видеоинформация включает текст, рисунки, графики, чертежи, таблицы и др. Рисунки делятся также на плоские - двухмерные и объемные -трехмерные.Динамическая видеоинформация - это видео-, мульт- и слайд- фильмы. В их основе лежит последовательное экспонирование на экране в реальном масштабе времени отдельных кадров в соответствии со сценарием.

6 Некоторые форматы видеофайлов Существует в различных форматов представления видеоданных. В среде Windows, например, уже более 10 лет применяется формат Video for Windows, базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave – чередование аудио и видео). Более универсальным является мультимедийный формат Quick Time, первоначально возникший на компьютерах Apple.

7 Все большее распространение в последнее время получают системы сжатия видеоизображений, допускающие некоторые незаметные для глаза искажения изображения с целью повышения степени сжатия. Наиболее известным стандартом подобного класса служит MPEG (Motion Picture Expert Group). Методы, применяемые в MPEG, непросты для понимания и опираются на достаточно сложную математику.

8 По способу формирования видеоизображения бывают растровые, матричные и векторные.

9 Растровые видеоизображения используются в телевидении, а в ЭВМ практически не применяются. Матричные изображения получили в ЭВМ наиболее широкое распространение. Изображение на экране рисуется электронным лучом точками.

10 Информация представляется в виде характеристик значений каждой точки - пиксела (picture element), рассматриваемого как наименьшей структурной единицей изображения. Количество высвечиваемых одновременно пикселов на экране дисплея определяется его разрешающей способностью. В качестве характеристик графической информации выступают: координаты точки (пиксела) на экране, цвет пиксела, цвет фона (градация яркости). Вся эта информация хранится в видеопамяти дисплея.

12 Сейчас видеоинформация успешно развивается. Открывая новые инновации в мире и улучшая новые идеи.

ЭВМ первых двух поколений могли обрабатывать только числовую информацию, полностью оправдывая свое название вычислительных машин. Лишь переход к третьему поколению принес изменения: к этому времени уже назрела настоятельная необходимость использования текстов.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.

Каждый символ хранится в виде двоичного кода, который является номером символа. Можно сказать, что компьютер имеет собственный алфавит, где весь набор символов строго упорядочен. Количество символов в алфавите также тесно связано с двоичным представлением и у всех ЭВМ равняется 256 . Иными словами, каждый символ всегда кодируется 8 битами , т.е. занимает ровно один байт .

Как видите, хранится не начертание буквы, а ее номер. Именно по этому номеру воспроизводится вид символа на экране дисплея или на бумаге. Поскольку алфавиты в различных типах ЭВМ не полностью совпадают, при переносе с одной модели на другую может произойти превращение разумного текста в "абракадабру". Такой эффект иногда получается даже на одной машине в различных программных средах: например, русский текст, набранный в MS DOS, нельзя без специального преобразования прочитать в Windows. Остается утешать себя тем, что задача перекодировки текста из одной кодовой таблицы в другую довольно проста и при наличии программ машина сама великолепно с ней справляется.

Наиболее стабильное положение в алфавитах всех ЭВМ занимают латинские буквы, цифры и некоторые специальные знаки. Это связано с существованием международного стандарта ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). Русские же буквы не стандартизированы и могут иметь различную кодировку.

Желающие могут в качестве примера ознакомится с таблицей стандартной части алфавита ЭВМ - символы с шестнадцатеричными кодами с 20 до 7F.

Нельзя также пройти мимо еще одного интересного факта: каждый символ текста имеет свой числовой код, но не каждому коду соответствует отображаемый на экране символ. Речь идет о существовании так называемых УПРАВЛЯЮЩИХ КОДОВ , величина которых меньше шестнадцатеричного числа 20 (т.е. 32 в десятичной системе счисления). При получении этих кодов внешние устройства не изображают какого-либо символа, а выполняют те или иные управляющие действия. Так, код 07 вызывает подачу стандартного звукового сигнала, а код 0C - очистку экрана. Особую роль играют коды 0A (перевод строки, обозначаемый часто LF ) и 0D (возврат каретки - CR ). Первый вызывает перемещение в следующую строку без изменения позиции, а второй - на начало текущей строки. Таким образом, для перехода на начало новой строки требуются оба кода и в любом тексте эта "неразлучная пара" кодов хранится после каждой строки.

Обратим внимание читателя на то, что названия возврат каретки и перевод строки имеют историческое происхождение и связаны с устройством пишущей машинки.

Представление графической информации.

Растровое представление:

В отличии текстового представления информации, когда минимальной единицей является символ, при отображении графики картинка строится из отдельных элементов - ПИКСЕЛОВ (от английских слов PIC ture EL ement, означающих "элемент картинки ").

Очень часто пиксел совпадает с точкой дисплея, но это совсем необязательно: например, в некоторых видеорежимах 1 пиксел может состоять из 2 или 4 точек экрана.

Каждый пиксел характеризуется цветом . Как и вся остальная информация в ЭВМ, цвет кодируется числом . В зависимости от количества допустимых цветов, число двоичных разрядов на один пиксел будет различным.

Так, для черно-белой картинки закодировать цвет точки можно одним битом: 0 - черный, 1 - белый. Для случая 16 цветов требуется уже по 4 разряда на каждую точку, а для 256 цветов - 8 , т.е. 1 байт.

Растр - прямоугольная сетка пикселей на экране.

Число цветов, воспроизводимых на экране дисплея (K), и число бит, отводимых в видеопамяти под каждый пиксель (N), связаны формулой:

В режиме 16 -цветной графики это же самое изображение потребует памяти в 4 раза больше.

Наконец, при 256 цветах на каждую точку требуется уже по байту и наш квадратик разрастется еще вдвое.

Обратите внимание на то, что белый цвет, как самый яркий, обычно имеет максимально возможный номер. Поэтому для черно-белого режима он равен 1 , для 16-цветного - 15 , а для 256 цветов - 255 .

Все многообразие красок на экране получается путем смешивания трех базовых цветов: красного , синего и зеленого . Каждый пиксель на экране состоит из трех близко расположенных элементов, святящихся этими цветами. Цветные дисплеи, использующие такой принцип, называются RGB (Red - Green - Blue) - мониторами.

Код цвета пикселя содержит информацию о доле каждого базового цвета.

Если все три составляющие имеют одинаковую интенсивность (яркость), то из их сочетаний можно получить 8 различных цветов (2 3 ).

Желающие могут в качестве примера ознакомится с таблицей кодирующей 8 - цветную палитру с помощью трехразрядного двоичного кода

Шестнадцатицветная палитра получается при использовании 4 - разрядной кодировки пикселя: к трем битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трех цветов одновременно.

Например:
если в 8 - цветовой палитре код 100 обозначает красный цвет , то в 16 - цветной палитре : 0100 - красный , 1100 - ярко - красный цвет ; 0110 - коричневый , 1110 - ярко коричневый (желтый ).

Большее количество цветов получается при раздельном управлении интенсивностью базовых цветов. Причем интенсивность может иметь более двух уровней, если для кодирования каждого из базовых цветов выделять больше одного бита.

При использовании битовой глубины 8 бит / пиксель количество цветов: 2 8 = 256. Биты такого кода распределены следующим образом:КККЗЗЗСС.

Это значит, что под красную и зеленую компоненты выделено по 3 бита , под синюю - 2 бита . Следовательно, красная и зеленая компоненты имеют по 2 8 = 256 уровней яркости, а синяя - 4 уровня.

Векторное представление:

При векторном подходе изображение рассматривается как совокупность простых элементов: прямых линий, дуг, окружностей, эллипсов, прямоугольников, закрасок и пр., которые называются графическими приметивами.

Графическая информация - это данные, однозначно определяющие все графические приметивы, составляющие рисунок.

Положение и форма графических примитивов задаются в системе графических координат, связанных с экраном. Обычно начало координат расположено в верхнем левом углу экрана. Сетка пикселей совпадает с координатной сеткой. Горизонтальная ось X направлена слева направо; вертикальная ось Y - сверху вниз.

Отрезок прямой линии однозначно определяется указанием координат его концов; окружность - координатами центра и радиусом; многоугольник - координатами его углов, закрашенная область - граниной линией и цветом закраски.

Таким образом, графическая информация, также как числовая и текстовая, в конечном счете заносится в память в виде двоичных чисел.

Представление звуковой информации

звук есть колебания среды.

Для их записи с целью последующего воспроизведения необходимо как можно точней сохранить форму кривой зависимости интенсивности звука от времени. При этом возникает одна очень важная и принципиальная трудность: звуковой сигнал непрерывен, а компьютер способен хранить в памяти только дискретные величины. Отсюда следует, что в процессе сохранения звуковой информации она должна быть "оцифрована", т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты, который называется аналого-цифровой преобразователь – АЦП .

Каковы основные принципы работы АЦП ?

Во-первых , он производит дискретизацию записываемого звукового сигнала по времени. Это означает, что измерение уровня интенсивности звука ведется не непрерывно, а, напротив, в определенные фиксированные моменты времени (удобнее, разумеется, через равные временные промежутки). Частоту, характеризующую периодичность измерения звукового сигнала принято называть частотой дискретизации . Вопрос о ее выборе далеко не праздный и ответ в значительной степени зависит от спектра сохраняемого сигнала: существует специальная теорема Найквиста , согласно которой частота "оцифровки" звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала .

Считается, что редкий человек слышит звук частотой более 20 000 Гц (20 кГц ). Поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц . Отсюда немедленно следует, что частота звукозаписи в таких случаях должна быть не ниже 44 кГц . Названная частота используется, в частности, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты дискретизации 8 кГц . Заметим, что результат при этом получается хотя и не блестящий, но легко разборчивый – вспомните, как вы слышите голоса своих друзей по телефону.

Во-вторых , АЦП производит дискретизацию амплитуды звукового сигнала. Это следует понимать так, что при измерении имеется "сетка" стандартных уровней (например, 256 или 65 536 – это количество характеризует глубину кодирования), и текущий уровень измеряемого сигнала округляется до ближайшего из них. Напрашивается линейная зависимость между величиной входного сигнала и номером уровня. Иными словами, если громкость возрастает в 2 раза, то интуитивно ожидается, что и соответствующее ему число возрастет вдвое. В простейших случаях так и делается, но, как показывает более детальное изучение, это не самое лучшее решение. Проблема в том, что в широком диапазоне громкости звука человеческое ухо не является линейным. Например, при очень громких звуках, увеличение или уменьшение интенсивности звука почти не дает эффекта, в то время как при восприятии шепота очень незначительное падение уровня может приводить к полной потере разборчивости. Поэтому при записи цифрового звука, особенно при 8 - битном кодировании, часто используют различные неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон.

Итак, в ходе оцифровки звука мы получаем поток целых чисел, представляющих собой стандартные амплитуды сигналов через равные промежутки времени.

На рисунке представлен процесс "оцифровки" зависимости интенсивности звукового сигнала I от времени t. Отчетливо видна дискретизация по времени (равномерные отсчеты на горизонтальной оси) и по интенсивности сигнала (требуемое при этом округление схематически изображено "изломами" горизонтальных линий разметки). Подчеркнем, что на рисунке степень дискретизации для наглядности сознательно утрирована: реально различие между соседними уровнями дискретизации по обеим осям значительно меньше и, следовательно, форма сигнала передается гораздо точнее.

Мы рассмотрели лишь наиболее общие принципы записи цифрового звука. На практике для получения качественных звуковых файлов используется целый ряд дополнительных технических приемов.

Изложенный метод преобразования звуковой информации для хранения в памяти компьютера в очередной раз подтверждает уже неоднократно обсуждавшийся ранее тезис: любая информация для хранения в компьютере приводится к цифровой форме и затем переводится в двоичную систему.

Остается рассмотреть обратный процесс – воспроизведение записанного в компьютерный файл звука. Здесь имеет место преобразование в противоположном направлении – из дискретной цифровой формы представления сигнала в непрерывную аналоговую, поэтому вполне естественно соответствующий узел компьютерного устройства называется ЦАП – цифро-аналоговый преобразователь . Процесс реконструкции первоначального аналогового сигнала по имеющимся дискретным данным нетривиален, поскольку никакой информации о форме сигнала между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала могут использоваться различные способы.

Наиболее наглядный и понятный из них состоит в том, что по имеющимся точкам рассчитывается степенная функция, проходящая через заданные точки, которая и принимается в качестве формы аналогового сигнала. Чтобы понять, как это делается, возьмем, например, интерполяцию параболой I = at 2 + bt + c по трем заданным точкам. Подставив в эту формулу известные значения времени и приравняв их к сохраненным в файле значениям интенсивности звука I, получим три линейных уравнения с тремя неизвестными a, b и c.

Качественный вид результата представлен на рисунке:

Видно, что на интерполируемом участке даже для параболы совпадение получается вполне удовлетворительное. Кроме того, технические возможности современных микросхем позволяют значительно увеличить степень полинома (многочлена), а вместе с ней и точность реконструкции формы сигнала.

Представление видео информации.

Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы, причем не только процессора, но и CD-ROM, с которого считываются данные, конечно, видеосистемы, а также всех информационных шин, по которым данные передаются от одного устройства к другому.

В частности, когда при весьма скромном размере окна видеоизображения 360x240 и 16 битах цветовой информации на каждый пиксел скорость передачи данных превышает один мегабайт в секунду. То есть за десять минут должно быть передано более 600 Мбайт данных, что эквивалентно немного немало почти целому диску CD-ROM!

Таким образом, если для прочих видов информации сжатие лишь повышает удобства работы, то для видеоинформации технологии сжатия имеют поистине жизненно важное значение.

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные. В любительской киносъемке использовалась частота 16 кадров/сек., в профессиональной – 24.

Традиционный кадр на кинопленке "докомпьютерной" эпохи выглядел так, как показано на рисунке.

Основную его часть, разумеется, занимает видеоизображение, а справа сбоку отчетливо видны колебания на звуковой дорожке. Имеющаяся по обоим краям пленки периодическая система отверстий (перфорация) служит для механической протяжки ленты в киноаппарате с помощью специального механизма.

Казалось бы, если проблемы кодирования статической графики и звука решены, то сохранить видеоизображение уже не составит труда. Но это только на первый взгляд, поскольку, как показывает разобранный выше пример, при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой. Достаточно очевидное усовершенствование состоит в том, чтобы первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять лишь отличия от начального кадра (разностные кадры).

Принцип формирования разностного кадра поясняется на следующем рисунке, где продемонстрировано небольшое горизонтальное смещение прямоугольного объекта.

Отчетливо видно, что при этом на всей площади кадра изменились всего 2 небольшие зоны: первая сзади объекта возвратилась к цвету фона, а на второй – перед ним, фон перекрасился в цвет объекта. Для разноцветных предметов произвольной формы эффект сохранится, хотя изобразить его будет заметно труднее.

Конечно, в фильме существует много ситуаций, связанных со сменой действия, когда первый кадр новой сцены настолько отличается от предыдущего, что его проще сделать ключевым, чем разностным. Может показаться, что в компьютерном фильме будет столько ключевых кадров, сколько новых ракурсов камеры. Тем не менее, их гораздо больше. Регулярное расположение подобных кадров в потоке позволяет пользователю оперативно начинать просмотр с любого места фильма: "если пользователь решил начать просмотр фильма с середины, вряд ли он захочет ждать, пока программа распаковки вычислит все разности с самого начала". Кроме того, указанная профилактическая мера позволяет эффективно восстановить изображение при любых сбоях или при "потере темпа" и пропуске отдельных кадров на медленных компьютерных системах.

Заметим, что в современных методах сохранения движущихся видеоизображений используются и другие типы кадров.

Существует множество различных форматов представления видеоданных. Рассмотрим некоторые из них:

В среде Windows , например, уже более 10 лет (начиная с версии 3.1) применяется формат Video for Windows , базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave – чередование аудио и видео ). Суть AVI файлов состоит в хранении структур произвольных мультимедийных данных, каждая из которых имеет простой вид, изображенный на рисунке.

Файл как таковой представляет собой единый блок, причем в него, как и в любой другой, могут быть вложены новые блоки. Заметим, что идентификатор блока определяет тип информации, которая хранится в блоке.

Внутри описанного выше своеобразного контейнера информации (блока) могут храниться абсолютно произвольные данные, в том числе, например, блоки, сжатые разными методами. Таким образом, все AVI -файлы только внешне выглядят одинаково, а внутри могут различаться очень существенно.

Наиболее популярные программы проигрывания видеофайлов позволяют использовать замещаемые подсистемы сжатия и восстановления видеоданных – кодеки (от англ. compression/decompression – codec).

Такой подход позволяет легко адаптировать новые технологии, как только те становятся доступными. Замещаемые кодеки хороши как для пользователей, так и для разработчиков программного обеспечения. Тем не менее, большое разнообразие кодеков создает определенные трудности для производителей видеопродукции. Часто в качестве выхода из создавшегося положения необходимые кодеки помещают на компакт-диск с фильмами или даже поставляют видеоматериалы в нескольких вариантах, предоставляя тем самым возможность выбрать подходящий. Все больше распространяется автоматизация распознавания, когда плейер, обнаружив информацию об отсутствующем кодеке, загружает его из Интеренет.

В последнее время компьютер все чаще исползуется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы.

Казалось бы, если проблемы кодирования статистической графики и звука решены, то сохранить видеоизображение уже не составит труда. Но это только на первый взгляд, поскольку, как показывет разобранный выше пример, при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой. Достаточно очевидное усевершенствование состоит в том, что первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять только отличия от начального кадра (разностные кадры).

Существует множество различных форматов представления видеоданных.

В среде Windows, например, уже боле 10 лет (начиная с версии 3.1) применятся формат Video for Windows, базирующийся на универсальных файлых с расширением AVI (Audio Video Interleave - чередование аудио и видео).

Большое рапространение получила технология под названием DivX (происходит от сокращения слова Digital Video Express). Благодаря DivX удалось достигнуть степени сжатия, позволившей вместить качественную запись полнометражного фильма на один компакт диск - сжать 4,7 Гб DVD-фильма до 650 Мб.

Что такое "мультимедиа"?

Мультимедиа – это собирательное понятие для различных компьютерных технологий, использующих динамические (движущиеся) изображения и звуковые эффекты. Само слово “мультимедиа“ происходит от двух латинских корней multi – много и media – средство. Использование видео- и аудиоэффектов обеспечивает наглядность представления информации, позволяет преподносить ее в более привлекательном с эстетической точки зрения виде. Примерами программных систем, широко использующих средства мультимедиа, являются системы подготовки презентаций, обучающие системы, в том числе компьютерные тренажеры и виртуальные лаборатории, компьютерные энциклопедии, фоно- и видеотеки, игры.

Основными объектами мультимедиа в настоящее время являются записи звука и динамических изображений, представленные в различных цифровых форматах.

Практически все программные системы, использующие мультимедиа-объекты, являются интерактивными, то есть ведущими интенсивный диалог с пользователем, поэтому для них очень важна возможность не только качественного, но и быстрого воспроизведения звука и изображений.

Существует множество различных форматов представления видеоданных.

Что такое "мультимедиа"?

Читайте также: