Источники информации форматы представления данных кратко

Обновлено: 06.07.2024

Задачи, связанные с хранением, передачей и обработкой информации, человеку приходилось решать во все времена: требовалось передавать знания из поколения в поколения, искать нужные книги в хранилищах, шифровать секретную переписку. К концу XIX века количество документов в библиотеках стало настолько велико, что возникла необходимость применить научный подход к задачам хранения и поиска накопленной информации. В это время зародилось новое научное направление, в котором изучалась документальная информация, т. е. информация в виде документов (книг, журналов, статей и т. п.). В английском языке оно получило название information science (информационная наука, наука об информации).

Современная информатика, которая стала самостоятельной наукой в 70-х годах XX века, изучает теорию и практику обработки информации с помощью компьютерных систем. Обычно к информатике относят следующие научные направления:

• теоретическую информатику (теорию информации, теорию кодирования, математическую логику, теорию автоматов и др.);

• вычислительную технику (устройство компьютеров и компьютерных сетей);

• алгоритмизацию и программирование (создание алгоритмов и программ);

• прикладную информатику (персональные компьютеры, прикладные программы, информационные системы и т. д.);

• искусственный интеллект (распознавание образов, понимание речи, машинный перевод, логические выводы, алгоритмы самообучения)

Что такое информация?

Попробуем посмотреть на информацию с разных сторон и попытаться выявить некоторые её свойства.

Информация характеризует разнообразие (неоднородность) в окружающем мире.

Зачем вообще нам нужна информация? Дело в том, что наше знание всегда в чём-то неполно, в нём есть неопределенность. Например, вы стоите на остановке и не знаете, на каком именно автобусе вам нужно ехать в гости к другу (его адрес известен). Неопределённость мешает вам решить свою задачу. Нужный номер автобуса можно определить, например, по карте с маршрутами транспорта. Очевидно, что при этом вы получите новую информацию, которая увеличит знание и уменьшит неопределённость.

При получении информации уменьшается неопределённость знания.

Как получают информацию

Человек получает информацию через свои органы чувств: глаза, уши, рот, нос и кожу. Поэтому получаемую нами информацию можно разделить на следующие виды:

• зрительная информация (визуальная, от англ, visual) — поступает через глаза (по разным оценкам, это 80-90% всей получаемой нами информации);

• звуковая информация (аудиальная, от англ, audio) — поступает через уши;

• вкусовая информация — поступает через язык;

• обонятельная информация (запахи) — поступает через нос;

Формы представления информации

Информация может быть представлена (зафиксирована, закодирована) в различных формах:

• текстовая информация — последовательность символов (букв, цифр, других знаков); в тексте важен порядок их расположения, например КОТ и ТОК — два разных текста, хотя они состоят из одинаковых символов;

• графическая информация (рисунки, картины, чертежи, карты, схемы, фотографии и т. п.);

• звуковая информация (звучание голоса, мелодии, шум, стук, шорох и т. п.);

• мультимедийная информация, которая объединяет несколько форм представления информации (например, видеоинформация).

Обратим внимание, что одна и та же информация может быть представлена по-разному. Например, результаты измерения температуры в течение недели можно сохранить в виде текста, чисел, таблицы, графика, диаграммы, видеофильма и т.д.

В научной литературе информацию, зафиксированную (закодированную) в какой-то форме, называют данными, имея в виду, что компьютер может выполнять с ними какие-то операции, но не способен понимать смысл.

Свойства информации

В идеале информация должна быть:

• объективной (не зависящей от чьего-либо мнения);

• понятной для получателя;

• полезной (позволяющей получателю решать свои задачи);

• достоверной (полученной из надёжного источника);

• актуальной (значимой в данный момент);

• полной (достаточной для принятия решения).

Конечно, информация не всегда обладает всеми этими свойствами.

Материальный носитель — это объект или среда, которые могут содержать информацию.

Изменения, происходящие с информацией (т. е. изменения свойств носителя), называются информационными процессами. Все эти процессы можно свести к двум основным:

• передача информации (данные передаются с одного носителя на другой);

• обработка информации (данные изменяются).

Передача информации

При передаче информации всегда есть два объекта — источник и приёмник информации. Эти роли могут меняться, например во время диалога каждый из участников выступает то в роли источника, то в роли приёмника информации.

Информация проходит от источника к приёмнику через канал связи, в котором она должна быть связана с каким-то материальным носителем . Для передачи информации свойства этого носителя должны изменяться со временем. Например, если включать и выключать лампочку, то можно передавать разную информацию, например, с помощью азбуки Морзе.



Сигнал — это изменение свойств носителя, которое используется для передачи информации.

Скорость передачи данных — это количество битов (байтов, Кбайт и т. д.), которое передаётся по каналу связи за единицу времени (например, за 1 с).

Пропускная способность любого реального канала связи ограничена. Это значит, что есть некоторая наибольшая возможная скорость передачи данных, которую принципиально невозможно превысить.

Основная единица измерения скорости — биты в секунду (бит/с, англ, bps — bits per second). Для характеристики быстродействующих каналов применяют килобиты в секунду (Кбит/с) и мегабиты в секунду (Мбит/с), иногда используют байты в секунду (байт/с) и килобайты в секунду (Кбайт/с).

Информационный объём I данных, переданных по каналу за время t, вычисляется по формуле I = v • t, где и — скорость передачи данных. Например, если скорость передачи данных равна 512 000 бит/с, за 1 минуту можно передать файл объёмом

512 000 бит/с * 60 с = 30 720 000 битов = 3 840 000 байтов = 3075 Кбайт.

Обработка информации

Обработка — это изменение информации: её формы или содержания. Среди важнейших видов обработки можно назвать:

• создание новой информации, например решение задачи с помощью вычислений или логических рассуждений;

• кодирование — запись информации с помощью некоторой системы знаков для передачи и хранения; один из вариантов кодирования — шифрование, цель которого — скрыть смысл (содержание) информации от посторонних;

• поиск информации, например, в книге, в библиотечном каталоге, на схеме или в Интернете;

• сортировка — расстановка элементов списка в заданном порядке, например расстановка чисел по возрастанию или убыванию, расстановка слов по алфавиту; задача сортировки — облегчить поиск и анализ информации.

Хранение информации

Для хранения информации человек, прежде всего, использует свою память. Можно считать, что мозг — это одно из самых совершенных хранилищ информации, во многом превосходящее компьютерные средства.

При записи информации свойства носителя меняются: на бумагу наносятся текст и рисунки; на магнитных дисках и лентах намагничиваются отдельные участки; на оптических дисках образуются области, по-разному отражающие свет. При хранении эти свойства остаются неизменными, что позволяет потом читать (получать) записанную информацию.

Отметим, что процессы записи и чтения — это процессы передачи информации.

Что такое бит?

Бит — это количество информации, которую можно записать (закодировать) с помощью одной двоичной цифры.



А если возможных вариантов не два, а больше? Понятно, что в этом случае количество информации будет больше, чем 1 бит. Представим себе, что на вокзале стоят 4 одинаковых поезда , причём только один из них проследует в Москву. Сколько битов понадобится для того, чтобы записать информацию о номере платформы, где стоит поезд на Москву?

I, битов 1 2 3 4 5 6 7 8 9 10

N, вариантов 2 4 8 16 32 64 128 256 512 102

Наверно, вы заметили, что все числа в нижней строчке таблицы — это степени числа 2: N = 2 I .

Осталось выяснить, чему равно количество информации, если выбор делается, скажем, из 5 возможных вариантов (или из любого количества, не являющегося степенью числа 2). С точки зрения приведённого выше рассуждения случаи выбора из 5, 6, 7 и 8 вариантов не различаются — для кодирования двух двоичных цифр мало, а трёх — достаточно. Поэтому использование трёх битов для кодирования одного из 5 возможных вариантов избыточно, ведь три бита позволяют закодировать целых 8 вариантов! Значит, выбор из 5 вариантов даёт меньше трёх битов информации.

Чтобы количественно измерить разницу между, скажем, 5 и 8 вариантами, придется допустить, что количество информации в битах может быть дробным числом. При этом информация, полученная при выборе из 5 вариантов, больше, чем 2 бита, но меньше, чем 3 бита. Точную формулу для ее вычисления получил в 1928 г. американский инженер Ральф Хартли. Эта формула использует понятие логарифма :I=log2N.

Другие единицы

Считать большие объёмы информации в битах неудобно хотя бы потому, что придётся работать с очень большими числами (миллиардами, триллионами и т. д.). Поэтому стоит ввести более крупные единицы.

1 байт = 8 битов.

Содержание

Введение 2
1.Теоретическая часть ………………………………………………..3
1.1.Введение ………………………………………………………..3
1.2.Форматы данных ……………4
1.3. Представление информации в компьютере……………………..5
1.4. Единицы измерения объема данных……………………………..6
1.5. Кодирование……………………………………………………….0
Заключение………………………………………………………..8

2.Практическая часть ………………………………………………….9
2.1. Общая характеристика задачи …………………………………..9
2.2. Проектирование форм выходных документов и графическое представление данных по выбранной задаче 13
Список использованной литературы 21

Вложенные файлы: 1 файл

Копия инф.docx

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

Направления бакалавр экономики

Проверил: к.т.н. доцент

1.2.Форматы данных ……………4

1.3. Представление информации в компьютере……………………..5

1.4. Единицы измерения объема данных……………………………..6

2.1. Общая характеристика задачи …………………… ……………..9

2.2. Проектирование форм выходных документов и графическое представление данных по выбранной задаче 13

Список использованной литературы 21

Введение.

Эта курсовая работа состоит из двух частей: теоретической и практической.

В практической части работы решена экономическая задача с использованием электронных таблиц на ПК. Для выполнения и оформления курсовой работы из пакета MS Office использовались:

Microsoft Word - текстовый процессор, позволяющий создавать документы любой сложности: оформлять их с использованием различных шрифтов, включать в документ рисунки, таблицы, формулы, графики, диаграммы и др. Имеет удобный графический интерфейс и средства автоматизации оформления документов. Создаваемые файлы имеют расширение DOC.

Microsoft Excel - табличный процессор для представления и обработки данных в виде электронных таблиц, имеющий универсальные возможности решения задач и встроенные средства деловой графики. Создаваемые файлы имеют расширение XLS.

Также для выполнения и оформления курсовой работы использовались:

- операционная система Windows XP;

- интернет браузер Google Chrome;

1. Теоретическая часть

Информа́тика (ср. нем. Informatik, фр. Informatique, англ. computer science — компьютерная наука — в США, англ. computing science — вычислительная наука — в Великобритании) — наука о способах получения, накопления, хранения, преобразования, передачи и использования информации. Она включает дисциплины, относящиеся к обработке информации в вычислительных машинах и вычислительных сетях: как абстрактные, вроде анализа алгоритмов, так и довольно конкретные, например, разработка языков программирования.

Термин информатика возник в 60-х годах во Франции для названия области, занимающейся автоматизированной переработкой информации, как слияние французских слов information и automatique.

Непременным условием повышения эффективности управленческого труда является оптимальная информационная технология, обладающая гибкостью, мобильностью и адаптивностью к внешним воздействиям. Информационная технология предполагает умение грамотно работать с информацией и вычислительной,техникой.
Информационные технологии (ИТ, от англ. information technology, IT) — широкий класс дисциплин и областей деятельности, относящихся к технологиям управления и обработки данных, в том числе, с применением вычислительной техники. В прошедшее время под информационными технологиями чаще всего понимают компьютерные технологии. В частности, ИТ имеют дело с использованием компьютеров и программного обеспечения для хранения, преобразования, защиты, обработки, передачи и получения информации. Согласно определению, принятому ЮНЕСКО, ИТ — это комплекс взаимосвязанных, научных, технологических, инженерных дисциплин, изучающих методы эффективной организации труда людей, занятых обработкой и хранением информации; вычислительную технику и методы организации и взаимодействия с людьми и производственным оборудованием, их практические приложения, а также связанные со всем этим социальные, экономические и культурные проблемы. Сами ИТ требуют сложной подготовки, больших первоначальных затрат и наукоемкой техники. Их введение должно начинаться с создания математического обеспечения, формирования информационных потоков в системах подготовки специалистов.
Информационная технология (ИТ) базируется и зависит от технического, программного, информационного, методического и организационного обеспечения, а программное обеспечение реализует функции накопления, обработки, анализа, хранения, интерфейса с компьютером.

В своей работе процессор может оперировать разнообразными данными, которые в зависимости от режима работы и применяемых команд могут быть представлены в нескольких различных формах (форматах).

Различные форматы данных отличаются длиной (количеством бит, отводимых для числа) и назначением отдельных битов или групп битов. В современных процессорах, которые поддерживают несколько наборов команд, соответственно, поддерживается и несколько наборов различных форматов. К таким наборам относятся:

  • базовые форматы, которые используются стандартными командами при операциях с числами в регистрах и памяти;
  • форматы данных математического сопроцессора (FPU);
  • форматы данных MMX/3DNow!;
  • форматы данных SIMD.

Все рассматриваемые в данном разделе процессоры поддерживают стандартные команды целочисленной арифметики (ADD, ADC, SUB, SBB, IMUL, MUL, IDIV, DIV, INC, DEC, NEG, CMP), команды двоично-десятичной арифметики (DAA, DAS, AAA, AAS, AAM, AAD), а также некоторые другие группы команд, которые предназначены для обработки целочисленных и строковых данных.

Целые числа могут занимать байт, слово или двойное слово. Они могут быть знаковыми и беззнаковыми. В знаковых целых самый старший бит байта, слова или двойного слова, занимаемого числом, отводится для индикации знака числа. Нуль соответствует плюсу, 1 — минусу. Таким образом, возможный диапазон представляемых значений для знаковых целых составляет: от –128 до +127 для байтовых величин, от –32768 до +32767 для слов, от –2 31 до 2 31 -1 для двойных слов. Беззнаковые целые могут принимать значения: от 0 до 255 для байтовых величин, от 0 до 65535 для слов, от 0 до 2 32 -1 для двойных слов.

Двоично-десятичные целые числа

Двоично-десятичные целые — это набор четырехбитовых беззнаковых величин, каждая из которых может принимать значения от 0 до 9. Двоично-десятичные числа могут быть в обычном или упакованном формате. Обычный формат использует только младшие четыре бита байта, в этом формате каждая цифра представляется одним байтом так же, как и целочисленные беззнаковые значения от 0 до 9. Упакованный формат предусматривает использование старших четырех бит байта для представления более старшей значащей цифры десятичного числа, т.е. в упакованном формате требуется в два раза меньше байт для представления десятичных чисел одинаковой разрядности.

Битовые поля — это непрерывные последовательности битов, которые могут располагаться в любом месте памяти и начинаться с любого бита любого байта по любому адресу. Началом битового поля считается самый младший используемый бит самого младшего байта. Битовые поля могут иметь длину до 32 бит.

Строки — это непрерывные последовательности битов, байтов, слов или двойных слов в памяти. Битовые строки могут располагаться в любом месте памяти и начинаться с любого бита любого байта по любому алресу. Максимальная длина битовых строк 2 32 -1 бит. Строки байт, слов и двойных слов могут занимать до 2 32 -1 байт (4 Гб).

      Представление информации в компьютере.

    В настоящее время во всех вычислительных машинах информация представляется с помощью электрических сигналов. При этом возможны две формы ее представления – в виде непрерывного сигнала (с помощью сходной величины – аналога) и в виде нескольких сигналов (с помощью набора напряжений, каждое из которых соответствует одной из цифр представляемой величины).

    Первая форма представления информации называется аналоговой, или непрерывной. Величины, представленные в такой форме, могут принимать принципиально любые значения в определенном диапазоне. Количество значений, которые может принимать такая величина, бесконечно велико. Отсюда названия – непрерывная величина и непрерывная информация. Слово непрерывность отчетливо выделяет основное свойство таких величин – отсутствие разрывов, промежутков между значениями, которые может принимать данная аналоговая величина. При использовании аналоговой формы для создания вычислительной машины потребуется меньшее число устройств (каждая величина представляется одним, а не несколькими сигналами), но эти устройства будут сложнее (они должны различать значительно большее число состояний сигнала). Непрерывная форма представления используется в аналоговых вычислительных машинах (АВМ). Эти машины предназначены в основном для решения задач, описываемых системами дифференциальных уравнений: исследования поведения подвижных объектов, моделирования процессов и систем, решения задач параметрической оптимизации и оптимального управления. Устройства для обработки непрерывных сигналов обладают более высоким быстродействием, они могут интегрировать сигнал, выполнять любое его функциональное преобразование и т. п. Однако из-за сложности технической реализации устройств выполнения логических операций с непрерывными сигналами, длительного хранения таких сигналов, их точного измерения АВМ не могут эффективно решать задачи, связанные с хранением и обработкой больших объемов информации.

    Вторая форма представления информации называется дискретной (цифровой). Такие величины, принимающие не все возможные, а лишь вполне определенные значения, называются дискретными (прерывистыми). В отличие от непрерывной величины, количество значений дискретной величины всегда будет конечным. Дискретная форма представления используется в цифровых электронно-вычислительных машинах (ЭВМ), которые легко решают задачи, связанные с хранением, обработкой и передачей больших объемов информации.

    Для автоматизации работы ЭВМ с информацией, относящейся к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования.

    Кодирование – это представление сигнала в определенной форме, удобной или пригодной для последующего использования сигнала. Говоря строже, это правило, описывающее отображение одного набора знаков в другой набор знаков. Тогда отображаемый набор знаков называется исходным алфавитом, а набор знаков, который используется для отображения, – кодовым алфавитом, или алфавитом для кодирования. При этом кодированию подлежат как отдельные символы исходного алфавита, так и их комбинации. Аналогично для построения кода используются как отдельные символы кодового алфавита, так и их комбинации.

    Совокупность символов кодового алфавита, применяемых для кодирования одного символа (или одной комбинации символов) исходного алфавита, называется кодовой комбинацией, или кодом символа. При этом кодовая комбинация может содержать один символ кодового алфавита.

    Символ (или комбинация символов) исходного алфавита, которому соответствует кодовая комбинация, называется исходным символом.

    Совокупность кодовых комбинаций называется кодом.

    Взаимосвязь символов (или комбинаций символов, если кодируются не отдельные символы исходного алфавита) исходного алфавита с их кодовыми комбинациями составляет таблицу соответствия (или таблицу кодов).

    В качестве примера можно привести систему записи математических выражений, азбуку Морзе, морскую флажковую азбуку, систему Брайля для слепых и др.

    В вычислительной технике также существует своя система кодирования – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1 (используется двоичная система счисления). Эти знаки называются двоичными цифрами, или битами (binary digital).

    Если увеличивать на единицу количество разрядов в системе двоичного кодирования, то увеличивается в два раза количество значений, которое может быть выражено в данной системе. Для расчета количества значений используется следующая формула:

    где N – количество независимо кодируемых значений,

    а m – разрядность двоичного кодирования, принятая в данной системе.


    Для этого возводим 2 в 10 степень (m) и получаем N=1024, т. е. в двоичной системе кодирования 10-ю разрядами можно закодировать 1024 независимо кодируемых значения.

    В информатике , А формат данных является способом , в котором тип данных представлена (закодирована) , как ряд битов . Для удобства мы интерпретируем эту последовательность битов как двоичное число и с помощью ярлыка говорим, что данные представлены в виде числа. Например, символ C обычно кодируется как последовательность, из которой активированы 3 бита, что записывается как 0100 0011 или 67 в десятичной системе .

    Таким образом, формат данных - это (возможно, стандартизованное ) соглашение, используемое для представления данных - информации, представляющей текст, страницу, изображение , звук , исполняемый файл и т. Д. Это шаблон, в котором данные размещаются в определенных местах, так что инструмент, который читает этот формат, находит данные там, где он ожидал их найти. Когда эти данные хранятся в файле , это называется форматом файла . Такое соглашение позволяет обмениваться данными между различными компьютерными программами или программным обеспечением либо посредством прямого соединения, либо посредством файла. Эта возможность обмена данными между различным программным обеспечением называется совместимостью .

    Резюме

    Типология

    Мы отличаем открытый формат , спецификация которого является общедоступной, от закрытого (или непрозрачного) формата , спецификация которого является секретной. Закрытый формат обычно соответствует единственному программному обеспечению, способному полностью использовать его.

    Еще одно различие проводится между стандартизованным форматом, подлежащим стандартизации государственным или международным учреждением ( ISO , W3C ), и любым форматом, который может стать стандартом из-за своей популярности. Такой формат иногда впоследствии стандартизируется как OpenDocument .

    Формат считается проприетарным, если он был разработан компанией в первую очередь для коммерческих целей. Собственный формат можно открыть (например, формат PDF для Adobe ), если он опубликован, или закрыть (например, формат Doc от Microsoft ). Но даже когда спецификации становятся общедоступными, компании, у истоков которых были проприетарные форматы, стараются поддерживать контроль, либо регулярно предлагая новые более сложные версии (контроль за счет поддержания технического прогресса), либо используя такие законные средства, как патенты. Такой вид антиконкурентной практики с помощью юридических инструментов разрешен в Соединенных Штатах. Это вызывает споры в Европе (см. Патентоспособность программного обеспечения ).

    Числовые форматы

    Целые числа

    Например, байтом мы можем представить:

    • натуральные числа от 0 (00000000 в двоичной системе) до 255 (11111111 в двоичной системе);
    • относительные целые числа от -128 (10000000 в двоичной системе) до -1 (11111111 в двоичной системе) и от 0 (00000000) до 127 (01111111); поэтому целые числа от -128 до +127 кодируются одним байтом.

    Обратите внимание, что для сравнения двух относительных целых чисел, закодированных таким образом, достаточно выполнить исключающее ИЛИ с (10 000 000 в двоичном формате) для каждого из них перед тестом.

    Другие типы также используются для представления целых чисел, это BCD- кодирование в расширенной форме (одна цифра на один байт) или сжатой (одна цифра на 4 бита). Хотя эти форматы менее эффективны для вычислений, чем описанная выше двоичная система, поскольку они требуют дополнительных инструкций для переформатирования результата выполненных арифметических операций, они все еще используются во многих системах ( центральный компьютер , СУБД и т. Д.) И управляются ими. процессоры, потому что они не ограничены количеством битов, используемых процессором для двоичной арифметики (8 бит, 16 бит, 32 бит, 64 бита и т. д.), и они сохраняют единичную точность в отличие от чисел с плавающей запятой .

    Дробные числа

    Дробь записывается с числителем и знаменателем, так что два целых числа. Однако это можно использовать только в формальном исчислении.

    Запятые числа

    Для вычислений мы предпочитаем использовать компьютерные целые числа с основанием два или десять, в которых используется запятая, в переменной (деци-микро-нано-пико) или фиксированной (франки-сантимы) позиции.

    Таким образом, число 0,001 в двоичной системе ( n = 2) означает 1 × 2 −3 = 0,125.

    Итак, в информатике первое решение состоит в том, чтобы присвоить определенное количество бит справа отрицательным степеням двойки.

    Другое решение - использовать кодировку BCD для целых чисел с учетом позиционирования десятичной точки в фиксированной позиции, например, для 10-значного кодирования первые восемь цифр содержат целую часть, а последние две - десятичную часть. Такое расположение совершенно произвольно и должно управляться программистом для отображения или вычислений, особенно для умножения или когда два числа не определены с одинаковым количеством цифр после десятичной точки. Именно этот тип данных обычно используется в СУБД для типа DECIMAL.

    Текстовые форматы

    Тексты состоят из символов конечных чисел ( букв , диакритических знаков , знаков препинания . ), по крайней мере, в европейских алфавитах. Если бы было просто присвоить номер каждому символу во всех региональных контекстах, это преобразование было бы определено по соглашению в форме таблицы или кодовой страницы . На практике по причинам интероперабельности используются более сложные системы кодирования . Наиболее широко используются региональная кодовая страница ASCII для английского языка, ее варианты и расширения из других стран, а также Unicode .

    Форматы изображений

    Основа представления изображений - аналитическая геометрия .

    Формат балльной карты


    Бесполезно указывать координаты точек: если ширина изображения задана числом n точек, то первые n точек представляют первую строку, точки от n +1 до 2 n представляют вторую строку . Затем достаточно условно зафиксировать порядок сканирования, в данном случае западный порядок чтения (слева направо и сверху вниз).

    В результате получается изображение в формате точечной карты, которое часто называют растровым изображением . Таким образом, это холст из точек, каждой из которых присвоено значение цвета. Существенные различия между существующими форматами заключаются в глубине цвета (1 бит: черный или белый, 8 бит: 256 цветов, 24 бита: 16 миллионов цветов…) и тип сжатия (без сжатия или сырое , со сжатием по шаблонам, с деструктивным сжатием . )

    Например, рассмотрим черно-белую карту (1 для цвета фигуры, 0 или · для цвета фона), определяющую изображение шириной в пять точек с помощью следующей числовой последовательности:

    Эта карта должна быть разрезана на группы по 5 бит:

    Векторный формат

    Изображение в векторном формате - это изображение, которое описывается наборами математических координат, а не холстом точек. Например :

    • для описания линии достаточно знать координаты ее отправления и прибытия;
    • для прямоугольника (у которого стороны совпадают с осями текущей системы координат) также достаточно двух точек (двух противоположных углов);
    • для круга нужна только одна точка, а также радиус.

    Кроме того, необходима информация о пути: графические атрибуты - это толщина, стиль (непрерывный или пунктирный), цвет линии, ее прозрачность и т. Д.

    Следовательно, векторное изображение - это набор координат, атрибутов и команд, за интерпретацию которых отвечает программа отображения (на экране или на бумаге).

    Для изображений, которые можно легко преобразовать в геометрические формы (типографика, картография и т. Д.), Векторный формат чрезвычайно экономичен.

    Некоторые известные векторные форматы: VML , SVG , Adobe PDF (Acrobat), Adobe Illustrator , инкапсулированный PostScript EPS , Quark QXD , Silverlight и Macromedia Flash (форматы векторной анимации), AutoCAD DXF .

    Цветовое представление

    Видео форматы

    Форматы 3D-сцены

    Для представления виртуальных объектов, созданных с помощью программного обеспечения для 3D-моделирования, требуется определенный формат данных , поскольку предыдущие форматы не подходят. Ведь для представления 3D-объекта нужно как минимум описание:

    • топология объекта: его форма, размер и сложность;
    • атрибуты представления: цвета, текстуры (характер и положение), фотометрическое качество его поверхности, прозрачность;
    • его динамических атрибутов, если он анимирован: способность сталкиваться с другими объектами, соединениями и ограничениями и т. д.

    Представление сцены также требует указания используемого освещения, относительного положения объектов, любых эффектов окружающей среды, но, прежде всего, ее иерархической структуры (связей между элементами).

    Первыми стандартными форматами де-факто были форматы, адаптированные для САПР: объект определяется с помощью фасетов или аналитических поверхностей. Достаточно определить его происхождение, а затем характерные координаты элементов в трехмерном пространстве. Например, в формате Autocad DXF объект представляет собой серию именованных объектов, состоящую из списка точек X, Y, Z. Путем индексации на основе этих точек формируются фасеты треугольников или линии.

    Если этого формата было достаточно для технического рисования, он совершенно не подходил для виртуальной реальности. В 1990-х компания Silicon Graphics (производитель рабочих станций для 3D-графики) опубликовала формат Inventor , который включал большинство необходимых элементов. Этот формат превратился в формат VRML , который был стандартизирован.

    Кроме того, был опубликован формат 3D Studio ASCII , но бурный рост рынка 3D породил ряд проприетарных форматов. Для пользователя проблема заключалась в частом преобразовании модели из одного формата в другой без потери слишком большого количества информации. Некоторые компании даже специализируются на таком преобразовании.

    В настоящее время в профессиональном мире нет единого формата, а есть более или менее используемые форматы в зависимости от типа приложения. Например :

    • Формат Blender для создания мультимедиа;
    • Формат Pro / Engineer для промышленных САПР;
    • Формат OpenFlight для моделирования полета и / или вождения.

    Однако большинство разработчиков 3D-моделей более или менее умеют читать (импортировать) и создавать (экспортировать) несколько форматов: это важный критерий выбора. Среди наиболее распространенных форматов можно выделить:

    • СМЕСЬ из Blender ;
    • 3DS ;
    • DXF в AutoCAD ;
    • Стандартизован IGES ;
    • X Direct 3D ;
    • OBJ от Wavefront;
    • LWO от LightWave 3D ;
    • VRML с его версиями (1, 2 и X3D );
    • .COB из TrueSpace(ru) .

    Текущая тенденция состоит в том, чтобы отдать предпочтение описательному формату типа XML . Формат 3D- данных тогда называется описательным языком, таким как X3D (эволюция VRML с форматированием XML).

    Бесплатный формат COLLADA также позволяет обмениваться данными между различными программами. В частности, у Blender есть импортер / экспортер .

    Звуковые форматы

    Звуковые форматы разбиты на три части:

    • сырые форматы: звук не сжимается, значения, полученные в результате преобразования аналоговых значений в цифровые ( дискретизация ), записываются в хронологическом порядке и по каналам;
    • сжатые форматы: звук сжимается с потерями или без них в соответствии с алгоритмом, адаптированным к восприятию звуков человеческим ухом, и / или обычным сжатием;
    • потоковые форматы ( потоковая передача ): позволяет прослушивать частично, а не весь файл.

    Сжатие данных

    Сжатие данных - это метод преобразования данных таким образом, чтобы они занимали меньше места. Поскольку данные должны быть распакованы перед обработкой, это происходит за счет скорости и с большим риском потери данных .

    Основная идея заключается в том, что в целом элементы повторяются в файлах. Поэтому предпочтительно представлять элементы, которые часто повторяются, меньшими числами (то есть с меньшим количеством битов).

    Можно выделить два типа сжатия:

    Классические форматы

    Форматы данных и конфиденциальность

    Когда файл передается другим людям, некоторые форматы файлов могут представлять ИТ- риск для конфиденциальности создателя файла . Действительно, некоторые включают в свой формат данных личную информацию, такую ​​как имя компьютера и имя пользователя.

    Чаще всего это происходит при использовании офисного ПО . В случае с этим программным обеспечением сохраняется не только имя человека, создавшего файл, но и имя человека, который впоследствии его изменил.

    Реже HTML- файлы иногда также содержат личную информацию, в частности, когда они экспортируются из офисного программного обеспечения (например, Microsoft Word). Однако в этом легко убедиться, просмотрев HTML-код.

    Microsoft предлагает информацию для удаления личных данных, скрытых в файлах:

    Systems • Education

    При обмене данными с людьми возможности отображения информации ограничиваются только человеческой фантазией. Вспомните пиццерию из предыдущей главы — как она может оформить своё меню? Например, как текстовый список или маркированный список, может быть серией фотографий с подписями или только набором фотографий, на которые показывают посетители, чтобы оформить заказ.

    Тот же принцип применяется при обмене данными между компьютерами. Один компьютер должен поместить данные в формат, понятный для другого. Обычно это какой-то текстовый формат.

    Наиболее распространёнными форматами, встречающимися в современных API, являются JSON (JavaScript Object Notation, нотация объектов JavaScript) и XML (Extensible Markup Language, расширяемый язык разметки) .

    Посмотрим, как этот заказ пиццы может выглядеть в JSON:

    В приведенном выше примере JSON ключевыми словами являются слова слева: начинка, корочка и статус. Они говорят нам, какие атрибуты содержит заказ пиццы. Значения указаны в частях справа. Это фактические детали заказа.

    Рисунок 1. Ключ и значение JSON

    Иногда вы хотите использовать объект в качестве значения для ключа. Давайте расширим наш заказ пиццы подробностями о клиенте, чтобы вы могли увидеть, как это может выглядеть:

    XML существует с 1996 года. С возрастом он стал очень зрелым и мощным форматом данных. Как и JSON, XML предоставляет несколько простых строительных блоков, которые создатели API используют для структурирования своих данных. Основной блок называется
    узлом (node).

    Давайте посмотрим, как может выглядеть наш заказ пиццы в XML:


    Рисунок 2. Узел и значение в XML

    С помощью этих двух заголовков, Content-Type и Accept, клиент и сервер могут работать с форматами данных, которые они понимают и должны работать должным образом.


    Рисунок 3. Заголовки форматов данных

    Читайте также: