Операции с данными реферат

Обновлено: 30.06.2024

3. Данные

4. Операции с данными

5. Кодирование данных

• Для автоматизации работы с данными,
относящимися к различным типам, очень важно
унифицировать их форму представления — для
этого обычно используется прием кодирования, то
есть выражение данных одного типа через данные
другого типа. Естественные человеческие языки —
это не что иное, как системы кодирования понятий
для выражения мыслей посредством речи. К
языкам близко примыкают азбуки (системы
кодирования компонентов языка с помощью
графических символов).

6. Примеры кодирования данных

7. Кодирование данных

Своя система существует и в
вычислительной технике — она называется
двоичным кодированием и основана на
представлении данных
последовательностью всего двух знаков:
0 и 1.
Эти знаки называются двоичными цифрами,
по-английски — binary digit или сокращенно
bit (бит).

Русский
Английский (Международный стандарт)
Полное
наименование
Сокращенное
наименование
Полное
наименование
Сокращенное
наименование
бит
бит
bit
bit
байт
Б
byte
B
килобит
Кбит
kilobit
Kbit
килобайт
КБ
kilobyte
KB
мегабит
Мбит
megabit
Mbit
мегабайт
МБ
megabyte
MB
гигабит
Гбит
gigabit
Gbit
гигабайт
ГБ
gigabyte
GB

9. Кодирование данных

Одним битом могут быть выражены два понятия: 0 или 1 (да
или нет, черное или белое, истина или ложь и т. п.). Если
количество битов увеличить до двух, то уже можно выразить
четыре различных понятия: 00 01 10 11
Тремя битами можно закодировать восемь различных
значений: 000 001 010 011 100 101 110 111
Увеличивая на единицу количество разрядов в системе
двоичного кодирования, мы увеличиваем в два раза количество
значений, которое может быть выражено в данной системе, то
есть общая формула имеет вид:
N=2m,
• где N— количество независимых кодируемых значений;
• т — разрядность двоичного кодирования, принятая в данной
системе.

10. Кодирование целых чисел

• Целые числа кодируются двоичным кодом
достаточно просто — достаточно взять целое число
и делить его пополам до тех пор, пока частное не
будет равно единице. Совокупность остатков от
каждого деления, записанная справа налево вместе
с последним частным, и образует двоичный аналог
десятичного числа.
• 19:2 = 9+1
• 9:2 = 4 + 1
• 4:2=2+0
• 2:2=1+0
• Таким образом, 1910 = 100112.

11. Кодирование целых чисел

• Для кодирования целых чисел от 0 до 255 достаточно
иметь 8 разрядов двоичного кода (8 бит). Шестнадцать бит
позволяют закодировать целые числа от 0 до 65 535, а 24
бита — уже более 16,5 миллионов разных значений.
• Для кодирования действительных чисел используют 80разрядное кодирование. При этом число предварительно
преобразуется в нормализованную форму:
• 3,1415926 = 0,31415926 101
• 300 000 = 0,3 106
• 123 456 789 = 0,123456789 1010
• Первая часть числа называется мантиссой, а вторая —
характеристикой.

12. Кодирование текстовых данных

13. Кодирование текстовых данных

КОДИРОВАНИЕ ТЕКСТОВЫХ ДАННЫХ
• Первые 32 кода базовой таблицы, начиная с
нулевого, отданы производителям аппаратных
средств (в первую очередь производителям
компьютеров и печатающих устройств). В этой
области размещаются так называемые
управляющие коды, которым не соответствуют
никакие символы языков, и, соответственно, эти
коды не выводятся ни на экран, ни на устройства
печати, но ими можно управлять тем, как
производится вывод прочих данных.
• Начиная с кода 32 по код 127 размещены коды
символов английского алфавита, знаков
препинания, цифр, арифметических действий и
некоторых вспомогательных символов.

14. Кодирование текстовых данных

15. Кодирование текстовых данных

16. Кодирование текстовых данных

17. Кодирование текстовых данных

КОДИРОВАНИЕ ТЕКСТОВЫХ ДАННЫХ
• Другая распространенная кодировка носит
название КОИ-8 (код обмена информацией,
восьмизначный) — ее происхождение
относится ко временам действия Совета
Экономической Взаимопомощи государств
Восточной Европы (таблица 1.3). Сегодня
кодировка КОИ-8 имеет широкое
распространение в компьютерных сетях на
территории России и в российском секторе
Интернета.

18. Кодирование графических данных

КОДИРОВАНИЕ ГРАФИЧЕСКИХ ДАННЫХ
Растр — это метод кодирования графической информации,
издавна принятый в полиграфии

19. Кодирование графических данных

КОДИРОВАНИЕ ГРАФИЧЕСКИХ ДАННЫХ
• Для кодирования цветных графических
изображений применяется принцип
декомпозиции произвольного цвета на основные
составляющие. В качестве таких составляющих
используют три основные цвета: красный (Red, К),
зеленый (Green, G) и синий (Blue, В). На практике
считается (хотя теоретически это не совсем так),
что любой цвет, видимый человеческим глазом,
можно получить путем механического смешения
этих трех основных цветов. Такая система
кодирования называется системой RGB по
первым буквам названий основных цветов.

20. Кодирование графических данных

КОДИРОВАНИЕ ГРАФИЧЕСКИХ ДАННЫХ
• Если для кодирования яркости каждой из
основных составляющих использовать по 256
значений (восемь двоичных разрядов), как это
принято для полутоновых черно-белых
изображений, то на кодирование цвета одной
точки надо затратить 24 разряда. При этом
система кодирования обеспечивает однозначное
определение 16,5 млн различных цветов, что на
самом деле близко к чувствительности
человеческого глаза. Режим представления
цветной графики с использованием 24 двоичных
разрядов называется полноцветным (True Color).

21. Кодирование звуковой информации

КОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
Приемы и методы работы со звуковой
информацией пришли в вычислительную технику
наиболее поздно. К тому же, в отличие от
числовых, текстовых и графических данных, у
звукозаписей не было столь же длительной и
проверенной истории кодирования. В итоге
методы кодирования звуковой информации
двоичным кодом далеки от стандартизации.
Множество отдельных компаний разработали
свои корпоративные стандарты, но если говорить
обобщенно, то можно выделить два основных
направления.

22. Кодирование звуковой информации

КОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
Приемы и методы работы со звуковой
информацией пришли в вычислительную технику
наиболее поздно. К тому же, в отличие от
числовых, текстовых и графических данных, у
звукозаписей не было столь же длительной и
проверенной истории кодирования. В итоге
методы кодирования звуковой информации
двоичным кодом далеки от стандартизации.
Множество отдельных компаний разработали
свои корпоративные стандарты, но если говорить
обобщенно, то можно выделить два основных
направления.

23. Кодирование звуковой информации

КОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
• Метод FM (Frequency Modulation) основан на
том, что теоретически любой сложный звук
можно разложить на последовательность
простейших гармонических сигналов разных
частот, каждый из которых представляет собой
правильную синусоиду, а следовательно,
может быть описан числовыми параметрами,
то есть кодом. В природе звуковые сигналы
имеют непрерывный спектр, то есть являются
аналоговыми.

24. Кодирование звуковой информации

КОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ
Их разложение в гармонические ряды и
представление в виде дискретных цифровых сигналов
выполняют специальные устройства — аналоговоцифровые преобразователи (АЦП). Обратное
преобразование для воспроизведения звука,
закодированного числовым кодом, выполняют
цифро-аналоговые преобразователи (ДАЛ). При
таких преобразованиях неизбежны потери
информации, связанные с методом кодирования,
поэтому качество звукозаписи обычно получается не
вполне удовлетворительным и соответствует качеству
звучания простейших электромузыкальных
инструментов с окрасом, характерным для
электронной музыки.

25. Кодирование графических данных

26. Кодирование звуковой информации

27. Основные структуры данных

ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ
Работа с большими наборами данных
автоматизируется проще, когда
данные упорядочены, то есть образуют
заданную структуру. Существует три
основных типа структур данных:
линейная, иерархическая и
табличная.
Рассмотрим на примере обычной книги.

28. Основные структуры данных. Линейная


ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ.
ЛИНЕЙНАЯ
Если разобрать книгу на отдельные листы и перемешать
их, книга потеряет свое назначение. Она по-прежнему
будет представлять набор данных, но подобрать
адекватный метод для получения из нее информации
весьма непросто. (Еще хуже дело будет обстоять, если из
книги вырезать каждую букву отдельно — в этом случае
вряд ли вообще найдется адекватный метод для ее
прочтения.)
• Если же собрать все листы книги в правильной
последовательности, мы получим простейшую структуру
данных — линейную. Такую книгу уже можно читать, хотя
для поиска нужных данных ее придется прочитать подряд,
начиная с самого начала, что не всегда удобно.

29. Основные структуры данных. Линейная

30. Основные структуры данных. Линейная

ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ.
ЛИНЕЙНАЯ
• Таким образом, линейные
структуры данных (списки) — это
упорядоченные структуры, в
которых адрес элемента
однозначно определяется его
номером.

31. Основные структуры данных. Иерархическая.

ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ.
ИЕРАРХИЧЕСКАЯ.
Для быстрого поиска данных
существует иерархическая структура.
Так, например, книги разбивают на
части, разделы, главы, параграфы и т.
п. Элементы структуры более низкого
уровня входят в элементы структуры
более высокого уровня: разделы
состоят из глав, главы из параграфов и
т. д.

32. Основные структуры данных. Иерархическая.

33. Основные структуры данных. Табличная.

ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ.
ТАБЛИЧНАЯ.
На практике задачу упрощают тем, что в
большинстве книг есть вспомогательная
перекрестная таблица, связывающая элементы
иерархической структуры с элементами линейной
структуры, то есть связывающая разделы, главы и
параграфы с номерами страниц. В книгах с
простой иерархической структурой, рассчитанных
на последовательное чтение, эту таблицу принято
называть оглавлением, а в книгах со сложной
структурой, допускающей выборочное чтение, ее
называют содержанием.

34. Основные структуры данных. Табличная.

ОСНОВНЫЕ СТРУКТУРЫ ДАННЫХ.
ТАБЛИЧНАЯ.
Планета
Расстояние Относитель Количество
до Солнца, ная масса спутников
а.е.
Меркурий
0,39
0,056
0
Венера
Земля
Марс
Юпитер
0,67
1,0
1,51
5,2
0,88
1,0
0,1
318
0
1
2
16

35. Основные структуры данных. Табличная.

36. Единицы измерения данных

ЕДИНИЦЫ ИЗМЕРЕНИЯ ДАННЫХ
• В информатике для измерения данных
используют тот факт, что разные типы
данных имеют универсальное двоичное
представление, и потому вводят свои
единицы данных, основанные на нем.
• Наименьшей единицей измерения является
байт.

37. Единицы измерения данных

ЕДИНИЦЫ ИЗМЕРЕНИЯ ДАННЫХ
• Более крупная единица измерения —
килобайт (Кбайт).
• 1 Кбайт равен 210 байт (1024 байт)
Более крупные единицы измерения данных
образуются добавлением префиксов мега-,
гига-, тера• 1 Мбайт = 1024 Кбайт = 220 байт
• 1 Гбайт = 1024 Мбайт = 230 байт
• 1 Тбайт = 1024 Гбайт = 240 байт

38. Единицы хранения данных

ЕДИНИЦЫ ХРАНЕНИЯ ДАННЫХ
• В качестве единицы хранения данных
принят объект переменной длины,
называемый файлом. Файл — это
последовательность произвольного числа
байтов, обладающая уникальным
собственным именем. Обычно в
отдельном файле хранят данные,
относящиеся к одному типу. В этом случае
тип данных определяет тип файла.

39. Понятие о файловой структуре

Читайте также: