При каком подходе измерения информации сообщение рассматривают как последовательность знаков

Обновлено: 04.07.2024

Перечень вопросов, рассматриваемых в теме: Информация как снятая неопределенность. Содержательный подход к измерению информации.

Информация как последовательность символов некоторого алфавита. Алфавитный подход к измерению информации. Единицы измерения информации. Понятие больших данных

Глоссарий по теме: Информатика, информация, свойства информации (объективность, достоверность, полнота, актуальность, понятность, релевантность), виды информации, информационные процессы, информационная культура, информационная грамотность.

Основная литература по теме урока:

Л. Л. Босова, А. Ю. Босова. Информатика. Базовый уровень: учебник для 10 класса — М.: БИНОМ. Лаборатория знаний, 2017

Дополнительная литература по теме урока:

И. Г. Семакин, Т. Ю. Шеина, Л. В. Шестакова. Информатика и ИКТ. Профильный уровень: учебник для 10 класса — М.: БИНОМ. Лаборатория знаний, 2012

Теоретический материал для самостоятельного изучения:

Давайте составим план, что бы мы хотели сделать с имеющейся у нас информацией.

Передавать — скорее всего, а может быть даже и продавать.

Обрабатывать и получать новую — вполне возможно!

Во всех трех случаях, которые называют основными информационными процессами, нам нужно информацию измерять.

В случае хранения, чтобы быть уверенными, что объем хранилища и объем нашей информации соответствуют друг другу, в передаче или продаже — чтобы объем продажи соответствовал цене, в случае обработки, чтобы рассчитать время, за которое этот объем может быть обработан.

Во всех трех случаях мы говорим о соответствиях объемов, но если нам известно как вычислить объем хранилища в м 3 , количество денег в рублях или иной валюте, время, то с вычислением объема информации нужно разбираться

Целью нашего урока будет определить способы измерения информации и сравнить их.

Для этого нужно будет определить:

— от чего зависит объем информации,

— какими единицами ее измерять.

Ожидаемые результаты

Выявлять различия в подходах к измерению информации.

Применять различные подходы для измерения количества информации.

Переходить от одних единиц измерения информации к другим.

Предположим, что объем информации зависит от ее содержания. Нам нужна информация, которая для нас нова и понятна, соответствует всем свойствам информации, то есть та, которая приносит нам новые знания, решает наши вопросы.

Этот подход к измерению предложил К. Шеннон.

Разумно так же предположить, что текст, который для вас не понятен, понятен кому-то другому, то есть информация в нем все-таки есть. А ее объем зависит не от содержания текста, а от символов, которыми он написан. Назовем алфавитом все множество символов, используемых в языке, а их количество — мощностью алфавита.

Каждый символ, выбранный из алфавита, несет количество информации (i), вычисленное по формуле,

где N мощность алфавита.

Общее количество информации (I) во всем тексте можно посчитать по простой математической модели:


где k — количество символов в тексте.

Такой подход к измерению информации называют алфавитным. Здесь объем информации зависит от используемого алфавита и количества символов в тексте.

Этот подход к измерению информации предложил советский ученый-математик А. Н. Колмогоров.

Бит — мельчайшая единица информации. Для кодировки каждого из 256 символов, сведенных в таблицу кодировки ASCII, требуется 8 бит. Эта величина получила отдельное название — байт. Помимо бита и байта существуют более крупные единицы. Традиционно они получили приставки Кило, Мега, Гига и т. д.


Переводить единицы измерения информации можно при помощи удобной схемы

Подведем итоги

Информацию можно измерять. Для этого существуют разные подходы, содержательный подход, алфавитный подход.

Суть содержательного подхода в том, что при определении объема информации учитывается содержание информации. Она должна быть новой и понятной получателю.

Суть алфавитного подхода в определении количества информации в зависимости от алфавита, которым она записана. А объем подсчитывается по формуле


где — объем информации,

— количество информации о каждом символе.

Для измерения количества информации в объеме данных используются единицы измерения информации.

Обработка данных важна для всех сфер жизни. Технологии обработки данных стремительно развиваются и становятся жизненно-важными.




С помощью этого теста вы сможите проверить свои зания по теме "Измерение информации"

Информатика 10 класс | Автор: Ведерникова Ирина | ID: 6978 | Дата: 15.1.2016

Измерение информации: содержательный и алфавитный подходы. Единицы измерения информации.

Алфавитный подход к измерению информации.

1 бит - это минимальная единица измерения информации!

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В любой системе единиц измерения существуют основные единицы и производные от них.

Для измерения больших объемов информации используются следующие производные от байта единицы:

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

1.5. Алфавитный подход к измерению информации

С позиций computer science носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера.

Алфавит - все множество используемых в языке символов. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.

Мощность алфавита - полное количество символов алфавита.

Мощность русского алфавита - 33 знака, английского - 28, двоичного кода - 2 , компьютерного текста - 256.

Будем использовать следующие обозначения:

N — мощность алфавита, К — количество символов в тексте,

i — количество информации, которое несет каждый символ алфавита,

I t — объем информации, содержащейся в тексте.

1.5. 1. Алфавитный подход к измерению количества информации

Алфавитный подход позволяет определить количество информации, заключенной в тексте.

Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле: i = Log 2 N , или 2 i = N .

1. Определить количество информации (i) которое несет каждый символ алфавита по формуле 2 i = N, где N — мощность алфавита.

3. Вычислить объем информации по формуле: It = i * K .

Задача 1.

Дано:

Найти:

Решение .

1. N = 2 i , 16=2 i ;

2. i = 4 бита;

3. It = K · i, It=200 · 4=800 бит = 100 байт .

Ответ : 100 байт.

Задача 2.

Дано :

Найти:

Решение.

1. К = 3·25·60 = 4500 символов в тексте;

2. It = K · i, i = It / K ;

3. i = 2250 · 8 / 4500 = 4 бита;

4. N = 2 i ; N = 2 4 ; N = 16 символов.

Ответ : 16 символов.

Вопросы :

  1. Какие существуют два подхода к измерению информации?
  2. Что такое алфавит, мощность алфавита?
  3. Что такое информационный вес символа в алфавите?

Задания для самостоятельного выполнения:

Задача 3.

Можно ли уместить на одну дискету книгу, имеющую 432 страницы, причем на каждой странице этой книги 46 строк, а в каждой строке 62 символа?

Примечание: на дискету помещается 1,44 Мб.

Задача 4.

Книга, набранная с помощью компьютера, содержит 150 страниц, на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге?

Задача 5.

Задача 6.

Задача 7.

Информационный объем текста, подготовленного с помощью компьютера, равен 3.5 Кбайт. Сколько символов содержит этот текст?

Задача 8.

Домашнее задание:

Задача 9.

Задача 10.

Задача 11.

Задача 12.

При всем многообразии подходов к определению понятия информации, с позиций измерения информации нас интересуют два из них: определение К. Шеннона, применяемое в математической теории информации, и определение А. Н. Колмогорова, применяемое в отраслях информатики, связанных с использованием компьютеров.

По Шеннону, информация — уменьшение неопределенности наших знаний.

Неопределенность некоторого события — это количество возможных исходов данного события.

Так, например, если из колоды карт наугад выбирают карту, то неопределенность равна количеству карт в колоде. При бросании монеты неопределенность равна 2.

Содержательный подход часто называют субъективным, так как разные люди (субъекты) информацию об одном и том же предмете оценивают по-разному.

Но если число исходов не зависит от суждений людей (случай бросания кубика или монеты), то информация о наступлении одного из возможных исходов является объективной.

Если N равно целой степени двойки (2, 4, 8, 16 и т.д.), то вычисления легко произвести "в уме". В противном случае количество информации становится нецелой величиной, и для решения задачи придется воспользоваться таблицей логарифмов либо определять значение логарифма приблизительно (ближайшее целое число, большее).

Вычислить объем информации по формуле: I = К* i .

Единицы измерения информации

Решая различные задачи, человек вынужден использовать информацию об окружающем нас мире. И чем более полно и подробно человеком изучены те или иные явления, тем подчас проще найти ответ на поставленный вопрос. Так, например, знание законов физики позволяет создавать сложные приборы, а для того, чтобы перевести текст на иностранный язык, нужно знать грамматические правила и помнить много слов

Однако иногда возникает ситуация, когда людям сообщают много новых для них сведений (например, на лекции), а информации при этом они практически не получают (в этом нетрудно убедиться во время опроса или контрольной работы). Происходит это оттого, что сама тема в данный момент слушателям не представляется интересной

Если подбросить монету и проследить, какой стороной она упадет, то мы получим определенную информацию. Обе стороны монеты "равноправны", поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит. Единица измерения информации называется бит (bit) - что означает двоичная цифра.

В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено - не намагничено, есть отверстие - нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое - цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием

В информатике часто используется величина, называемая байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (2 8 ). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт.

Наряду с байтами для измерения количества информации используются более крупные единицы

1 Кбайт (один килобайт) = 2 10 байт = 1024 байта;

1 Мбайт (один мегабайт) = 2 10 Кбайт = 1024 Кбайта;

1 Гбайт (один гигабайт) = 2 10 Мбайт = 1024 Мбайта.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как

1 Терабайт (Тб) = 1024 Гбайта = 2 40 байта

1 Петабайт (Пб) = 1024 Тбайта = 2 50 байта.

Здесь мы рассмотрим только один, который называется алфавитным подходом

Решение задач на измерение информации

Для решения задач нам понадобится формула, связывающая между собой информационный вес каждого символа, выраженный в битах ( i ), и мощность алфавита (N): N = 2 i ; информационный объем ( I ), количество информации ( К ): I = К* i

Задача 1: Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

32 = 2 i => 2 5 = 2 i => i = 5

Ответ: одна буква несет 5 бит информации.

16 = 2 i => 2 4 = 2 i => i = 4

Ответ: мощность алфавита N = 8.

Следующие задачи для самостоятельного решения.

Задача 6: В книге 100 страниц. На каждой странице 60 строк по 80 символов в строке. Вычислить информационный объем книги.

№4. Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?

№5. Пользователь вводит текст с клавиатуры со скоростью 90 знаков в минуту. Какое количество информации будет содержать текст, который он набирал 15 мин.

№5. Пользователь вводит текст с клавиатуры 10 минут. Какова скорость ввода информации, если информационный объем полученного текста равен 1 Кбайт?

№5. Ученик читает текст со скоростью 250 символов в минуту. При записи текста использовался алфавит, содержащий 64 символа. Какой объем информации получит ученик, если будет непрерывно читать 20 минут?

Тест. Измерение информации.

Выберите один правильный ответ.

  1. За единицу измерения информации в теории кодирования принимается:

1) 1 кг; 2) 1 фут; 3) 1 бар 4) 1 бит; 5) 1 бод.

  1. 1. Алфавит племени Мульти состоит из 64 букв. Какое количество информации несёт одна буква этого алфавита?

1) 8 бит; 2) 8 байт; 3) 6 бит 4) 6 байт; 5) 1 байт.

1) 100; 2) 256; 3) 800; 4) 8; 5) 1.

1) 8; 2) 1; 3) 1; 4) 1000; 5) 1024.

5. Чему равен 1 мегабайт в секунду (1МБ/с)?

1) 1000 килобит в секунду

2) 1000 килобайт в секунду

3) 1024 килобит в секунду

4) 1024 килобайт в секунду

Фамилия, имя___________________________ класс____ Дата__________

Контрольная работа 1 Вариант

1. Сравните (поставьте знак отношения)

1) 200 байт 0,25 Кбайт.

2) 3 байта 24 бита.

3) 1536 бит 1,5 Кбайта.

4) 1000 бит 1 Кбайт.

5) 8192 байта 1 Кбайт.

2. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения:

5. Наличием новых знаний и понятностью

  1. 2 х 8 = 16
  2. 6 MULTIPLAY 8 EQUAL 48
  3. Ваня учится в школе
  4. В английском алфавите 26 букв
  5. MY FREND IS SCHOOLBOY

8. Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128 страниц текста, содержащего в среднем 256 символов на каждой странице?

9. Мощность алфавита равна 256. Сколько Кбайт памяти потребуется, для сохранения 160 страниц текста, содержащего в среднем 192 символов на каждой странице?

Фамилия, имя___________________________ класс____ Дата__________

1. Сравните (поставьте знак отношения)

1) 512 байт 1 Кбайт;

2) 1 Кбайт 1000 байт;

3) 800 байт 1 Кбайт

4) 400 бит 50 байт.

5) 8192 байта 1 Кбайт.

3. Перевод текста с английского на китайский является процессом:

  1. Обработки информации
  2. Хранения информации
  3. Передачи информации
  4. Поиска информации
  5. Не является ни одним из перечисленных процессов

6. Алфавит племени Мульти состоит из 32 букв. Какое количество информации несёт одна буква этого алфавита?

7. Мощность алфавита равна 256. Сколько Кбайт памяти потребуется, для сохранения 160 страниц текста, содержащего в среднем 192 символов на каждой странице?

9. Для записи текста использовался 256 символьный алфавит. Каждая страница содержит 30 строк по 70 символов. Какой объём содержит 5 страниц текста?

Читайте также: