Алфавитный подход к определению количества информации 10 класс конспект урока

Обновлено: 06.07.2024

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

Тема урока: "Измерение информации: алфавитный подход. Единицы измерения информации."

1. Дать представление об объеме информации и его методах измерения.

Задачи урока для учителя:

2. Ввести понятия:

* информационный вес символа.

3. Ввести формулы:

* связывающую мощность алфавита и информационный вес символа,

* вычисления информационного объема текста.

4. Ввести основные единицы измерения информации.

Задачи урока для учащихся:

1) Составить конспект в тетради, используя рассказ учителя и компьютерную презентацию.

2) Произвести первичное закрепление навыков решения задач на вычисление количества информации: совместное решение задач, предложенных электронном задачнике (тренировка).

3) Образовательный продукт: условие задачи на вычисление объема информации и решение, созданные самим учеником.

1. Организация урока - 2 мин.

Учитель приветствует учащихся, проверяет подготовленность рабочего места к уроку и организует внимание учащихся.

Учитель сообщает тему занятия, цели, задачи.

3. Подготовка к основному этапу занятия – 4 мин.

Вопрос к учащимся: Что такое информация?

Информация - это сведения, знания об окружающем нас мире.

Вам хорошо известно, что можно измерять:

Для них существуют свои эталонные единицы:

Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемую величину, таков и результат измерения. Следовательно, и для измерения информации тоже должна быть своя эталонная единица.

4. Усвоение новых знаний.

Существует множество подходов к измерению информации. Мы рассмотрим только один - алфавитный подход.

Алфавитный подход позволяет измерять информацию, заключенную в тексте на некотором языке (естественном или формальном).

Вопрос к учащимся: Что такое алфавит?

Алфавит– это вся совокупность символов, используемых в некотором языке для представления информации.

Каждый алфавит обладает особой характеристикой – мощностью.

Мощность алфавита (N) – это полное число символов в алфавите.

ПРИМЕР: мощность алфавита русского языка = 33 буквам.

Информационный вес символа зависит от мощности алфавита!

Информационный вес символа двоичного алфавита принят за эталонную единицу информации и называется 1 бит.

ПРИМЕР: чтобы посчитать количество информации в следующем двоичном тексте 110011111100101000101011, нужно пересчитать все 0 и 1.

В тексте содержится 24 бита информации.

Как уже было сказано, информационный вес символа зависит от мощности алфавита. А именно с увеличением мощности алфавита увеличивается информационный вес символа.

N=4 i = 2 бита, т.е. для кодирование 1 символа используется 2 цифры:

N = 8 i = 3 битам

N = 16 i = 4 бита

Таким образом, можно выявить зависимость.

Вопрос к учащимся: Какую зависимость можно выявить?

В общем виде это можно записать N=2 i

Мы будем рассматривать ситуацию, когда N равен целой степени двойки.

Существует также формула для измерения информации в конкретном тексте

I – информационный объем текста,

К – количество символов в тексте,

i – информационный вес символа.

Ограничений на максимальный размер алфавита нет. Но есть алфавит, который считается достаточным. В алфавит такого размера помещаются все знаки, расположенные на нашей клавиатуре.

Мощность такого алфавита

Следовательно, вес одного символа этого алфавита i = 8 бит.

8 бит – это характерная величина, ей присвоено свое название 1 байт.

Сегодня многие тексты создаются при помощи компьютера.

Мощность алфавита, используемых для создания таких текстов равна 256 символам, следовательно, вес одного символа i равен 1 байту.

Для измерения информации больших объемов используются следующие единицы измерения.

1 килобайт = 1 Кб = 2 10 байт = 1024 байта

1 мегабайт = 1 Мб = 2 10 Кб = 1024 Кб

1 гигабайт = 1 Гб = 2 10 Мб = 1024 Мб

Вопрос к учащимся: Где можно встретить такое обозначение?

Чаще всего единицы измерения информации встречаются при обозначении ёмкости внешних носителей:

* Дискета – 1,4 Мбайт

* Флэш-память – 1 Гбайт

* Жесткий диск – 200 Гбайт

5. Усвоение новых способов действий

А теперь попробуем применить полученные теоретические знания на практике, при решении задач (электронный задачник).

N = 32, К = 80 символов.

1). Для решения задачи необходимы формулы: I = К*i, N = 2i

3). I = K* i, I = 80* 5 бит = 400 бит.

1 Мб = 1024 Кб, следовательно,

I = 1,5 *1024 = 1536 Кб.

Дано: I = 3,5 Кб, К = 7168 символов.

Решение: Для решения необходимы следующие формулы: N = 2i, I = К*i.

1). Для того чтобы найти мощность алфавита, необходимо знать информационный вес символа - i. Воспользуемся формулой I = К*i,

Для решения задачи необходимо в информационном объеме I осуществить перевод единиц измерения: Кб в биты.

1 Кб = 1024 байт

1 байт = 8 бит, следовательно,

I = 3,5 Кб = 3,5*1024*8 = 28672 бит,

i=28672 бит/ 7168 = 4 бит.

Решение: Для решения необходимы следующие формулы: I = К*i, N = 2i.

Воспользуемся формулой N = 2i,

16 =2i, следовательно,

5. Первичный контроль полученных знаний.

Самостоятельная работа (5 мин): самостоятельное создание условия задачи на вычисление объема информации и предоставление решения.

5.Подведение итогов урока, запись домашнего задания

доска, компьютер, мультимедийный проектор, компьютерная презентация – Приложение 1, карточки с заданиями – Приложение 2, справочный материал – Приложение 3.

I. Организацонный. момент.

Приветствие, проверка присутствующих. Объяснение хода урока.

    Что такое информация?
  1. Как может быть представлена информация? Приведите примеры.
  2. Зависит ли смысл, содержание информации от способа представления?
  3. Какие формы представления информации вы знаете?
  4. Какие свойства информации вы знаете?
  5. Представьте информацию о погоде в различной форме.

Мы с вами говорили, что основным понятием в информатике является “информация”. А можно ли измерить количество информации и как это сделать? (Полного и правильного ответа на этот вопрос учащиеся вряд ли дадут.)

Как и любую величину, информацию можно измерять и находить ее количество.

III. Теоретическая часть.

  • алфавитный (т.е. количество информации зависит от последовательности знаков);
  • содержательный или вероятностный (т.е. количество информации зависит от ее содержания).

Однако при хранении и передаче информации с помощью технических устройств целесообразно отвлечься от содержания информации и рассматривать ее как последовательность знаков (букв, цифр, кодов цветов точек изображения и так далее).

Множество используемых в тексте символов называется алфавитом.

У алфавита есть размер (полное количество его символов), который называется мощностью алфавита.

Так, в русском алфавите, если не использовать букву ё, количество событий (букв) будет равно 32. Тогда: 32=2I, откуда I = 5 битов.

2) Рассмотрим второй подход к измерению информации. Существует множество ситуаций, когда возможные события имеют различные вероятности реализации.

Американский инженер и математик Клод Элвуд Шеннон в 1948 г. предложил формулу для вычисления количества информации в случае различных вероятностей событий:

где I – количество информации;

N – количество возможных событий;

pi – вероятность i-го события. Вероятность события выражается в долях единицы и вычисляется по формуле: (3)

где k – количество конкретных событий, т.е. величина, показывающая, сколько раз произошло интересующее нас событие.

пусть при бросании несимметричной 4-х гранной пирамидки вероятности отдельных событий будут равны:


Этот подход к определению количества информации называется вероятностным.


Если , следовательно исходы равновероятны, то вероятность каждого исхода – это число , то


Формула (4) – формула Хартли (американский инженер – связист) – предложена в 1928 г.

Например. Определим количество информации, которое мы получим при бросании симметричной и однородной 4-х гранной пирамидки:

Таким образом, при бросании симметричной пирамидки, когда события равновероятны, получим большее количество информации (2 бита), чем при бросании несимметричной (1,75 бита), когда события неравновероятны.

Как измерить количество информации?

Ясно, что ликвидировать неопределенность – это и значит получить информацию. Следовательно, формула (2) показывает, какое количество информации можно получить для любой конкретной системы.

Или: формула (2) показывает, каким количеством информации нужно располагать, чтобы полностью снять неопределенность.

Итак, если информация понимается как отражение разнообразия, то мерой для ее количества выступает мера неопределенности, которой обладает рассматриваемая в этот момент ситуация. Описывая неопределенность на языке вероятностей, мы приходим к формуле Шеннона.

Вероятностный подход к измерению информации для конкретного события:


Количество информации, которое мы получаем, достигает максимального значения, если события равновероятны.

Если количество возможных вариантов информации не является целой степенью числа 2, т.е. если количество информации число вещественное, то необходимо воспользоваться калькулятором или следующей таблицей:


1) Обучающая: рассмотреть алфавитный подход к измерению количества информации, научиться вычислять количество информации с точки зрения алфавитного подхода.

2) Развивающая: развитие у учащихся самостоятельности и познавательной активности.

3) Воспитывающая: воспитывать дисциплинированность, аккуратность, собранность.

Литература:

Тип урока: ознакомление с новым материалом

План урока:

1. Организационный этап.

2. Актуализация знаний.

3. Подготовка учащихся к усвоению нового материала.

4. Этап получения новых знаний.

5. Этап обобщения и закрепления нового материала.

7. Заключительный этап.

Ход урока

1. Организационный этап.

Здравствуйте. Прежде чем мы приступим к уроку, хотелось бы, чтобы каждый из вас настроился на рабочий лад.

2. Актуализация знаний.

2) Какую минимальную единицу информации используют для измерения количества информации? (Бит)

3) Какую формулу используют для определения количества информации? (Формулу Хартли)

3. Этап получения новых знаний.

Содержательный подход к измерению информации рассматривает информацию с точки зрения человека, как уменьшение неопределенности наших знаний.

Однако любое техническое устройство не воспринимает содержание информации. Поэтому в вычислительной технике используется другой подход к определению количества информации. Он называется алфавитным подходом.

Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.

Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, пропуск между словами.

Алфавит — это множество символов, используемых при записи текста.

Мощность (размер) алфавита — это полное количество символов в алфавите.

Мощность алфавита обозначается буквой N.

· мощность алфавита из русских букв равна 33;

· мощность алфавита из латинских букв — 26;

· мощность алфавита текста набранного с клавиатуры равна 256 (строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания );

· мощность двоичного алфавита равна 2.

При алфавитном подходе считается, что каждый символ текста имеет информационную емкость. Информационная емкость знака зависит от мощности алфавита.

Тогда в формуле

N — количество знаков в алфавите знаковой системы, I — количество информации, которое несет каждый знак.

Например, из формулы можно определить количество информации, которое несет знак в двоичной знаковой системе

Информационная емкость знака двоичной знаковой системы составляет 1 бит.

Задача 1. Определите, какое количество информации несет буква русского алфавита (без буквы ё).

Буква русского алфавита несет 5 битов информации.

Давайте решим с вами задачу.

Что нам для этого дано?

4. Этап обобщения и закрепления нового материала.

2) Определить количество информации, содержащееся в слове из 10 символов, если известно, что мощность алфавита равна 32 символам. (50 бит)

Нажмите, чтобы узнать подробности

Решение: В одном байте 8 бит. 32:8=4
Ответ: 4 байта.

Решение: Поскольку 1Кбайт=1024 байт=1024*8 бит, то 12582912:(1024*8)=1536 Кбайт и
поскольку 1Мбайт=1024 Кбайт, то 1536:1024=1,5 Мбайт
Ответ:1536Кбайт и 1,5Мбайт.

Задача 3. Компьютер имеет оперативную память 512 Мб. Количество соответствующих этой величине бит больше:

1) 10 000 000 000бит 2) 8 000 000 000бит 3) 6 000 000 000бит 4) 4 000 000 000бит

Решение: 512*1024*1024*8 бит=4294967296 бит.
Ответ: 4.

Задача 4. Определить количество битов в двух мегабайтах, используя для чисел только степени 2.
Решение: Поскольку 1байт=8битам=2 3 битам, а 1Мбайт=2 10 Кбайт=2 20 байт=2 23 бит. Отсюда, 2Мбайт=2 24 бит.
Ответ: 2 24 бит.

Задача 6. Один символ алфавита "весит" 4 бита. Сколько символов в этом алфавите?
Решение:
Дано:

По формуле N=2 i находим N=2 4 , N=16

Задача 7. Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите?
Решение:
Дано:

По формуле N=2 i находим N=2 8 , N=256

Задача 8. Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?
Решение:
Дано:

По формуле N=2 i находим 32=2 i , 2 5 =2 i ,i=5

Задача 9. Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита?
Решение:
Дано:

По формуле N=2 i находим 32=2 i , 2 5 =2 i ,i=5

Задача 10. У племени "чичевоков" в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов? Учтите, что слова надо отделять друг от друга!
Решение:
Дано:

По формуле N=2 i находим 32=2 i , 2 5 =2 i ,i=5

Задача 11. Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в килобайтах и мегабайтах
Решение:
Дано:

Определим количество символов в книге 150*40*60=360000. Один символ занимает один байт. По формуле I=K*iнаходим I=360000байт 360000:1024=351Кбайт=0,4Мбайт


Ответ: 351Кбайт или 0,4Мбайт

Задача 12. Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.
Решение:
Дано:

I=128Кбайт,i=2байт

В кодировке Unicode один символ занимает 2 байта. Из формулыI=K*i выразим K=I/i,K=128*1024:2=65536

I=1,5Кбайт,K=3072

Из формулы I=K*i выразим i=I/K,i=1,5*1024*8:3072=4

N=64, K=20

По формуле N=2 i находим 64=2 i , 2 6 =2 i ,i=6. По формуле I=K*i I=20*6=120

N=16, I=1/16 Мбайт

По формуле N=2 i находим 16=2 i , 2 4 =2 i ,i=4. Из формулы I=K*i выразим K=I/i, K=(1/16)*1024*1024*8/4=131072

K=2048,I=1/512 Мбайт

Из формулы I=K*i выразим i=I/K, i=(1/512)*1024*1024*8/2048=8. По формулеN=2 i находим N=2 8 =256

Читайте также: