Сообщение содержащее 25 символов имеет объем 800 бит какую мощность имеет использованный алфавит

Обновлено: 08.07.2024

Частотный словарь русского языка - словарь вероятностей (частот) появления букв в произвольном тексте - приведен ниже. Определите, какое количество информации несет каждая буква этого словаря.

Символ Частота Символ Частота Символ Частота Символ Частота
о 0,090 в 0,035 я 0,018 ж 0,007
е, ё 0, 072 к 0,028 ы, з 0,016 ю, ш 0,006
а, и 0,062 м 0,026 ь, ъ, б 0,014 ц, щ, э 0,003
т, н 0,053 д 0,025 ч 0,013 ф 0,002
с 0,045 п 0,023 й 0,012
р 0,040 у 0,021 х 0,009

1.76

Используя результат решения предыдущей задачи, определите количество информации в слове "ИНФОРМАТИКА".

1.77

Используя решение задачи 1.75, определите количество информации в фразе "ПОВТОРЕНИЕ - МАТЬ УЧЕНИЯ".

1.78

Возьмите произвольный текст на английском языке (3-4 страницы) и составьте частотный словарь английского языка. Определите, какое количество информации несет каждая буква этого словаря.

1.79

Используя результат решения предыдущей задачи, определите количество информации в слове "INFORMATION".

1.80

Определение количества информации, представленной с помощью знаковых систем

1.81

Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита?

1.82

К=20 символов

I=K*i=20*6=120 бит=15 байт.

1.83

Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти - 70 символов. Сравните объемы информации, содержащейся в письмах.

1.84

N=1,5 Кбайт=12288 бит.

I=12288 : 3072=4

2 4 =16 символов в алфавите.

1.85

N=1 : 512=16 бит.

2 128 =16384 символов в алфавите.

1.86

I=1/16 Мбайта,то есть I=524288бит.

N=16,так как N=2 i ,то i=4.

K=I:i=524288бит:4=136072 символа.

1.87

I=12288 битов=12288:8=1536 байт=1536:1024=1,5 Кбайт.

1.88

N=16,N=2 i ,тогда i=4

I=k*i=384*4=1536 бит

1536 бит=192 байт=0,1875 Кбайт.

1.89

Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?

N=256,N=2 i , i=8

K=30 строк*70*5 стр=10500 символов всего

I=8*10500=84000 бит=10500 байт=10,25 Кбайт.

1.90

К=3 стр*25 строк*60=4500 символов

I=1125 байт=9000 бит

i=I:k=9000 бит: 4500 символов=2

N=2 2 =4 символа в алфавите

1.91

N=64 символа,i=6

K=30 строк*6 стр*х символов

I=8775 байт=70200 бит

70200:6=11700

390:6=65 символов.

1.92

I=1/16 Kбайта=512 бит

К=2*256=512 символов всего

N=2 i , N=2 символа в алфавите.

1.93

Допустим что N1= 8 5 = 32 символа, а второго алфавита равна 2 2 = 4 символа.

1.95

ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х1023 нуклеотидов?

K=1,5 х1023=1534,5

1.96

Выяснить, сколько бит информации несет каждое двузначное число (отвлекаясь от его конкретного числового значения).

так как таких чисел может быть всего 90(10-90),то кол-во информации I=log290 или I~6,5.

Так как в таких числах цифра имеет 9 значений(1-9),а вторая 10 значений(0-9),то I=log290=log29+log210. Log210~3,32.

1.97

K = 2048 символов

I=1/512 Mбайта=16384 бита

i=16384: 2048=8,тогда 2 8 =256=N

1.98

Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256.

K=100(знаков за 1 мин)

Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту?

1.99

Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?


Множество символов, с помощью которых записывается текст, называется алфавитом .

Формула определения количества информации: N=2 i ,

В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным .

Единице измерения 8 бит присвоили название 1 байт:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

1) Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

1. 32 = 2 5 , значит вес одного символа i = 5 бит.

Дано: Мощность алфавита N = 16 текст состоит из 10 символов.

2. Всего символов 10, значит объем информации 10 * 4 = 40 бит.

1. Определим вес одного символа: 300 / 100 = 3 бита.

2. Мощность алфавита определяем по формуле: 2 3 = 8

Мощность алфавита

Описание термина

Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:

Понятие мощности алфавита

  • числа;
  • спецсимволы;
  • двоеточия;
  • пробел;
  • скобки;
  • запятые;
  • точки;
  • многоточия и прочее.

Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы. В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов. Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.

Отображение символов в двоичном коде

Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:

Алфавит в двоичном коде

Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:

  • 1 — 000;
  • 2 — 001;
  • 3 — 010;
  • 4 — 011;
  • 5 — 100;
  • 6 — 101;
  • 7 — 110;
  • 8 — 111.

Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.

Вычисление мощности алфавита

Вычисление мощности алфавита

Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.

Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.

При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.

Определение информационного объёма в тексте

Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:

  • заглавные и жирные буквы;
  • курсив;
  • скобки;
  • знаки препинания;
  • вычислительные операции и прочее.

По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.

Набор текста на компьютерах

Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.

Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.

Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.

Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.

Примеры расчёта мощности

Как определить информационный объём

будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.

Онлайн калькулятор легко и непринужденно вычислит объем текста в битах, байтах и килобайтах. Для перевода в другие единицы измерения данных воспользуйтесь онлайн конвертером.

Информационный вес (объем) символа текста определяется для следующих кодировок:
Unicode UTF-8
Unicode UTF-16
ASCII, ANSI, Windows-1251

Почему на windows сохраняя текст блокноте перенос строки занимает - 4 байта в юникоде или 2 байта в анси?
Это историческое явление, которое берёт начало с дос, последовательность OD OA (\n\r ) в виндовс используются чтоб был единообразный вывод на терминал независимо консоль это или принтер. Но для вывода просто на консоль достаточно только \n.

Читайте также: