Сообщение содержащее 25 символов имеет объем 800 бит какую мощность имеет использованный алфавит
Обновлено: 08.07.2024
Частотный словарь русского языка - словарь вероятностей (частот) появления букв в произвольном тексте - приведен ниже. Определите, какое количество информации несет каждая буква этого словаря.
Символ | Частота | Символ | Частота | Символ | Частота | Символ | Частота |
о | 0,090 | в | 0,035 | я | 0,018 | ж | 0,007 |
е, ё | 0, 072 | к | 0,028 | ы, з | 0,016 | ю, ш | 0,006 |
а, и | 0,062 | м | 0,026 | ь, ъ, б | 0,014 | ц, щ, э | 0,003 |
т, н | 0,053 | д | 0,025 | ч | 0,013 | ф | 0,002 |
с | 0,045 | п | 0,023 | й | 0,012 | ||
р | 0,040 | у | 0,021 | х | 0,009 |
1.76
Используя результат решения предыдущей задачи, определите количество информации в слове "ИНФОРМАТИКА".
1.77
Используя решение задачи 1.75, определите количество информации в фразе "ПОВТОРЕНИЕ - МАТЬ УЧЕНИЯ".
1.78
Возьмите произвольный текст на английском языке (3-4 страницы) и составьте частотный словарь английского языка. Определите, какое количество информации несет каждая буква этого словаря.
1.79
Используя результат решения предыдущей задачи, определите количество информации в слове "INFORMATION".
1.80
Определение количества информации, представленной с помощью знаковых систем
1.81
Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита?
1.82
К=20 символов
I=K*i=20*6=120 бит=15 байт.
1.83
Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти - 70 символов. Сравните объемы информации, содержащейся в письмах.
1.84
N=1,5 Кбайт=12288 бит.
I=12288 : 3072=4
2 4 =16 символов в алфавите.
1.85
N=1 : 512=16 бит.
2 128 =16384 символов в алфавите.
1.86
I=1/16 Мбайта,то есть I=524288бит.
N=16,так как N=2 i ,то i=4.
K=I:i=524288бит:4=136072 символа.
1.87
I=12288 битов=12288:8=1536 байт=1536:1024=1,5 Кбайт.
1.88
N=16,N=2 i ,тогда i=4
I=k*i=384*4=1536 бит
1536 бит=192 байт=0,1875 Кбайт.
1.89
Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста?
N=256,N=2 i , i=8
K=30 строк*70*5 стр=10500 символов всего
I=8*10500=84000 бит=10500 байт=10,25 Кбайт.
1.90
К=3 стр*25 строк*60=4500 символов
I=1125 байт=9000 бит
i=I:k=9000 бит: 4500 символов=2
N=2 2 =4 символа в алфавите
1.91
N=64 символа,i=6
K=30 строк*6 стр*х символов
I=8775 байт=70200 бит
70200:6=11700
390:6=65 символов.
1.92
I=1/16 Kбайта=512 бит
К=2*256=512 символов всего
N=2 i , N=2 символа в алфавите.
1.93
Допустим что N1= 8 5 = 32 символа, а второго алфавита равна 2 2 = 4 символа.
1.95
ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х1023 нуклеотидов?
K=1,5 х1023=1534,5
1.96
Выяснить, сколько бит информации несет каждое двузначное число (отвлекаясь от его конкретного числового значения).
так как таких чисел может быть всего 90(10-90),то кол-во информации I=log290 или I~6,5.
Так как в таких числах цифра имеет 9 значений(1-9),а вторая 10 значений(0-9),то I=log290=log29+log210. Log210~3,32.
1.97
K = 2048 символов
I=1/512 Mбайта=16384 бита
i=16384: 2048=8,тогда 2 8 =256=N
1.98
Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256.
K=100(знаков за 1 мин)
Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту?
1.99
Система оптического распознавания символов позволяет преобразовывать отсканированные изображения страниц документа в текстовый формат со скоростью 4 страницы в минуту и использует алфавит мощностью 65536 символов. Какое количество информации будет нести текстовый документ после 5 минут работы приложения, страницы которого содержат 40 строк по 50 символов?
Множество символов, с помощью которых записывается текст, называется алфавитом .
Формула определения количества информации: N=2 i ,
В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным .
Единице измерения 8 бит присвоили название 1 байт:
Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
1) Алфавит содержит 32 буквы. Какое количество информации несет одна буква?
1. 32 = 2 5 , значит вес одного символа i = 5 бит.
Дано: Мощность алфавита N = 16 текст состоит из 10 символов.
2. Всего символов 10, значит объем информации 10 * 4 = 40 бит.
1. Определим вес одного символа: 300 / 100 = 3 бита.
2. Мощность алфавита определяем по формуле: 2 3 = 8
Описание термина
Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:
- числа;
- спецсимволы;
- двоеточия;
- пробел;
- скобки;
- запятые;
- точки;
- многоточия и прочее.
Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы. В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов. Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.
Отображение символов в двоичном коде
Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:
Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:
- 1 — 000;
- 2 — 001;
- 3 — 010;
- 4 — 011;
- 5 — 100;
- 6 — 101;
- 7 — 110;
- 8 — 111.
Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.
Вычисление мощности алфавита
Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.
Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.
При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.
Определение информационного объёма в тексте
Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:
- заглавные и жирные буквы;
- курсив;
- скобки;
- знаки препинания;
- вычислительные операции и прочее.
По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.
Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.
Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.
Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.
Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.
Примеры расчёта мощности
будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.
Онлайн калькулятор легко и непринужденно вычислит объем текста в битах, байтах и килобайтах. Для перевода в другие единицы измерения данных воспользуйтесь онлайн конвертером.
Информационный вес (объем) символа текста определяется для следующих кодировок:
Unicode UTF-8
Unicode UTF-16
ASCII, ANSI, Windows-1251
Почему на windows сохраняя текст блокноте перенос строки занимает - 4 байта в юникоде или 2 байта в анси?
Это историческое явление, которое берёт начало с дос, последовательность OD OA (\n\r ) в виндовс используются чтоб был единообразный вывод на терминал независимо консоль это или принтер. Но для вывода просто на консоль достаточно только \n.
Читайте также: