Информационный объем слова сообщение при однобайтном кодировании составляет
Обновлено: 05.07.2024
Если бы этот вопрос задали моему ребенку на уроке информатики, то я бы, чтобы помочь ему получить хорошую оценку, ответил, что 88. Сейчас объясню, как обосновать этот ответ в школе, и почему он при этом не совсем правильный, а в настоящем программировании всё сложнее.
В слове "информатика" 11 букв. Каждую букву мы можем закодировать одним байтом. В одном байте 8 бит, поэтому ответ 11х8=88.
Как это проверить? Очень просто, запустите на компьютере "Блокнот" (я предполагаю, что у вас Windows), напечатайте в нём это слово и сохраните в текстовый файл. Кликните правой кнопкой, выберите "свойства", видите? Размер: 11 байт (то есть 88 бит).
Теперь о том, почему в реальности всё сложнее. Мы выше написали, что каждую букву мы закодируем одним байтом. Всего разных символов у нас, таким образом, может быть максимум столько, сколько разных значений у одного байта, то есть 2 в восьмой степени, 256. Это значит, что все буквы всех алфавитов мира в один байт точно не влезут. Даже одни только японские или китайские иероглифы в один байт не вмещаются.
То есть кодировка, какому значению байта соответствует какая буква, это вовсе не универсальная штука, они бывают разные. В "Блокноте" и много где ещё в Windows используется кодировка Windows-1251 (это если вы в России живете, в других странах другие). В некоторых кодировках слово "информатика" просто нельзя записать. А в Windows-1251 нельзя записать слово 信息学. Если вы свой текстовый файлик, содержащий слово "информатика", пришлёте китайцу, он, открыв его, увидит какую-то абракадабру, и наоборот. Так что ответ "11 байт или 88 бит" предполагает, что мы с получателем используем одну и ту же однобайтовую кодировку, содержащую кириллические буквы.
А есть такой стандарт кодирования, в котором можно написать что угодно и не устраивать вот этих сложностей? Как ни странно, есть! Он называется Unicode, и в ней каждому символу всех алфавитов Земли (даже вымершим языкам, даже египетским иероглифам, даже смайликам и эмоджи) присвоен свой код. Естественно, в нём много тысяч символов и в один байт всё это не влезет. Unicode можно для компьютера кодировать по-разному, но самый популярный вариант устроен так. В нём самые распространенные символы (цифры, точки-запятые-скобки и буквы латинского алфавита) занимают один байт, чуть менее распространенные (кириллические буквы, а также всякие там Ä и π) два байта, а всякая экзотика вроде индейских узелковых письменностей и четыре может занимать.
С каждым годом Unicode становится всё более популярным, а "старые" кодировки вроде Windows 1251, господствовавшие, когда писался школьный учебник по информатике, уходят на второй план. Так что по-честному я бы ответил, что в слове "информатика" 22 байта = 176 бит, ну, насколько уж этот вопрос вообще имеет смысл.
Информация (лат. informatio — разъяснение, изложение, набор сведений) — базовое понятие в информатике, которому нельзя дать строгого определения, а можно только пояснить:
- информация — это новые факты, новые знания;
- информация — это сведения об объектах и явлениях окружающей среды, которые повышают уровень осведомленности человека;
- информация — это сведения об объектах и явлениях окружающей среды, которые уменьшают степень неопределенности знаний об этих объектах или явлениях при принятии определенных решений.
Основными социально значимыми свойствами информации являются:
- полезность;
- доступность (понятность);
- актуальность;
- полнота;
- достоверность;
- адекватность.
Информационный процесс — это процесс сбора (приема), передачи (обмена), хранения, обработки (преобразования) информации.
Единицы измерения количества информации
Наименьшей единицей информации является бит (англ. binary digit (bit) — двоичная единица информации).
Бит — это количество информации, необходимое для однозначного определения одного из двух равновероятных событий.
Например, один бит информации получает человек, когда он узнает, опаздывает с прибытием нужный ему поезд или нет, был ночью мороз или нет, присутствует на лекции студент или нет и т. д.
В информатике принято рассматривать последовательности длиной 8 битов . Такая последовательность называется байтом .
Производные единицы измерения количества информации:
1 байт = 8 битов
1 килобайт (Кб) = 1024 байта = 2 10 байтов
1 мегабайт (Мб) = 1024 килобайта = 2 20 байтов
1 гигабайт (Гб) = 1024 мегабайта = 2 30 байтов
1 терабайт (Тб) = 1024 гигабайта = 2 40 байтов
В 1 бит можно записать один двоичный символ.
1 байт = 8 бит
В кодировке ASCII в один байт можно записать один 256 символьный код
В кодировке UNICODE один 256 символьный код занимает в памяти два байта
1 килобайт = 1024 байт
1 мегабайт = 1024 килобайт
1 гигабайт = 1024 мегабайт
1 терабайт = 1024 гигабайт
Например: двоичный текст 01010111 занимает в памяти 8 бит
Этот же текст в кодировке ASCII занимает 8 байт или 64 бита
Этот же текст в кодировке UNICODE занимает 16 байт или 128 бит.
Не забывайте, что пробелы надо тоже считать за символы поскольку они также набираются на клавиатуре и хранятся в памяти.
Мощность алфавита - это количество символов в алфавите или неопределенность из формулы Хартли.
Информационный вес одного символа - это значение i из формулы Хартли.
Отсюда можно сделать вывод, что не существует алфавита, состоящего из одного символа, поскольку тогда информационный вес этого символа был бы равен 0.
Чтобы перевести биты в байты надо число бит поделить на 8.
Например: 32 бита - это 4 байта.
Чтобы перевести байты в килобайты надо число байтов поделить на 1024.
Например: в 2048 байтах будет 2 килобайта. И так далее по следующим единицам измерения.
Чтобы перевести байты в биты надо число байт умножить на 8.
Например: в 3 байтах будет 24 бита.
Чтобы перевести килобайты в байты надо число килобайт умножить на 1024.
Например: в 3 килобайтах будет 3072 байта и соответственно 24576 бит. И так далее.
Мощность алфавита - 128. Это неопределенность. Значит один символ занимает в памяти 7 бит, тогда 5 символов занимают в памяти 35 бит.
М | А | М | А | М | Ы | Л | А | Р | А | М | У |
Задачи
ПРИВЕТ ОТ СТАРЫХ ШТИБЛЕТ!
при использовании 16-битной кодировки.
25 × 16 = 400 битов = 400 : 8 байтов = 50 байтов.
Если сообразить, что 16 битов = 2 байта, сразу получим
25 × 2 = 50 байтов.
Ответ: 50 байтов.
Задача 2. Решить задачу 1 при условии, что используется кодировка с минимальным количеством битов на символ.
25 × 5 = 125 битов.
Ответ: 125 битов.
Нужно учитывать, что при использовании такого кода вместе с кодами символов необходимо передать и словарь (соответствие кода конкретном символу). Объём 125 битов вычислен без учёта словаря.
Решение. Сначала определим количество символов на странице:
32 × 64 = 2 5 × 2 6 = 2 11 .
Теперь находим общее количество символов в книге: L = 10 × 2 11 символов.
Внимание! Все тесты в этом разделе разработаны пользователями сайта для собственного использования. Администрация сайта не проверяет возможные ошибки, которые могут встретиться в тестах.
Список вопросов теста
Вопрос 1
К визуальной относится информация, которую человек воспринимает с помощью…
- органов зрения
- органов обоняния
- органов восприятия вкус
- органов слуха
Вопрос 2
В зависимости от способа изображения чисел системы счисления делятся на…
- арабские и римские
- позиционные и непозиционные
- представленные в виде ряда и в виде раз-рядной сетки
Вопрос 3
Перевод текста с английского языка на русский можно назвать:
- процесс хранения информации
- процесс передачи информации
- процесс получения информации
- процесс защиты информации
- процесс обработки информации
Вопрос 4
Ура!_Началась_сессия!!
при однобайтном кодировании составляет…
- 23 байта
- 17 байт
- 20 байт
- 22 байта
Вопрос 5
Примером текстовой информации может служить:
- таблица умножения
- реплика актера в спектакле
- фотография
- иллюстрация в книге
- музыкальная заставка
Вопрос 6
К устройствам вывода информации относятся…
- монитор
- принтер
- клавиатура
- сканер
Вопрос 7
Устройствами внешней памяти являются:
Укажите все правильные ответы
- накопители на гибких магнитных дис-ках
- оперативные запоминающие устрой-ства
- накопители на жестких магнитных дисках
- стриммеры
- плоттеры
Вопрос 8
Персональный компьютер состоит из:
Укажите все правильные ответы.
- системного блока;
- Монитора
- клавиатуры
- комплекса мультимедиа
- дополнительные устройства
Вопрос 9
Установите соответствие между названиями программ и классами программного обеспечения.
- Microsoft Word
- Microsoft Visual Basic
- Windows XP
Вопрос 10
- элементарная информационная единица, содержащая последовательность байтов и имеющая уникальное имя
- объект, характеризующийся именем, значением и типом
- совокупность индексированных переменных
- совокупность фактов и правил
Вопрос 11
Программой архиватором называют .
- программу для уплотнения информационного объема (сжатия) файлов
- программу резервного копирования файлов
- интерпретатор
- транслятор
- систему управления базами данных
Вопрос 12
Полный путь файлу: D :\books\raskaz. doc Какое имя файла?
- books\raskaz
- raskaz.doc
- books\raskaz.doc
- doc
Вопрос 13
Расширение файла характеризует .
- время создания файла
- объем файла
- место, занимаемое файлом на диске
- тип информации, содержащейся в файле
- место создания файла
Вопрос 14
Установите соответствие между устройством и его назначением
Вопрос 15
- возникают в связи сбоев в аппаратной части компьютера
- создаются людьми специально для нанесения ущерба ПК
- зарождаются при работе неверно написанных программных продуктов
- являются следствием ошибок в опе-рационной системе
- имеют биологическое происхождение
Вопрос 16
Значки (ярлыки) в Windows соответствуют:
Укажите все правильные ответы
- документам
- заставкам
- папкам
- программам
Вопрос 17
Установите соответствие в назначении кнопок панелей в приложениях Windows
- создать новый документ
- сохранить документ
- распечатать документ
- предварительный просмотр
Вопрос 18
В диаграмме Excel названием выделенного объекта является …
- область диаграммы
- заголовок диаграммы
- ряды данных
- легенда
Вопрос 19
Графика с представлением изображения в виде совокупности точек называется…
- растровой
- фрактальной
- векторной
- прямолинейной
Вопрос 20
- русский язык
- материаловедение
- инженерная графика
- информатика
в MS Word называется…
- маркированным
- многоуровневым
- нумерованным
- правильным
Вопрос 21
Результатом вычислений в ячейке С4 таблицы Excel будет число …
Вопрос 22
Формула, записанная в ячейку С1, при копировании в D 1 примет вид…
- =А1+В1
- =А1+C1
- =$А$1+C1
- =$А$2+В1
- =$А$2+C1
Вопрос 23
Основными функциями форматирования текста являются:
- ввод текста, корректировка текста;
- установление значений полей страницы, форматирование абзацев, установка шрифтов;
- перенос, копирование, переименование, удаление.
Вопрос 24
В текстовом редакторе при задании параметров страницы устанавливаются:
- Гарнитура, размер, начертание;
- Отступ, интервал;
- Поля, ориентация;
- Стиль, шаблон.
Вопрос 25
Вопрос 26
Установите соответствие между названием объектов базы данных и их назначением
- предназначен для хранения информации;
- предназначен для ввода и просмотра данных;
- предназначен для выдачи данных по определенным параметрам;
- предназначен для выдачи данных на экран или печать.
Вопрос 27
Глобальная компьютерная сеть – это …
- информационная система с гиперсвязями
- множество компьютеров, связанных каналами передачи информации и находящихся в пределах одного помещения, здания
- совокупность локальных сетей и компьютеров, расположенных на больших расстояниях и соединенные в единую систему
Вопрос 28
Web-страницы имеют расширение:
Вопрос 29
Компьютер, предоставляющий свои ресурсы в пользование другим компьютерам при совместной работе, называется …
Читайте также: