Тексты в компьютерной памяти кратко

Обновлено: 30.06.2024

Компьютер воспринимает любые символы по двоичному коду. При нажатии на клавишу клавиатуры, в компьютер поступают электрические импульсы разной силы, которая преобразуется в двоичный код.

Вес одного символа (длина двоичного кода, которая отводится для кодирования одного символа) обозначается i .
Мощность алфавита (количество всех символов в алфавите или кодовых комбинаций) обозначается буквой N .

Рассмотрим мощность компьютерного алфавита.
Компьютерный алфавит равен \(256\). В компьютерный алфавит входят буквы, цифры, знаки препинания, арифметические знаки, основные управляющие символы (delete, backspace и т. п.)


Имея компьютер, можно создавать тексты, не тратя на это много времени и бумаги. Носителем текста становится память компьютера. Текст на внешних носителях сохраняется в виде файла. Вся информация, независимо от того, какая она – графическая, видео или звуковая — представляется в компьютере с помощью чисел, двух символов двоичного кода – 0 и 1, которые легко перевести в сигналы. В данном уроке рассматриваются вопросы о том, как в компьютере представляется текстовая информация, то есть что такое таблица кодировки, какие таблицы кодировок используются и что такое информационный объём текста.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобретя в каталоге.

Получите невероятные возможности




Конспект урока "Представление текста в компьютере"

· использование таблицы кодировок;

· информационный объём текста.

Компьютер может работать с пятью видами информации:

Одним из самых массовых приложений ЭВМ является работа с текстами.

Имея компьютер, можно создавать тексты, не тратя на это много времени и бумагу. Носителем текста становится память компьютера. Текст на внешних носителях сохраняется в виде файла.

Как вы уже знаете, вся информация, независимо от того, какая она графическая, видео или звуковая, представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.

Прежде всего, вспомним о байтовом принципе организации памяти компьютера.

Как вы помните, каждая клетка обозначает бит памяти. Восемь подряд идущих битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. По этим адресам процессор обращается к данным, считывает их или записывает в память.

Схема представления текста в памяти компьютера очень проста. Каждая буква алфавита, цифра, знак препинания или любой другой символ необходимый для записи текста обозначается определённым двоичным кодом, длина которого фиксирована.

Например, в системах кодировки Windows – 1251 и KОИ-8 каждый символ заменяется на восьмиразрядное целое положительное двоичное число, оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице.

Мы уже говорили о том, что разрядность ячейки памяти i и количество различных целых положительных чисел, которые можно записать в эту ячейку n связаны соотношением:

Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций, то есть 2 8 = 256.

С помощью 256 кодовых комбинаций можно закодировать все символы двух алфавитов (английского и русского) и все остальные дополнительные символы, расположенные на клавиатуре компьютера — цифры и знаки арифметических операций, знаки препинания и скобки и так далее, а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, переход на новую строку, пробел и другие).

Мощность алфавита равна 256 символов. Сколько Килобайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?

В современном мире около 6700 живых языков и около 25 алфавитов.

Юнико́д или Унико́д (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Он является результатом сотрудничества Международной организации по стандартизации (ISO) с ведущими производителями компьютеров и программного обеспечения.

В Юникод каждый символ кодируется 16-битовым двоичным кодом, то есть два байта на символ. В данном случае можно закодировать 2 16 = 65536 различных символов.

Однако в последнее время объединение Unicode приступило к кодированию письменности мёртвых языков и в этом случае 16-битового кодирования уже недостаточно. Поэтому Unicode приступил к освоению новых кодов.

Текстовый документ, который хранится в памяти компьютера, состоит из кодов символьного алфавита, кодов управления форматами текста. Также текстовые процессоры, например, Microsoft Word позволяют включать и редактировать такие объекты как таблицы, оглавления, ссылки и гиперссылки, историю вносимых изменений и так далее. Все это также представляется в виде последовательности байтовых кодов.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

• 8 бит или 1 байт — если используется восьмиразрядная кодировка;

• 16 бит или 2 байта — если используется шестнадцатиразрядная кодировка.

Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов и так далее), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.

Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE равен 4 Килобайта. Определить количество символов в тексте.

Как мы уже говорили бывают случаи, когда, работая с текстом, программа может запросить воспользоваться другой кодировкой, например, текст в восьмибитном коде Windows перекодировать в кодировку Unicode. Давайте выясним, что произойдёт с информационным объёмом текста.

Итак, рассмотрим такой пример.

Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

• 16 бит (2 байта) — если используется 16-разрядная кодировка.

Информационный объём фрагмента текста — это количество битов, байтов и производных единиц, необходимых для записи фрагмента оговорённым способом кодирования.

Свидетельство и скидка на обучение каждому участнику

Зарегистрироваться 15–17 марта 2022 г.

Конспект урока

Учебный предмет, класс: Информатика, 7 класс

Тип урока: изучение нового материала

Цель урока: Ввести понятие кодирование текстовой информации, научить

работать с таблицей кодов ASCII, КОИ-8.

Задачи: Сформировать представление о кодировании текстовой информации, познакомить с таблицей кодов ASCII, КОИ-8; Научить кодировать текстовую информацию; Научиться пользоваться таблицей кодов.

1. Организационный момент (2 мин). Здравствуйте ребята! Есть ли отсутствующие на уроке? Все готовы к уроку?

2. Изучение нового материала(15 мин)

Преимущества компьютерного документа по сравнению с бумажным

Начиная с этой главы, мы будем знакомиться с применением компьютеров.

Первая область применения , которую мы рассмотрим работа с текстами. Тексты на внешних носителях сохраняются в файлах.

Есть ряд преимуществ сохранения текстов в файлах на компьютерных носителях по сравнению с бумагой.

Во-первых, это компактное размещение. Например, на компакт-диске (700 Мб) можно разместить тексты более сотни книг объемом в 500 страниц каждая. А если использовать специальные методы сжатия, то это количество можно увеличить в несколько раз.

Во-вторых, если данный текст становится ненужным, то с помощью компьютера его легко удалить с носителя, поместив на это место другой файл.

В-третьих, с помощью компьютера легко скопировать файлы в любом количестве на другие носители.

В-четвертых, файл с текстом можно быстро переслать другому человеку по электронной почте. Для этого ваш компьютер и компьютер адресата должны иметь связь через компьютерную сеть.

Главное неудобство хранения текстов в файлах состоит в том, что прочитать их можно только с помощью компьютера. Человек может просмотреть текст на экране монитора или напечатать на бумаге, используя принтер.

Как представляются тексты в памяти компьютера

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и др. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом , а число символов в алфавите — его мощностью.

(Слайд 2) Широко распространенным способом представления текстовой информации в компьютере является использование алфавита мощностью 256 символов. Один символ такого алфавита несет 8 битов информации: 2 8 = 256. 8 битов = 1 байт, следовательно:

(Слайд 3 ) Двоичный код каждого символа занимает 1 байт памяти компьютера.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие тому или иному символу. (Понятно, что это дело условное, можно придумать множество способов кодирования.)

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера , называется таблицей кодировки.

Запись в тетрадь.

(Слайд 4) На ЭВМ первых поколений для разных типов машин использовались различные таблицы кодировки. С распространением персональных компьютеров международным стандартом стала таблица кодировки под названием ASCII .

Точнее говоря, стандартной в этой таблице является только первая половина, т. е. символы с номерами от нуля (двоичный код 00000000) до 127(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, ОТ 10000000 до 11111111, составляют так называемую кодовую страницу.

В таблице приведена стандартная часть кода (коды от 0 до 31 имеют особое назначение, не отражаются какими-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоичные коды.

01100110 01101001 01101100 01100101 .

А теперь попробуйте решить обратную задачу. Какое слово записано следующим двоичным кодом:

01101101 01100001 01101101 01100001 ? (mama)

(Слайд 5) Кодирование - это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.

Декодирование - это перевод закодированной информации в форму понятную человеку.

(Слайд 6) На слайде кодовая страница СР1251. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования. Однако это правило действует не во всех существующих кодовых страницах с русским алфавитом.

Помимо восьмиразрядной кодировки символов все большее распространение получает шестнадцатиразрядная — двухбайтовая кодировка UNICODE.

(Слайд 7) Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.

Что такое гипертекст

Наиболее существенное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, информация в котором организована по принципу гипертекста.

(Слайд 8) Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются гиперсвязями (гиперссылками).

Практическая работа(10 мин)

Пример 1. Сколько бит памяти компьютера занимает слово МИКРОПРОЦЕССОР?

Это слово состоит из 14 букв. Каждая буква является символом компьютерного алфавита и поэтому занимает 1 байт памяти. Так как в слове МИКРОПРОЦЕССОР 14 букв, то слово займет 14 байт = 112 бит памяти, т.к. 1 байт = 8 бит.

Пример 2. Какой объём памяти займёт приведённый ниже текст, если известно, что в нём используется кодировочная таблица ASCII ?

Happy New Year, dear friends!!

Ответ: 30 знаков х 8 бит = 240 бит = 30 байт

Пример 3. Текст занимает 5 полных страниц. На каждой странице размещается 20 строк по 70 символов в строке. Какой объем оперативной памяти займет этот текст?

5 страниц х 20 строк х 70 символов = 7 000 байт

Задание. Закодируйте какую-нибудь фразу и поменяйтесь тетрадями с вашим соседом. Попробуйте отгадать, что же задумал ваш сосед.

Задание домашнего задания(2 мин)

Используя таблицу ASCII закодировать следующие слова:

МОРЕ (11001100 11001110 11010000 11000101)

Красота (11001010 11110000 11100000 11110001 11101110 11110010 11100000)

Первая область применения компьютеров, которую мы с вами рассмотрим – работа с текстами. При ручной записи часто возникает необходимость исправлять ошибки или вносить какие-то изменения в текст приходится зачеркивать, стирать, заклеивать портится внешний вид текста возникает необходимость переписывать текст ведет к потере времени и лишнему расходу бумаги

Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу. Носителем текста становится память компьютера. Конечно, для длительного сохранения это должна быть внешняя память . Текст на внешних носителях сохраняется в виде файла . Вспомним, что такое ФАЙЛ Файл – это… поименованная область внешней памяти

Преимущества сохранения текстов в компьютерной памяти в файловой форме : компактное размещение (на компакт-диске объемом 700 мб можно разместить тексты более сотни книг в 500 страниц каждая ) если данный текст становится ненужным, то дискету, как бумагу, не надо выбрасывать или сдавать в макулатуру – с нее можно стереть этот файл и на его место записать новый файл всегда можно скопировать в любом количестве на другие носители - файл можно быстро переслать другому человеку по электронной почте

Главное неудобство хранения текстов в компьютерной памяти прочитать их можно только на экране монитора или другого электронного носителя или распечатав на принтере

А теперь заглянем в память компьютера и посмотрим, как же в нем представлена текстовая информация. Из чего состоит текстовая информация. Из букв ( А, Б, D, L ) Из цифр ( 1, 5, 0, 9 ) Из знаков препинания, скобок и пр . ( ?, (), *, % ) Мы уже говорили, что множество символов, с помощью которых записывается текст, называется алфавит , а число символов – мощностью алфавита . N=2 b

Широко используемым способом представления текстовой информации в компьютере является использование алфавита мощностью 256 символов. Один символ такого алфавита несет 8 битов информации: 256 = 2 8 8 битов = 1 байт, следовательно : Двоичный код каждого символа занимает 1 байт компьютерной памяти

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие тому или иному символу . Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код – порядковый номер символа в двоичной системе счисления. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки .

Международным стандартом стала таблица кодировки ASCII A merican S tandart C ode for I nformation I nterchange ASCII – восьмибитовая или однобайтовая кодировка, 1 символ весит 8 бит или 1 байт

Помимо восьмиразрядной кодировки символов все большее распространение получает шестнадцатиразрядная кодировка – двухбайтовая – UNICODE UNICODE – шестнадцати битовая или двухбайтовая кодировка. Один символ весит 16 бит или 2 байта .

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, но в оперативную компьютерную память они попадают уже в виде двоичного кода .

Задания для самостоятельной работы: 1. Какой объём памяти займёт приведённый ниже текст, если известно, что в нём используется кодировочная таблица ASCII ? Happy New Year, dear friends !! Ответ: 30 знаков х 8 бит = 240 бит = 30 байт 2. Сколько символов содержится в тексте, использующем таблицу ASCII , если известно, что он занимает 24 576 бит памяти ? Ответ: 24 576 бит : 8 бит = 3 072 знака

3. Текст занимает 1,25 Кбайт памяти компьютер. Сколько символов содержит этот текст? Ответ: 1,25 Кбайт = 1,25х1024 = 1 208 байт. 1 символ компьютерного алфавита равен 1 байту, следовательно текст содержит 1 208 символов 4. Текст занимает 5 полных страниц. На каждой странице размещается 20 строк по 70 символов в строке. Какой объем оперативной памяти займет этот текст? Ответ: 5 страниц х 20 строк х 70 символов = 7 000 байт

По теме: методические разработки, презентации и конспекты


Презентация к уроку Мужества "Площадь Памяти"

Данное мероприятие направлено на формирование у учащихся чувства патриотизма, соответствует возрастным особенностям детей. Занятие логически делится на две части: теоретико-информационную (эмоциональн.


Виды компьютерной памяти и их сравнение.

Виды компьютерной памяти и их сравнение.Свойства оперативной памяти. Презентация к уроку в 7 классе по И.Г. Семакину.


План-конспект урока по теме "Виды компьютерной памяти"

План-конспект урока по теме: "Виды компьютерной памяти" с применением ЭОР.


Тексты в компьютерной памяти: кодирование символов. Тестовые файлы

Тексты в компьютерной памяти: кодирование символов. Тестовые файлы.


Тексты в компьютерной памяти: кодирование символов. Тестовые файлы

Тексты в компьютерной памяти: кодирование символов. Тестовые файлы.


Самостоятельная работа "Тексты в компьютерной памяти"

Самостоятельная работа по информатике к параграфу "Тексты в компьютерной памяти" Семакин И.Г.

Читайте также: