Как хранится текст в компьютере кратко

Обновлено: 08.07.2024

А теперь от обсуждения вопроса о том , что представляет собой компьютер, перейдем к ответу на вопрос, что умеет де­лать компьютер . Начиная с этой глав ы, мы будем знако­миться с применением ЭВМ .

Первая область применения , которую мы рассмотрим, — работа с текстами . При ручной записи часто неприятную проб­лему составляет необходимость исправлять ошибки или вно­сить какие-то изменения в текст . При этом приходится зачер­кивать, стирать , заклеивать , что порт и т вид текста . Необходи­мость переписывать текст ведет к потере времени и лишнему расходу бу ма г и.

Имея компьюте р, можно создавать текст ы, не тратя на это лишнее время и бумагу . Носителем текста становится па­мять ЭВМ . Конечно, для длительного его сохранения это должна быть внешняя память — магнитные или оптические д иски ,

Текст на внешних носителях сохраняется

в виде файла .

Есть ряд преимуществ сохранения текстов в файловой форме на компьютерных носителях по сравнению с бумагой . Во-первых , это компактное размещение . Например , текст толстой книги в 500 страниц помещается на маленькую дис­кету диаметром 9 см , А если использовать специальные ме­тоды сжатия , то размер текста, помещающегося на дискете, можно увеличить в несколько раз .

Во-вторых , если данный текст становится ненужным, то дискету, как бумагу , не надо выбрасывать или сдавать в ма­кулатуру. С нее с помощью компьютера легко стереть этот текст и на его место записать новый .

В-третьих , с помощью компьютера легко скопировать файлы в любом количестве на другие носители .

В-четвертых, файл с текстом можно быстро переслать дру­гому человеку по электронной почте . Для этого ваш ком­пьютер и компьютер адресата должны иметь связь через компьютерную сеть.

Главное неудобство хранения текстов в файлах состоит в том , что прочитать их можно только с помощью компьютер а. Человек может просмотреть текст на экране дисплея или на­печатать на бумаге, используя принтер .

Уже сейчас имеются некоторые издания , которые не печа­таются на бумаге , а хранятся и распространяются в форме файлов . Когда компьютеры станут такими же обычными предметами в каждом дом е, как сейчас радио и телевизор, то безбумажных изданий станет еще больше , Представьте себе, что вся ваша личная библиотека разместится в коробке с ди­сками. Причем по объему информации она будет не меньше , чем сотни книг, собранных родителями . А экономя бумагу , мы сохраняем леса на нашей планете.

Как представляются тексты в памяти компьютера

Текстовая информация состоит из символов: букв , цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом , а число символов в алфави­те — его мощностью.

Для представления текстовой информации в компьютере используется алфавит мощностью 25 6 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 = 256. 8 битов = 1 байт, следовательно:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу .

Понятно, что это дело условное , можно придумать множест­во способов кодировани я.

Все символы компь ю терного алфавита пронумерованы от О до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — просто порядковый номер символа в двоичной системе счисления.

Таблица , в которо й всем символам компьютерного алфавита поставлены в соответствие порядковые номера , называется таблицей кодировки .

Для разных типов ЭВМ используются различные таблицы кодировки , С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица ко­дировки под названием ASCII ( American S ta nda r t Code for In ­ formation Interchange — американский стандартный код для информационного обмена).

Точнее говор я, стандартной в этой таблице является толь­ко первая половина, т. е. символы с номера м и от нуля (дво­ичный код 00000000) до 127 ( 01111111 ) , Сюда входят буквы латинского алфавита , цифры, знаки препинания, скобки и некоторые другие символ ы. Остальные 128 кодов, начиная с 10000000 и кончая 11111111, используются в разных вари­антах. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

В табл . 3 .1 приведена стандартная часть кода ASCII (коды от 0 до 31 имеют особое назначение , не отражаются каки­ми - либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоич­ные к оды.

01100110 01101001 01101100 01100101 .

Л теперь попробуйте решить обратную задач у. Какое сло­во записано следующим двоичным кодом ;

01100100 01101001 01110011 01101011 ?

В табл. 3 . 2 приведен один из вариантов второй половины кодовой таблицы ASCII , который называется альтернатив­ной кодировкой. Видно, что в ней для букв русского алфави ­ та соблюдается принцип последовательного кодирования .

Тексты вводятся в память компьютера с помощью клавиа­туры . На клавишах написаны привычные нам буквы , циф­ры , знаки препинания и другие символы. В оперативную па­мять они попадают в форме двоичного код а.

Из памяти компьютера текст может быть выведен на эк­ран или на печать в символьной форме. Но для долговремен­ного хранения его следует записать на внешний носитель в виде файла .

Что такое гипертекст

Наиболее существенное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с тексто м, ин­формация в котором организована по принципу гипертекста .

Гипертекст — это текст , организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментам и. Такие связи называются гиперсвязями (гиперссылками) .

image041

image042

image043

Коротко о главном

С помощью компьютера можно создавать текстовые доку­

менты и хранить их на носителях внешне й памяти в виде файло в.

Преимущества файлового хранения текстов: возможность редактирования, быстрого копирования на другие носители; возможность передачи текста по линиям компьютерной связ и.

Каждый символ текста кодируется восьмиразрядным дво­ичным кодом . Для представления текстов в компьютере ис­пользуется алфавит мощностью 256 символов,

В таблице кодировки каждому символу алфавита постав­

лен в соответствие порядковый номер и восьмиразрядный двоичный ко д. Международным стандартом является код ASCII — американский стандартный код для информацион­ного обмена.

Гипертекст — это текст, организованный так , что его можно просматривать в последовательности смысловых свя­зей между его отдельными фрагментам и. Такие связи назы­ваются гиперсвязями (гиперссылками). Гиперссылка позво­ляет быстро перейти к просмотру того раздела , на который она указывает .

Вопросы и задания

1.В чем преимущества хранения текстов в файлах по сравнению с бумаж ным способом хранения?

2.Что такое гипертекст? Какие возможности предоставляет ги­пертекст пользовател ю?

3. Каков размер алфавита , используемого в компьютерах для п редставления текстов?

4. Сколько места в памяти занимает код одного символа?

5. Что такое таблица кодировк и? Как называется таблица код ировки, используемая в большинстве современных п ерсональ­ных компьютеров?

6. Закодируйте в двоичной форме свою фамилию , записанную ла­тинскими буквами, используя табл. 3.1.

7. Познакомьтесь с аль терн а тивн ой частью кода ASCII, и спользу ­ емой в школьных компьютерах. Выясните , соблюдается ли принцип последовательного кодирования алфавита из русских букв < их называют кириллицей).

Закодируйте короткую фразу на русском языке. Обменяйтесь полученными кодами с соседом по парте и декодируйте тексты друг друга.

А теперь от обсуждения вопроса о том, что представляет собой компьютер, перейдем к ответу на вопрос, что умеет делать компьютер. Начиная с этой главы, мы будем знакомиться с применением ЭВМ.

Первая область применения, которую мы рассмотрим — работа с текстами .

Тѐкст - связанная и полная последовательность символов.

При ручной записи часто приходиться исправлять ошибки или вносить какие-то изменения в текст. При этом нужно зачеркивать, стирать, заклеивать, что портит вид текста, а переписывать текст ведет к потере времени и лишнему расходу бумаги.

Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу.


Носителем текста становится память ЭВМ. Конечно, для длительного его сохранения это должна быть внешняя память — магнитные или оптические диски.

Текст на внешних носителях сохраняется в виде файла.

Есть ряд преимуществ сохранения текстов в файловой форме на компьютерных носителях по сравнению с бумагой:

  • v Компактное размещение.
  • v Если данный текст становится ненужным, то текст можно просто стереть.
  • v С помощью компьютера легко скопировать файлы в любом количестве на другие носители.
  • v Файл с текстом можно быстро переслать другому человеку по электронной почте.

Главное неудобство хранения текстов в файлах состоит в том, что прочитать их можно только с помощью компьютера. Человек может просмотреть текст на экране дисплея или напечатать на бумаге, используя принтер.

Представьте себе, что вся ваша личная библиотека разместится в коробке с дисками. Причем по объему информации она будет не меньше, чем сотни книг, собранных родителями. А экономя бумагу, мы сохраняем леса на нашей планете.

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других.

Алфавѝт - множество всех символов, с помощью которых записывается текст.

Число символов в алфавите — его м̀ощность.

Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов.

Один символ такого алфавита несет 8 битов информации: 2 8 = 256. 8 битов = 1 байт, следовательно:

один символ в компьютерном тексте занимает 1 байт памяти.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода .

Двоѝчный код - это способ представления данных в виде комбинации двух знаков, обычно обозначаемых цифрами 0 и 1.


Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме.

Наиболее существенное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, информация в котором организована по принципу гипертекста.

Гипертѐкст — это текст, содержащий указатели на другие документы.

Гиперсс̀ылка - часть гипертекстового документа, ссылка на другой элемент.

Раньше текст сохраняли на компьютер, чтобы почитать его, выйдя из интернета (так было дешевле). Сейчас это не очень актуально, ведь каждую страницу можно просматривать сколько угодно по времени – это не отражается на стоимости интернета. А можно ее добавить в закладки и открыть позже, когда это будет удобно.

Поэтому сейчас информацию из сети записывают, чтобы:

  • Распечатать на принтере
  • Добавить в реферат
  • Записать на флешку

Принцип сохранения следующий: выделили текст – скопировали – открыли программу (Word или подобную) – вставили – сохранили.

В итоге на компьютере получается отдельный файл, который можно будет открыть в любое удобное время (в том числе, когда нет доступа к интернету), распечатать его, скинуть на флешку.

А теперь подробно

1. Выделяем текст или его часть.

Подводим курсор (палочку) в самое начало текста, который нужно скопировать. Затем нажимаем на левую кнопку мышки и, не отпуская ее, как будто бы обводим строки. Когда они закрасятся каким-нибудь цветом (скорее всего, голубым), отпускаем кнопку мышки. Выделение при этом должно остаться.


2. Копируем то, что выделили.


3. Открываем программу для вставки текста.


Далее ищем пункт Microsoft Office и там выбираем Microsoft Office Word.


4. Вставляем информацию в программу.


Если все сделано правильно, то текст из интернета вставится в программу.

Картинки и фотографии обычно добавляются вместе с ним.

5. Сохраняем на компьютер.


Появится окошко, в котором нужно выбрать место в компьютере, куда следует записать данные.

Например, я хочу сохранить документ в Локальный диск D. Значит, выбираю диск D в этом окошке.


А если я хочу записать его сразу на флешку, то выбираю именно ее в этом окошке.

Кстати, прямо здесь, внутри, можно создать отдельную папку для текста.



Теперь полностью закрываем приложение и открываем то место на ПК, которое выбирали в окошке сохранения.

В моем случае это был Локальный диск D. Значит, открываю Пуск – Компьютер и захожу в диск D.

Там должен быть файл, открыв который, появится тот самый текст из интернета.

Как очистить текст от мусора

Зачастую скопированный текст добавляется в программу вместе с оформлением, какое было у него в интернете. Бывает, оно выглядит не очень симпатично.



Сразу после этого у выделенных данных уберутся все эффекты.

Это краткая инструкция по записи текста из интернета в компьютер. Если вы в чем-то не до конца разобрались, советую изучить подробную инструкцию вот по этой ссылке.


Имея компьютер, можно создавать тексты, не тратя на это много времени и бумаги. Носителем текста становится память компьютера. Текст на внешних носителях сохраняется в виде файла. Вся информация, независимо от того, какая она – графическая, видео или звуковая — представляется в компьютере с помощью чисел, двух символов двоичного кода – 0 и 1, которые легко перевести в сигналы. В данном уроке рассматриваются вопросы о том, как в компьютере представляется текстовая информация, то есть что такое таблица кодировки, какие таблицы кодировок используются и что такое информационный объём текста.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобретя в каталоге.

Получите невероятные возможности




Конспект урока "Представление текста в компьютере"

· использование таблицы кодировок;

· информационный объём текста.

Компьютер может работать с пятью видами информации:

Одним из самых массовых приложений ЭВМ является работа с текстами.

Имея компьютер, можно создавать тексты, не тратя на это много времени и бумагу. Носителем текста становится память компьютера. Текст на внешних носителях сохраняется в виде файла.

Как вы уже знаете, вся информация, независимо от того, какая она графическая, видео или звуковая, представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.

Прежде всего, вспомним о байтовом принципе организации памяти компьютера.

Как вы помните, каждая клетка обозначает бит памяти. Восемь подряд идущих битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. По этим адресам процессор обращается к данным, считывает их или записывает в память.

Схема представления текста в памяти компьютера очень проста. Каждая буква алфавита, цифра, знак препинания или любой другой символ необходимый для записи текста обозначается определённым двоичным кодом, длина которого фиксирована.

Например, в системах кодировки Windows – 1251 и KОИ-8 каждый символ заменяется на восьмиразрядное целое положительное двоичное число, оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице.

Мы уже говорили о том, что разрядность ячейки памяти i и количество различных целых положительных чисел, которые можно записать в эту ячейку n связаны соотношением:

Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций, то есть 2 8 = 256.

С помощью 256 кодовых комбинаций можно закодировать все символы двух алфавитов (английского и русского) и все остальные дополнительные символы, расположенные на клавиатуре компьютера — цифры и знаки арифметических операций, знаки препинания и скобки и так далее, а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, переход на новую строку, пробел и другие).

Мощность алфавита равна 256 символов. Сколько Килобайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?

В современном мире около 6700 живых языков и около 25 алфавитов.

Юнико́д или Унико́д (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Он является результатом сотрудничества Международной организации по стандартизации (ISO) с ведущими производителями компьютеров и программного обеспечения.

В Юникод каждый символ кодируется 16-битовым двоичным кодом, то есть два байта на символ. В данном случае можно закодировать 2 16 = 65536 различных символов.

Однако в последнее время объединение Unicode приступило к кодированию письменности мёртвых языков и в этом случае 16-битового кодирования уже недостаточно. Поэтому Unicode приступил к освоению новых кодов.

Текстовый документ, который хранится в памяти компьютера, состоит из кодов символьного алфавита, кодов управления форматами текста. Также текстовые процессоры, например, Microsoft Word позволяют включать и редактировать такие объекты как таблицы, оглавления, ссылки и гиперссылки, историю вносимых изменений и так далее. Все это также представляется в виде последовательности байтовых кодов.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

• 8 бит или 1 байт — если используется восьмиразрядная кодировка;

• 16 бит или 2 байта — если используется шестнадцатиразрядная кодировка.

Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов и так далее), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.

Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE равен 4 Килобайта. Определить количество символов в тексте.

Как мы уже говорили бывают случаи, когда, работая с текстом, программа может запросить воспользоваться другой кодировкой, например, текст в восьмибитном коде Windows перекодировать в кодировку Unicode. Давайте выясним, что произойдёт с информационным объёмом текста.

Итак, рассмотрим такой пример.

Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

• 16 бит (2 байта) — если используется 16-разрядная кодировка.

Информационный объём фрагмента текста — это количество битов, байтов и производных единиц, необходимых для записи фрагмента оговорённым способом кодирования.

Текстовая информация представляет собой набор символов, которыми могут быть буквы, цифры, знаки препинания. В компьютерной технике символы закодированы с помощью чисел, каждый символ кодируется своим набором цифр — кодом.

Базой для компьютерных стандартов кодирования является кодировка ASCII . Однако этот стандарт рассчитан на передачу текстовой информации, которая состоит из букв английского алфавита. Таблица ASCII -кодов состоит из двух частей: стандартная (содержит коды от \(0\) до \(127\)) и расширенная (содержит символы с кодами от \(128\) до \(255\)).

Для русского языка используют чаще всего однобайтовые кодовые таблицы КОИ-\(8\) , CP-\(866\) , Windows-\(1251\) , ISO \(8859\)-\(5\) . Первые \(128\) символов идентичны с таблицей ASCII-кодов , следующие символы (с \(128\) по \(255\)) предназначены для русских букв.

Стандарт Unicode кодирует все алфавиты современных, мёртвых и вымышленных языков. Современная компьютерная техника и операционные системы работают на базе \(16\)-битной версии Unicode.

Читайте также: