Что такое текст в компьютере определение кратко

Обновлено: 05.07.2024

Те́кстовый файл — компьютерный файл, содержащий текстовые данные, как правило, организованные в виде строк.

Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).

Содержание

Описание

Текстовый файл представляет из себя последовательность символов (в основном печатных знаков, принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк, в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла.

Текстовой файл может содержать как форматированный, так и неформатированный текст.

Преимущества и недостатки

  • Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или ОС, особенно если речь идёт об однобайтных кодировках вроде ASCII, которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в порядке байтов или длине машинного слова на разных платформах.
  • Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно легче восстановить данные и продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждении нескольких байтов может привести к невозможности восстановить всё содержимое файла. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
  • Формат текстового файла крайне прост и его можно изменять текстовым редактором — программой, входящей в комплект практически любой ОС.
  • У больших несжатых текстовых файлов низкая информационная энтропия — эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей, например, с магнитной ленты.
  • Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность.

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini, SGML, HTML, XML, TeX, исходных текстов языков программирования).

В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format, HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).

Расширения имён файлов

В DOS и Windows для файлов с неформатированным текстом обычно используется расширение .txt. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования, на котором написаны программы (.bas, .pas, .c).

Форматированный тест (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или языку разметки — .rtf, .htm, .html.

Кодировки

Unicode в текстовых файлах

Управляющие символы

Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS — из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.

Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).

См. также

Примечания

  • Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное.
  • Проставив сноски, внести более точные указания на источники.
  • Форматы файлов
  • Форматы текстовых документов
  • Форматы электронных книг

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Текстовый файл" в других словарях:

текстовый файл — Файл, содержащий строки написанной информации, которую можно непосредственно вывести на экран дисплея или принтер, используя обычные команды операционной системы. Файлы, создаваемые текстовыми процессорами не являются текстовыми, т.к. содержат… … Справочник технического переводчика

Файл (компьютер) — Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия

ТЕКСТОВЫЙ ПРОЦЕССОР — (текстовый редактор), компьютерная система, предназначенная для создания и обработки текста. Если система может применяться только для этой цели, тогда она называется специализированным текстовым процессором. Более распространен персональный… … Научно-технический энциклопедический словарь

файл определения — Специальный текстовый файл, содержащий директивы, используемые для связывания объектных составляющих программ (или библиотеки) в выполняемый файл. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993]… … Справочник технического переводчика

файл инициализации — Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика

Файл — У этого термина существуют и другие значения, см. Файл (значения). Файл (англ. file) блок информации на внешнем запоминающем устройстве компьютера, имеющий определённое логическое представление (начиная от простой последовательности… … Википедия

файл — сущ., м., употр. сравн. часто Морфология: (нет) чего? файла, нет? файлу, (вижу) что? файл, чем? файлом, о чём? о файле; мн. что? файлы, (нет) чего? файлов, чем? файлам, (вижу) что? файлы, чем? файлами, о чём? о файлах 1. Файлом называется массив… … Толковый словарь Дмитриева

Файл конфигурации — или конфигурационный файл используется для хранения настроек компьютерных программ, в том числе и операционных систем. Как правило, конфигурационные файлы имеют текстовый формат и могут быть прочитаны и отредактированы пользователем программы.… … Википедия

Текст в компьютере

Хранение, обработка и передача текстов – область, в которой компьютеры применяются весьма широко и достаточно давно.

Компьютеры как таковые появились в результате титанических усилий учёных разных стран. И немалая часть этих усилий была непосредственно посвящена шифрованию и дешифрованию текстов (преимущественно в военных целях).


В частности, Алан Тьюринг, создатель важнейшей для любых современных компьютеров научной основы, во время Второй Мировой войны занимался расшифровкой кодированных радиограмм немецко-фашистских войск. Нацисты производили и использовали механические шифровальные машины – от достаточно простой Enigma, более всего похожей на арифмометр, до казавшейся им весьма сложной Lorenz.

Тьюринг раз за разом находил ключ к немецкому шифру. Для этого он изобрёл и построил весьма совершенные (по тем временам) машины. Они во многом стали прототипом будущих цифровых компьютеров. По мнению многих авторов, электронная машина Colossus, созданная в британской лаборатории Тьюринга в 1943 году специально для “взлома” шифров Lorenz, и была самым первым компьютером – правда, не универсальным, как привычные современные компьютеры, а специализированным. Colossus представлял из себя металлический шкаф со схемой из 1800 радиоламп, каждая из которых сравнима по размерам с обычной, всем знакомой лампочкой.

Таким образом, обработка текста стала самой первой задачей для компьютера, и для неё был построен первый компьютер.



( Вычислительная мащина Тюринга Enigma)

Таким образом, обработка текста стала самой первой задачей для компьютера, и для неё был построен первый компьютер.

Со времён Тьюринга, разумеется, применение компьютеров для работы с текстами стало существенно более разнообразным. Современные компьютеры активно применяются для хранения , обработки и передачи текстовой информации.

Компьютерный набор и редактирование стали основным способом подготовки текстов для писателей, журналистов и т.д. Работать с текстом при помощи компьютера заметно удобнее, чем писать вручную или на печатать на машинке – хотя бы потому, что в готовый текст куда проще внести любые изменения.

Компьютерная вёрстка и подготовка к печати – неотъемлемый элемент работы практически любого современного издательства. На компьютерах готовятся и книги, и газеты, и журналы.

Все эти возможности существуют благодаря компьютерному представлению текста.

Текстовая информация представляет собой набор символов, которыми могут быть буквы, цифры, знаки препинания. В компьютерной технике символы закодированы с помощью чисел, каждый символ кодируется своим набором цифр — кодом.

Базой для компьютерных стандартов кодирования является кодировка ASCII . Однако этот стандарт рассчитан на передачу текстовой информации, которая состоит из букв английского алфавита. Таблица ASCII -кодов состоит из двух частей: стандартная (содержит коды от \(0\) до \(127\)) и расширенная (содержит символы с кодами от \(128\) до \(255\)).

Для русского языка используют чаще всего однобайтовые кодовые таблицы КОИ-\(8\) , CP-\(866\) , Windows-\(1251\) , ISO \(8859\)-\(5\) . Первые \(128\) символов идентичны с таблицей ASCII-кодов , следующие символы (с \(128\) по \(255\)) предназначены для русских букв.

Стандарт Unicode кодирует все алфавиты современных, мёртвых и вымышленных языков. Современная компьютерная техника и операционные системы работают на базе \(16\)-битной версии Unicode.

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

Здравствуйте, дорогие ребята. Начинаем наш урок. Текстовая информация. Начнем с определения что такое текст?

Текст — это любое словесное высказывание напечатанное, написанное или существующее в устной форме.

Информация, представленная в форме письменного текста, называют текстовой информацией.

Первыми носителями текстовой информации были:

  • Камень
  • Дерево
  • Береста
  • Папирус
  • Пергамент
  • Бумага

В настоящее время все больше используются электронные носители.

Поговорим о текстовых документах.

Документ — любой текст, созданный с помощью текстового редактора. К текстовому документу можно отнести:

  • Статья
  • Доклад
  • Рассказ
  • Стихотворение
  • Приглашение
  • Объявление

Созданных с помощью редакторов.

Вот несколько текстовых редакторов которые чаще всего используют на практике.

Блокнот (Notepad) — является стандартным приложением операционной системы Windows. В ней можно создавать самые простейшие текстовые документы.

Приложение WordPad — это тоже стандартный текстовый редактор с более расширенными возможностями.

Microsoft Word — это текстовый процессор, который является коммерческим продуктом от компании Microsoft.

Программа OpenOffice Writer по функциональности практически не отличается от Word, но является полностью бесплатной.

Гипертекст — это такой текст, который содержит ссылки для перехода в другие документы или части одного и того же документа. Ссылки могут быть оформлены в виде текста, картинок или баннеров. При наведении указателя мыши, указатель изменяет внешний вид. При нажатии происходит переход на новый документ.

Основные объекты текстового документа.

Самым наименьшим объектом является символ, который состоит из знаков (буквы, цифры, знаки препинания). Из символов образуются слова, слова объединяются в строки, между словами ставится знак пробела. Абзац начинается с отступа, между абзацами ставится небольшой интервал. Далее все фрагменты объединяются в страницы. Таким образом получаем текстовый документ.

Рассмотрим основные этапы подготовки документа.

Ввод текста — набираем с клавиатуры текст. Далее идет процесс редактирования текста, форматирования текста и печать.

Рассмотрим эти этапы подробнее.

При вводе текста нужно соблюдать правила. Перед вами предложения, которые написаны разными способами. Первые два примера являются не правильными, третий правильный.

  1. Пой ,Вася — не правильно
  2. Пой,Вася — не правильно
  3. Пой, Вася — правильно

Дело в том, что пробел нужно ставить после знаков препинания, но не до.

Короткое тире или знак минус ставят в арифметических выражениях пробелы не ставятся до и после минуса, длинное тире пробелы ставятся до и после тире.

Когда набираете текст избегайте двух и более пробелов между словами.

Для создания отступов в абзацах используйте клавишу Tab.

Для выравнивания текста по центру нельзя использовать пробелы, для этого применяют кнопку выравнивания.

Для перехода на новую строку нужно иметь в виду что обычно текст переходит автоматически на новую строку. Для принудительно перехода на новую строку используют клавишу Shift + Enter.

Если мы нажимаем просто на Enter, то переходим на начало нового абзаца.

Рассмотрим процесс редактирования текста.

Под редактированием текста понимают изменения содержания документа. Сюда относится замена слов на их синонимы.

Исправление синтаксических орфографических ошибок.

Удаление, копирование и вставка фрагментов теста.

Форматирование текста под ним понимают изменение внешнего вида документа и его отдельных частей. К операциям форматирования относятся выравнивание абзацев, форматирования шрифта.

Читайте также: