Реферат форматы текстовых файлов и их отличия

Обновлено: 30.06.2024

* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

Логическая функция EOLN………………………..-6- - -7-

Логическая функция SEEKEOLN…………………-7-

Текстовые файлы связываются с файловыми переменными, принадлежащими стандартному типу text. Текстовые файлы предназначены для хранения тек­стовой информации. Именно в такого типа файлах хранятся, например, ис­ходные тексты программ. Компоненты (записи) текстового файла могут иметь переменную длину, что существенно влияет на характер работы с ними.

Для доступа к записям применяются процедуры read, readln, write, writeln. Они отличаются возможностью обращения к ним с переменным количеством фактических параметров, в качестве которых могут использоваться символы, строки и числа. Первым параметром в любой из перечисленных процедур может стоять файловая переменная. В этом случае осуществляется обращение к дисковому файлу или логическому устройству, связанному с переменной процедурой assign. Если файловая переменная не указана, происходит обра­щение к стандартным устройствам input и output.

Обеспечивает ввод символов, строк и чисел. Формат обра­щения:

READ ( , ) или READ ( )

Здесь — список ввода: последовательность из одной или более переменных типа char, string, а также любого целого или вещественного типа.

При вводе переменных типа string количество считанных процедурой и поме­щенных в строку символов равно максимальной длине строки, если только рань­ше не встретились символы cr или eof. В этом случае сами символы cr и eof в строку не помещаются. Если количество символов во входном потоке данных больше максимальной длины строки, "лишние" символы до конца строки отбра­сываются, а новое обращение к read возвращает пустую строку. Таким образом, процедура read не в состоянии прочесть последовательность строк: первая строка будет прочитана нормально, а все последующие окажутся пустыми. Для ввода по­следовательности строк нужно использовать процедуру readln (cm. ниже).

При вводе числовых переменных процедура read вначале выделяет подстро­ку во входном потоке по следующему правилу: все ведущие пробелы, сим­волы табуляции и маркеры конца строк eoln пропускаются; после выделе­ния первого значащего символа, наоборот, любой из перечисленных символов или символ eof служат признаком конца подстроки. Выделенная таким образом подстрока затем рассматривается как символьное представ­ление числовой константы соответствующего типа и преобразуется во внут­реннее представление, а полученное значение присваивается переменной. Если в подстроке был нарушен требуемый формат представления численной константы, возникает ошибка ввода/вывода. Если при пропуске ведущих пробелов встретился символ eof, переменная получает значение 0. Отметим, что в Турбо Паскале не предусмотрен ввод шестнадцатеричных констант.

При использовании процедуры read применительно к стандартному устрой­ству input, т. е. при вводе с клавиатуры, символьные строки запоминаются в буфере, который передается процедуре только после нажатия на клавишу . Это позволяет редактировать данные при их вводе. Для редактирова­ния используются следующие клавиши:

? , + , — стирают символ слева от курсора;

? > — восстанавливает символ за символом предыдущую строку ввода;

? + , — завершает ввод по процедуре read; оставшиеся "лишние" символьные параметры принимают значение chr (26), строки возвращаются пустыми, а численные переменные остаются без изменения.

Максимальная длина буфера ввода при работе с клавиатурой составляет 127 символов. Ввод с клавиатуры по процедуре read сопровождается эхо-повтором вводимых символов на экране ПК.

Процедура read прекрасно приспособлена к вводу чисел. При обращении к ней за вводом очередного целого или вещественного числа процедура "перескакивает" маркеры конца строк, т. е. фактически весь файл рассмат­ривается ею как одна длинная строка, содержащая текстовое представление чисел. В сочетании с проверкой конца файла функцией eof процедура read позволяет организовать простой ввод массивов данных, например, так:

m : array [1..N] of real; i : Integer; begin

assign(f, 'prog.dat') ; reset(f); i := 1;

while not EOF(f) and (i является символ cr и курсор помещается в на­чало текущей строки.

Обеспечивает вывод информации в текстовый файл или передачу ее на логическое устройство. Формат обращения:

WRITE ( , ) или WRITE ( )

Здесь — список вывода: последовательность из одного или бо­лее выражений типа char, string, boolean, а также любого целого или ве­щественного типа.

Файловая переменная , если она указана, должна быть предваритель­но описана как переменная типа text и связана с именем файла или логи­ческим устройством процедурой assign. Если файловая переменная отсут­ствует, подразумевается вывод в стандартное устройство output, которое обычно связано с экраном ПК.

Любой элемент списка вывода может иметь форму

OutExpr [ : MinWidth [ : DecPlaces ] ]

? outexpr — выводимое выражение;

? minwidth, decplaces — выражения типа word (квадратные скобки озна­чают возможность отсутствия заключенных в них параметров).

Подпараметр minwidth, если он присутствует, указывает минимальную ширину поля, в которое будет записываться символьное представление зна­чения outexpr. Если символьное представление имеет меньшую длину, чем minwidth, оно будет дополнено слева пробелами, если — большую дли­ну, то подпараметр minwidth игнорируется и выводится необходимое число символов.

Подпараметр decplaces задает количество десятичных знаков в дробной части вещественного числа. Он может использоваться только совместно с minwidth и только по отношению к выводимому выражению одного из ве­щественных типов.

Если ширина поля вывода не указана, соответствующий параметр выводится вслед за предыдущим без какого-либо их разделения.

Символы и строки передаются выводному файлу без изменений, но снаб­жаются ведущими пробелами, если задана ширина поля вывода и эта шири­на больше требуемой для вывода.

При выводе логических выражений в зависимости от их значения выводятся

строки true или false. (Ввод логических констант процедурами read или readln не предусмотрен).

? s — пробел для положительного и знак "—" для отрицательного чисел;

? е — символ десятичного основания;

? * — знак "+" или "—" в зависимости от знака десятичного порядка числа.

Если подпараметр minwidth опущен, принимается его значение по умолча­нию (23). Если minwidth меньше 10, считается, что он равен 10.

Если подпараметр decplaces равен нулю, ни дробная часть числа, ни деся­тичная точка не выводятся. При отрицательном значении decplaces этот параметр игнорируется и число выводится в экспоненциальном формате с учетом minwidth. Если значение decplaces больше 18, принимается значе­ние 18. Следует учесть, что при указании подпараметра decplaces вещест­венное число всегда будет выводиться в формате с фиксированной точкой и требуемым количеством знаков в дробной части, даже если значение подпа­раметра minwidth окажется недостаточным для размещения целой части, в этом случае значение minwidth автоматически увеличивается.

При выводе на экран в случае, когда длина выводимой последовательности символов превышает ширину экрана или созданного на нем окна, "лишние" символы переносятся на следующую экранную строку. При заполнении эк­рана или окна его содержимое сдвигается вверх на одну строку.

Эта процедура полностью идентична процедуре write за исключением того, что выводимая строка символов завершается кодами cr и lf. При вызове writeln можно опускать параметр )

Если параметр опущен, функция проверяет стандартное устройство

Существует некоторое отличие в работе функций eoln и eof с дисковыми файлами и логическими устройствами. Дело в том, что для логического уст­ройства невозможно предвидеть, каким будет результат чтения очередного символа. Поэтому при работе с логическим устройством функция eoln воз­вращает true, если последним считанным с устройства символом был eoln или eof, в то время как при чтении с диска true возвращается в случае, ес­ли следующим считываемым символом будет eoln или eof. Аналогичное раз­личие наблюдается и в функции eof: для логического устройства true воз­вращается в случае, если последним символом был eof, а при чтении с диска — если следующим считываемым символом будет eof. Иными слова­ми, функции тестируют соответствующие признаки для логического устрой­ства после очередного чтения, а для файла — перед чтением.

Логическая функция seekeoln.

Пропускает все пробелы и знаки табуляции до маркера конца строки eoln или до первого значащего символа и возвра­щает true, если маркер обнаружен. Формат обращения:

Если параметр опущен, функция проверяет стандартный файл input.

Логическая функция seekeof.

Пропускает все пробелы, знаки табуляции и маркеры конца строки eoln до маркера конца файла или до первого знача­щего символа и возвращает true, если маркер обнаружен. Формат обращения:

Если параметр опущен, функция проверяет стандартный файл input.

В следующем примере, иллюстрирующем работу с текстовым файлом, под-считывается общее количество символов в файле, и результат делится на 40 000 — таким способом можно оценить объем рукописи в так называемых учетно-издательских листах:

f: text; s: String; const

WriteLn('Объем = ',Sum/40000:6:2,' уч.изд.л.') end.

Функцию нельзя использовать для текстовых файлов. Чтобы переместить указатель в конец типизированного файла, можно написать:

seek (FileVar, FileSize(FileVar));

где filevar — файловая переменная.

Возвращает значение типа longint, содержащее порядко­вый номер компонента файла, который будет обрабатываться следующей операцией ввода/вывода. Формат обращения:

Функцию нельзя использовать для текстовых файлов. Первый компонент файла имеет порядковый номер 0.

Распространение текстовых файлов и проблемы, связанные с ними. Оформление текста, ряд ограничений для онлайновых документов. Редакторы неформатированных текстов и редакторы, создающие текст с элементами разметки. Примеры кодирования русского текста.

Рубрика Программирование, компьютеры и кибернетика
Вид лекция
Язык русский
Дата добавления 18.05.2014
Размер файла 140,6 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Форматы текстовых файлов

Текстовые файлы - наиболее распространенный тип данных в компьютерном мире. Существуют несколько проблем, связанных с текстовыми файлами. Первая - чрезвычайно большое количество символов, требующихся для поддержки различных языков. Американские программисты для работы со 128 символами используют набор символов US ASCII (американский стандартный код для обмена информацией). Для поддержки других языков зачастую не хватает и 256 символов, поэтому сейчас осуществляется постепенный переход к кодировке Unicode, в которой для хранения одного символа отводится уже два байта (т.е. имеется возможность закодировать 65 536 различных символов).

Вторая проблема заключается в том, что люди хотят, чтобы распечатываемые документы содержали графики, диаграммы, примечания, заголовки и чтобы при этом использовались различные шрифты. Документы, распространяемые в Интернет (онлайновые документы), могут содержать мультипликацию, ссылки на различные сетевые ресурсы и звуковое сопровождение. текстовый файл редактор онлайновый

Многие текстовые файлы передаются в виде простого текста (plain text). Простой текст сложно сделать привлекательным и легко читаемым, так как в нем нет шрифтов различных начертаний, графики, заголовков, подзаголовков и т.д. Эти дополнительные особенности носят название разметки текста (markup).

Говоря о разметке текста, выделяют понятия физической и логической разметки. При использовании физической разметки текста указывается точный вид каждого фрагмента. Например, "центрированный текст, 14-м кеглем, жирный, гарнитура Times". При логической разметке указывается логическое значение данного фрагмента, например, "это заголовок главы". Эти два способа разметки предназначаются, как правило, для использования в разных ситуациях. Для того чтобы распечатать текст на принтере, необходимо использовать физическую разметку. Должны быть приняты решения о размере полей и абзацных отступах. Ранние версии текстовых процессоров использовали только физический тип разметки. При этом для каждого фрагмента указывался шрифт, размер и стиль.

При обмене информацией с другими людьми физическое оформление текста накладывает ряд ограничений, особенно для онлайновых документов. Размер экрана, разрешение, шрифты различны для различных систем. По этим причинам все чаще используется логическое оформление текста. В некоторых случаях логическое оформление практически необходимо: при создании электронных документов типа страниц WWW или при создании и публикации объемных трудов, таких как книги.

Для сохранения разметки документов при передаче текстовой информации от машины к машине применяют разные способы. Текстовые процессоры и издательские системы используют специально разработанные форматы файлов, содержащие не только текст, но и информацию о том, как он должен быть оформлен. Основная проблема здесь в несовместимости таких форматов, хотя наиболее сложные программы обычно могут читать файлы в форматах программ-конкурентов. Примерами такого подхода являются текстовые процессоры Word и StarWriter.

При другом подходе непосредственно в текст документа вставляются специальные команды разметки. Даже если у вас нет программного обеспечения, поддерживающего такой формат, вы все же сумеете в нем разобраться. Существует немало способов подобного представления разметки текста, в том числе:

o HyperText Markup Language (HTML), использующийся в World Wide Web;

o TeX и LaTeX, пользующиеся популярностью у многих академических изданий, а также у математиков, физиков, химиков и даже музыкантов.

Примерами программ, которые позволяют разметить текст подобным образом, служат Netscape Composer и LyX (KLyX).

Файлы, созданные разными редакторами, зачастую имеют уникальные расширения, позволяющие, не заглядывая внутрь документа, догадаться о способах разметки текста. Так файлы, созданные редакторами подготовки plain-текста, часто имеют расширение .txt, а подготовленные в редакторе Lyx - .lyx. Текстовый процессор Word по умолчанию создает файлы в формате MS Word (расширение .doc), но поддерживает и другие форматы, например RTF (расширение .rtf). Документы, содержащие команды разметки языка HTML, имеют расширение .html или .htm.

Очевидно, что невозможно перечислить все текстовые редакторы. Многие из них "заточены" под ту или иную специфическую деятельность. В списке, рассмотренном ниже, представлена лишь небольшая часть текстовых редакторов.

Редакторы неформатированных текстов

встроен в операционную систему Windows, понятен и прост и использовании;

McEdit

имеет сходство с редактором Edit из MS DOS, компонента файлового менеджера mc (Midnight Commander) ОС Linux;

KEdit

простейший текстовый редактор, входит в состав KDE Linux;

KWrite

текстовый редактор, имеющий ряд дополнительных настроек по сравнению с другими простейшими текстовыми редакторами;

Emacs

совмещает в себе функции файлового менеджера и текстового редактора; одной из отличительных черт является возможность создание макрокоманд (макросов); имеется во всех клонах Unix, в том числе и Linux; Emacs можно использовать и в MS Windows.

Редакторы, создающие текст с элементами разметки

служит для создания разнообразных печатных документов, является компонентом офисных приложений в MS Windows;

StarWriter

входит в состав программы StarOffice, внешним видом и функциональностью он похож на Word, одинаково хорошо работает как в MS Windows, так и в ОС Linux;

LyX (KLyX в KDE)

современный текстовый редактор, предназначенный для людей, которые хотят получить документ, выглядящий профессионально, но затратить на его создание минимум времени; редактор вставляет в текст команды разметки TeX и LaTeX;

Netscape Composer

вставляет в текст команды разметки языка HTML, существуют версии как для ОС Linux, так и для MS Windows.

Кодирование русского текста

Исторически сложилось так, что для представления печатных символов (кодирования текста) в первых ЭВМ отвели 7 бит. 2 7 =128. Этого количества вполне хватало для кодирования всех строчных и прописных букв латинского алфавита, десяти цифр и различных знаков и скобок. Именно такой, 7-битной, является таблица символов ASCII (американский стандартный код для обмена информацией), подробную информацию о которой вы можете получить при помощи команды man ascii операционной системы Linux.

Когда возникла необходимость кодировать национальные алфавиты, то 128 символов стало недостаточно. Было решено перейти на кодирование с помощью 8 бит (т.е. одного байта). В результате количество символов, которые можно закодировать таким образом стало равно 2 8 =256. При этом символы национальных алфавитов располагались во второй половине кодовой таблицы, т.е. содержали единицу в старшем разряде байта, отведенного для кодирования символа. Так появился стандарт ISO 8859, содержащий множество кодировок для наиболее распространенных языков.

Среди них была и одна из первых таблиц для кодировки русских букв - ISO 8859-5 (воспользуйтесь командой man iso_8859_1 для получения кодов русских букв в этой таблице).

Так как из всех операционных систем, распространенных в то время, самыми удобными средствами работы с сетью обладали различные клоны операционной системы Unix, то эта кодировка стала фактическим стандартом в этих системах. Таковой она является и сейчас в ОС Linux. И именно эта кодировка чаще всего применяется для обмена почтой и новостями в Интернет.

После появления ОС Windows от фирмы Microsoft выяснилось, что альтернативная кодировка по некоторым причинам для нее не подходит. Снова передвинув русские буквы в таблице (появилась возможность - ведь псевдографика в Windows не требуется), получили кодировку Windows 1251 (Win-1251).

Но компьютерные технологии постоянно совершенствуются и в настоящее время все большее число программ начинает поддерживать стандарт Unicode, который позволяет кодировать практически все языки и диалекты жителей Земли.

Итак, в различных ОС предпочтение отдается разным кодировкам. Для того чтобы стало возможным чтение и редактирования текста, набранного в другой кодировке, используются программы перекодирования русского текста. Некоторые текстовые редакторы содержат встроенные перекодировщики, позволяющие читать текст в различных кодировках (Word и др.). Мы для перекодировки файлов будем использовать ряд утилит в ОС Linux, назначение которых ясно из названия: alt2koi, win2koi, koi2win, alt2win, win2alt, koi2alt(откуда, куда, цифра 2 (two) схожа по звучанию с предлогом to, указывающим направление). Эти команды имеют одинаковый синтаксис:команда выходной_файл.

Так как в MS DOS и Linux по разному кодируется перевод строки, рекомендуется выполнить еще команду "fromdos":

Команда с обратным действием называется "todos" и имеет такой же синтаксис.

Редакторы plain-текста

Простые и удобные в использовании редакторы неформатированного текста (plain-text) постоянно требуются программистам при написании текстов программ, создателям Web-документов, которых по ряду причин не устраивают Web-редакторы, людям, использующим TeX или LaTeX, и многим другим. Принципы создания, сохранения и редактирования документов в них очень схожи и не требуют от пользователя кропотливой работы по их освоению. Мы познакомимся с программой NotePad, входящей в состав MS Windows, а также с редакторами, входящими в состав среды KDE (Linux): KEdit, KWrite, McEdit. Затем мы рассмотрим программу Emacs, для которой создание plain-текста есть лишь малая часть ее потенциальных возможностей.

NotePad (Блокнот)

Редактор NotePad является одним из самых распространенных средств подготовки неформатированного текста в среде MS Windows. Окно редактора содержит строку меню, включающую три пункта: Файл, Правка и Поиск.

Меню Файл служит для работы с файлами. Оно позволяет создавать, сохранять и открывать существующий файл. Команды редактирования документа (копирование, вставка, удаление фрагмента текста) осуществляются при помощи меню Правка. Для поиска фрагмента текста используется меню Поиск.

NotePad допускает еще один способ вызова команд редактирования документа - контекстное меню. Для вызова контекстного меню нужно выделить некоторый элемент документа, а затем щелкнуть правой кнопкой мыши. Для закрытия контекстного меню без выбора команды достаточно щелкнуть по кнопке мыши, поместив ее курсор за пределами меню, или нажать клавишу Esc.

Для выделения частей текста и перемещения используются различные комбинации клавиш, представленные в таблице.

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

Текстовые файлы предназначены для хранения и обработки текстовой информации в электронном виде. Существует много различных видов текстовых форматов, которые различаются между собой методами кодировки текста, возможностями его обработки, а также совместимостью с различными текстовыми редакторами.

Это старейший текстовый формат, аналоги современного блокнота были еще на первых ПК. Является наиболее универсальным. Документы txtоткрываются текстовыми редакторами, работающими в любой операционной системе.

Формат очень простой и не содержит ничего, кроме текста. Форматирование не поддерживается — сохраняются только абзацы, отступ и заглавные буквы. Поэтому файлы-txt отличаются маленькими размерами. Формат устойчив к повреждениям. При повреждении части файла можно восстановить или обработать остальную часть документа.

Специально разработан программистами компаний Microsoft и Adobe для обмена файлами между пользователями. Может быть открыт и обработан на любой платформе. Поддерживается многими приложениями. В настоящее время rtf введен в Windows в качестве Clipboard-формата, это дает возможность обмениваться данными между различными прикладными программами.

Документ-rtf поддерживает сложное форматирование. Помимо текста может содержать различные рисунки, таблицы, вставки и сноски. В нем могут использоваться несколько видов шрифтов. Формат устойчив к повреждению файлов. Так как в rtf не используются макросы, он считается более безопасным чем формат doc.

Было время, когда формат doc использовался для простых и не отформатированных текстовых документов, а Microsoft Word являлся обычным текстовым редактором. Однако в начале 90-х годов ситуация начала меняться. И приложение, и формат постоянно обновлялись. При этом каждая новая версия все больше отличалась от предыдущей.

Сегодня doc предоставляет огромные возможности по обработке текста и вставке в документ различных изображений, диаграмм, таблиц, ссылок. Может включать в себя сценарии и макросы. Но нужно помнить, что формат является закрытым, многие документы в этом формате корректно отображаются только в самой программе MS Word.

Формат docx

Впервые был применен в MS Word 2007. Его главное отличие от формата doc — использование zip-компрессии для уменьшения объема файла. Представляет собой архив с данными, содержащий помимо текста в формате XML, изображения, стили текста, форматирование и другие данные. Причем текстовые файлы и графика хранятся в отдельных документах.

Формат HTML

HTML — стандартный язык разметки гипертекстовых страниц в Интернете. Есть и другие языки разметки гипертекста, но большая часть страниц сайтов Интернета размечена именно на языке HTML . Такие страницы успешно интерпретируются браузерами, которые отображают их на экранах различных электронных устройств в удобном для человека виде.

HTML является теговым языком разметки гипертекста: чтобы превратить текст в гипертекст, используют разделители (дескрипторы), для краткости названные тегами. Вот пример тега: strong > — этот открывающий тег обеспечивает вывод текста жирным шрифтом до тех пор, пока не встретится закрывающий тег strong >.

Формат PDF

PDF файл сохраняет все шрифты, цвета и структуру исходного документа независимо от программного обеспечения и аппаратных средств. Изображения, водяные знаки, гиперссылки и комментарии могут быть добавлены в PDF документ.

PDF документы могут содержать интерактивные элементы управления. Вот почему PDF широко используется в PDF формах, которые могут быть заполнены в просмотрщике PDF или браузере. PDF файлы сжаты, поэтому они загружаются значительно быстрее и требуют значительно меньше места для хранения.

Основное назначение текстовых редакторов - создавать текстовые файлы, редактировать тексты, просматривать их на экране, изменять формат текстового документа, распечатывать его на принтере. Набираемый на клавиатуре компьютера текст воспроизводится на экране дисплея в рабочем поле редактора. Специальный значок - курсор указывает то место на экране, на которое пользователь в данный момент может оказывать воздействие (создавать, изменять символы и т. д.) с помощью редактора. Работая с текстовым редактором, можно получить на экране информацию о текущем состоянии курсора, т.е. его координатах на экране (номер строки и позиции в строке), а также о номере страницы текста, его формате, используемом шрифте и т.д.

Обычно текстовые редакторы включают в себя следующие возможности:

— корректирование набранного текста обычным способом, т. е. изменение букв, слов и т. д.;

— вырезание фрагментов текста, запоминание их в течении текущего сеанса работы, а также в виде отдельных файлов;

— вставка фрагментов в нужное место текста;

— нахождение в тексте нужных слов или предложений;

— замена слов одно па другое частично или полностью по всему тексту;

— форматирование текста, т. е. придание ему определенного вида последующим параметрам: ширина текстовой колонки, абзац, поля с обеих сторон, верхнее и нижнее поле, расстояние между строками, выравнивание края строк;

— автоматическая разбивка текста на страницы с заданным числом строк;

— автоматическая нумерация страниц;

— автоматический ввод подзаголовков в нижней или верхней части страницы;

— выделение части текста жирным, наклонным или подчеркнутым шрифтом;

— переключение программы для работы с другим алфавитом;

— табуляция строк, т. е. создание постоянных интервалов для представления текста в виде колонок;

— распечатка текста или отдельных его кусков;

Наиболее совершенные редакторы обладают также дополнительными возможностями, такими как:

— возможность увидеть па экране текст в готовом виде, т. е. таким, каким он будет распечатан принтером;

— широкий выбор шрифтов;

— вставка в текст формул, таблиц, рисунков;

— создание нескольких текстовых колонок на одной странице;

— автоматический поиск и исправление грамматических ошибок;

— выбор готовых стилей и шаблонов.

Текстовые процессоры - компьютерная программа, используемая для написания и модификации документов, компоновки макета текста и предварительного просмотра документов в том виде, в котором они будут напечатаны. Текстовые процессоры позволяют форматировать (оформлять) текст и вставлять в него нетекстовые объекты (от таблиц и картинок до видеофайлов). Следовательно, созданные в текстовых процессорах документы хранят не только текстовые данные, но также команды разметки текста на специальном языке, ссылки на связанные объекты или сами объекты в виде двоичных кодов.

Каждый текстовый процессор сохраняет документ в своем формате. Поэтому документ, созданный в одном приложении, может некорректно отобразиться, если его открыть в другом приложении.

Microsoft Word - мощный текстовой процессор, предназначенный для выполнения всех процессов обработки текста: от набора и верстки, до проверки орфографии, вставки в текст графики,распечатки текста. Он работает с многими шрифтами, как с русским, так и с любым из двадцати одного языка мира. В одно из многих полезных свойств Word входит автоматическая коррекция текста по границам, автоматический перенос слов и правка правописания слов. Word обеспечивает поиск заданного слова или фрагмента текста, замену его на указанный фрагмент, удаление, копирование во внутренний буфер. Можно так же автоматически включать в текст дату, время создания, обратный адрес и имя написавшего текст. . Word позволяет открывать много окон для одновременной работы с несколькими текстами, а так же разбить одно активное окно по горизонтали на два и выровнять их.

LibreOffice Writer - текстовый процессор для всех видов документов. Writer содержит все необходимые функции современного полнофункционального текстового редактора и инструмента публикаций.

Он достаточно прост для создания быстрых заметок, достаточно мощный, чтобы создать целые книги с содержанием, диаграммами, индексами и т.д. Сосредоточьтесь на написании текста, а Writer заставит его прекрасно выглядеть.

Гост

ГОСТ

Формы текстовых файлов — это форматы информационных файлов, в которых содержатся текстовые данные.

Введение

Под текстовым файлом понимается файл компьютера, который содержит информационные данные в виде текста.

Текстовые файлы: сущность, достоинства и недостатки

В состав текстового файла входит последовательный набор символьных знаков, как правило, печатных, которые принадлежат какому-либо символьному набору. Набор символов состоит обычно из строк, которые в сегодняшних системах отделены друг от друга строковыми разделителями.

Основными преимуществами текстовых файлов считаются:

  1. Текстовые файлы обладают универсальностью, то есть они могут считываться в любой операционной системе. Это в частности относится к самым известным однобайтным кодам типа ASCII, не подверженным проблемам, присущим другим форматам файлов. То есть они не чувствительны к разнице в очерёдности байтов или размеру машинных слов в различных системах.
  2. Свойство устойчивости. Все символьные знаки и слова в текстовом файле являются самодостаточными, и при повреждении части данных в этом файле, они могут быть восстановлены или можно выполнить действия с остальными данными. Как известно, у архивных (сжатых) или бинарных файлов такие даже незначительные повреждения могут полностью уничтожить файл.
  3. Текстовые файлы имеют очень простой формат, который возможно менять с помощью программ редактирования, входящих в состав всех операционных систем.

Готовые работы на аналогичную тему

К недостаткам следует отнести:

  1. Не архивированные (не сжатые) текстовые файлы требуют больше памяти, чем необходимый минимум. Но благодаря этой избыточности они мало подвержены потерям данных при их передаче и приёме с различных носителей.
  2. Низкая эффективность отдельных операций с текстовыми файлами. К примеру, когда в файле попадается число, компьютеру, вернее его операционной системе, перед началом действий над ним нужно преобразовать его в формат, с которым работает система. Эта операция, которая конвертирует числовые данные, достаточно сложна. Для перехода на строку с номером тысяча, необходимо прочитать девятьсот девяносто девять строк, которые расположены перед ней. Есть сложности при замене одной строки на другую и так далее. Это является причиной того, что при обработке значительных объёмов информации, текстовые файлы используют лишь в качестве промежуточного формата.

Формы текстовых файлов

Простота текстовых файлов позволяет их довольно часто применять для сохранения служебных данных, таких как логи, поскольку процедура прибавления в окончание текстовых файлов новой информации не связана с затратой больших компьютерных мощностей. И она не зависит от уже присутствующего объёма информации в файле и типа прибавляемых текстовых данных. Текстовые форматы являются базой для некоторых специальных форматов, типа HTML, XML, некоторых других, а также исходных текстов программных языков.

В дальнейшем формы текстовых документов получили существенный прогресс в своём развитии, и фирма Microsoft выпустила в свет новый формат Rich Text Format – RTF. Он представляет из себя формат на базе кросс-платформы, который может сохранять текстовые данные. Формат RTF может сохранять форматирование и делать вставки в текст разнообразных объектов, таких как сноски, формульные выражения, табличные данные. Этот формат использует возможности технологии слов управления. Эти слова обозначаются специальной символикой и по этой причине документу требуется больше места в памяти. Документы в формате RTF можно редактировать следующими программами:

Читайте также: