Системы ввода документов и системы обработки образов документов реферат

Обновлено: 05.07.2024

Программное обеспечение автоматизации процессов и документооборота

1. Зачем нужна автоматизация документооборота

Существует три вида лжи: ложь, наглая ложь и статистика. По некоторым статистическим данным:

на поиски и согласование документов руководитель тратит до 45% рабочего времени;

рядовые сотрудники тратят на поиск документов до 30% рабочего времени;

70% документов создаются заново вместо изменения существующих;

6% документов безвозвратно теряются;

каждый внутренний документ копируется до 20 раз;

стоимость архивного хранения бумажных документов на 80 % выше по сравнению с электронными;

общие потери времени, связанные с документооборотом – 8 часов в неделю (20%) на каждого сотрудника.

Очевидно, что в зависимости от многих факторов (страна, время, компания, и т.д.) проценты могут быть разными. Но неопровержимым фактом является то, что проблема существует и ее нельзя игнорировать.

2. Терминология

Системы автоматизации задач делопроизводства вошли в широкий обиход на Западе значительно раньше, чем у нас, соответственно, сложилась и своя терминология, описывающая различные области документооборота.

Наиболее распространены в западной практике следующие термины:

EDM (Electronic Document Management) – сводное название систем электронного документооборота.

DMS (Document Management Systems)– наиболее близкий по смыслу перевод – электронные архивы документов;

Enterprise-centric EDM – корпоративные системы документооборота, в которых совмещены средства создания, редактирования, публикации и хранения документов (Word, Excel, электронный архив, почта, планирование встреч, согласование документов и т.д. в одном флаконе)

Information Management – Системы управления информацией, называемые также порталами, обеспечивают агрегирование, управление и доставку информации через сети Internet, intranet и extranet.

Imaging – Системы, преобразующие информацию с бумажных носителей в цифровой формат, как правило, это TIFF (Tagged Image File Format), после чего документ может быть использован в работе уже в электронной форме.

DocFlow Management – системы маршрутизации движения документов;

WorkFlow Management – системы маршрутизации потоков работ, заданий.

Также существует большое количество смежных тем, например:

Document Warehousе (Хранилища документов)

Knowledge Management (Управление знаниями)

Поэтому, говоря о системах электронного документооборота необходимо уточнять, о какой именно функциональности идёт речь.

3. Подсистемы документооборота

Перечень наиболее распространенных подсистем документооборота:

Системы автоматизации делопроизводства;

Системы ввода документов и системы обработки образов документов;

Системы управления стоимостью хранения документов;

Системы маршрутизации документов;

Системы комплексной автоматизации бизнес-процессов.

3.1. Системы автоматизации делопроизводства

Функции автоматизации делопроизводства в том или ином виде представлены в любой системе автоматизации документооборота.

Как мы уже отметили, документы хранятся в бумажном виде, в специальном архиве, но в базе данных отображается их текущее местоположение и статус, включая атрибуты контроля исполнения. Обычно в системах делопроизводстве различают входящие и исходящие документы, нормативно-распорядительные документы, документы коллегиальных органов управления, справочные документы и пр. Документы, находящиеся на контроле исполнения, подразделяются по исполнителям, статусу исполнения, срокам исполнения и прочее. Каждый документ в системе представляет собой запись в базе данных, характеризующуюся набором значений атрибутов карточки. Помимо учета и поиска документов в базе данных, система должна обеспечивать генерацию отчетов, позволяющих получить ведомости исполнения документов и прочую сводную информацию.

3.2. Архивы документов

Архив документов это то, что собственно хранит электронный документ. При этом может храниться либо образ документа, либо его содержание, либо и то и другое. Помимо собственно хранения документов, архив должен обеспечивать навигацию по иерархии документов и их поиск.

В отличие от поиска по атрибутам документов, который имелся и в системах предыдущего класса, архивы документы должны обеспечивать полнотекстовый поиск по содержимому текстовых фрагментов в документе. В предельном случае поисковый механизм должен обладать некоторым интеллектом, то есть обеспечивать поиск близких грамматических конструкций, а также поиск близких по смыслу слов.

В отличие от систем предыдущего класса, в архивах хранятся сами документы, и по этому система должна обеспечивать разграничение прав доступа к документам. Пользователь может идентифицироваться либо посредством сетевого имени, либо с помощью специального имени и пароля определенного в системе управления архивом. Помимо разделения прав доступа на уровне пользователей система должна обеспечивать выделение групп пользователей или ролей.

Следующей функцией архива документов является обеспечение возможности групповой работы с документами, находящимися в стадии создания – это функция блокировок документов или Check-In/Check-Out контроль. Если один из пользователей системы начинает редактировать документ, он блокируется для доступа других пользователей до тех пор, пока с ним не закончится работа.

Еще одной функцией архива является поддержка контроля версий. Версии документов могут фиксироваться либо автоматически, либо по инициативе пользователя. В случае необходимости пользователь может вернуться к одной из предыдущих версий документа.

К сервисным функциям архива документов относятся возможность создания резервных копий документов без прекращения работы системы, интеграция с системами обеспечения оптимальной стоимости хранения данных и прочее.

3.3. Системы ввода документов и системы обработки образов документов

Одной из самостоятельных функций систем документооборота является ввод документов в архив. Под этим понимается перевод документов из бумажного вида в электронный. В простейшем случае эта процедура сводиться к простому сканированию. Однако, как правило, простого сохранения образа документа оказывается недостаточно.

Образ документа может потребовать так называемого аннотирования, наложения на образ документа различных дополнительных образов, выделений, текстовых пометок и прочее. Помимо этого, образ документа должен быть снабжен набором атрибутов, который позволит его идентифицировать в системе делопроизводства и в архиве документов. Эти операции производятся вручную.

Более сложной функцией является автоматическое распознавание содержимого образа документа и формирование документа, содержащего его текст. Для этого предназначены программы, относящиеся к классу ПО распознавания текста. Еще более сложной функцией является распознавание содержимого форм. При этом программа определяет наличие записей, в том числе и рукописных в определенных полях бланка документа, распознает его содержимое и автоматически заполняет значения атрибутов данного документа в системе. При необходимости значения определенных полей бланка может выбираться из определенного в системе справочника.

3.4. Системы управления стоимостью хранения документов

Совершенно очевидно, что при сохранении в архиве образов документов объемы хранения могут быстро расти и достигать значительных объемов. При этом интенсивность обращения к документам, находящимся в архиве далеко не равномерна. Документы, находящиеся в работе, очевидно, затребуются достаточно часто, в то время как доступ к документам, работа с которыми уже завершена, осуществляется очень редко. Соответственно, система может обеспечивать различную оперативность доступа к различным документам. Так как стоимость хранения документов в архиве, как правило, обратно пропорциональна скорости доступа, то можно воспользоваться отмеченной закономерностью для оптимизации стоимости содержания архива.

3.5. Системы маршрутизации документов

Системы маршрутизации документов занимаются непосредственно пересылкой документов на рабочие места исполнителей, сбор информации о текущем статусе документов, осуществляют консолидацию документов по завершению работы с ними на отдельных этапах, а также обеспечивают средства доступа к информации о текущем состоянии работ с документами.

Системы маршрутизации, как правило, содержат средства описания типовых маршрутов прохождения документов в организации. На основании разработанных маршрутных схем могут порождаться экземпляры бизнес-процессов работы с документами. В данном случае можно говорить о жесткой маршрутизации.

Администратор системы и менеджер, курирующий конкретный бизнес-процесс, может контролировать текущее состояние маршрута и вносить различные корректирующие воздействия в случае необходимости.

При маршрутизации документов возможны две схемы, назовем их Off-Line и On-Line. В первом случае при пересылке документа на рабочее место пользователя происходит его физическое извлечение из архива документов и доставка (например, с помощью электронной почты) на рабочее место клиента. По завершению работы документ обратно погружается в архив.

В этом случае система маршрутизации сама является клиентом архива документов и вносит соответствующую информацию в учетную базу данных.

Вторая схема не подразумевает физического перемещение документа. Система маршрутизации документов обеспечивает клиенту интерфейс для доступа к заданиям на обработку документов.

Обе схемы маршрутизации имеют свои достоинства и недостатки. К сожалению, в связи с ограниченностью пространства, обсуждения нюансов использования систем маршрутизации мы вынесем в отдельные публикации.

3.6. Системы комплексной автоматизации бизнес-процессов

Развитием систем маршрутизации документов являются WorkFlow системы, или системы комплексной автоматизации бизнес-процессов. В отличие от систем маршрутизации документов, объектом маршрутизации в них является совокупность данных используемых в некотором бизнес-процессе. Пользователь получает на рабочее место информацию о том, что он должен сделать и все необходимые для этого данные. WorkFlow приложение определяет, какое приложение должно быть запущено для реализации функций на данном рабочем месте, и загружает в него необходимые данные. Парадигма WorkFlow системы предполагает, что пользователь должен выполнять только необходимые функции, всю рутинную работу – определение последовательности действий, доставку необходимой информации, контроль своевременности исполнения работы и прочее выполняет система WorkFlow.

Функции WorkFlow приложений выходит за рамки функций систем документооборота, однако, технологии, используемые в данных приложениях очень близки технологиям, используемым в системах маршрутизации документов, к тому же маршрутизация документов может рассматриваться как частный случай задачи построения WorkFlow систем.

4. Обзор ПО для автоматизации документооборота

Существует большое множество информационных систем, относящихся к классу систем электронного документооборота, но можно выделить наиболее распространенные типы таких систем:

Системы с развитыми средствами хранения и поиска информации (электронные архивы). Электронный архив – это частный случай системы документооборота, ориентированный на эффективное хранение и поиск информации.

Системы, ориентированные на поддержку управления организацией и накопление знаний. Такие системы обеспечивают корпоративную инфраструктуру для создания, совместной работы над документами и их публикации, доступную, как правило, всем пользователям в организации.

Для каждого типа систем можно выделить наиболее известные программные продукты, хотя существует множество систем, совмещающих в себе функции разных типов систем электронного документооборота.

4.1. Электронные архивы

Humminbird. Данная компания является владельцем группы продуктов PC Docs – корпоративного сервера архива документов и Fulcrum – мощной поисковой системы. Система поддерживает работу с распределенными архивами, в том числе территориально удаленными. Осуществляется поддержка работы с оптическими, магнитооптическими и ленточными накопителями и библиотеками. Отличается хорошей масштабируемостью, возможно увеличение количества пользователей системы до нескольких тысяч без изменения структуры данных.

4.2. Системы класса Workflow

Optima. Разрабатывают и продвигают систему Optima Workflow. Кроме общего механизма организации потока работ, он позволяет хранить на время проведения работ все документы, относящиеся к процессу. Для этого в качестве хранилища используется механизм общих папок Microsoft Exchange. Полезной возможностью является отслеживание критических путей и представление комплекса взаимосвязанных работ в виде диаграмм Ганта. Впрочем, эту работу можно производить и в среде MS Project c использованием всех ее возможностей, так как Optima Workflow позволяет экспортировать данные о ходе работ в эту программу.

4.3. Комплексные системы коллективной работы и управления организацией

Microsoft. Компания Microsoft в качестве основы комплексной системы автоматизации документооборота предлагает использовать продукт Microsoft Exchange сервер в комплекте с клиентским приложением Microsoft Outlook. Помимо этого предлагается использовать продукт Microsoft Sharepoint Portal Server в качестве архива документов и средства организации корпоративного Intranet/Extranet портала. Также компания предоставляет полный набор средств для организации On-line взаимодействий.

IBM/Lotus. Компания IBM предлагает в качестве базового средства автоматизации документооборота использовать платформу Lotus Notes, помимо этого имеется возможность дополнить базовую функциональность средствами организации архива документов Domino.doc, WorkFlow подсистемой Domino.Workflow, и рядом дополнительных средств для организации групповых взаимодействий.

5. Выбор ПО для автоматизации

Идеального ПО не существует, поэтому необходимо четко сформулировать свои требования и анализировать ПО по набору критериев. Возможный перечень критериев:

Средства навигации – удобство доступа пользователей к различным приложениям, навигации по данных, представления данных

Картотека/учет – функции учета документов, атрибутирования, создания карточек документов и т.д.

Архив/Обработка изображений – хранение документов, управление версиями, захват документа на редактирование, сканирование изображений, распознавание текста

Маршрутизация/контроль – функции доставки документов на рабочие места пользователей, сбор информации о действиях пользователей, контроль текущего состояния документов

Автоматизация бизнес-процессов – средства моделирования процессов, среда для реализации и мониторинга процессов, средства по накоплению статистики по исполнению процессов

Групповая работа – средства для организация телеконференций, групповых обсуждений и разработки документов

Поиск/Knowledge Management – средства поиска информации (полнотекстовой, атрибутивный и т.д.), классификация и каталогизация документов, создание баз знаний по предметным областям

Открытость – возможности по расширению функциональности

Выбирая ПО для автоматизации необходимо как можно четче очертить тот круг задач, который планируется решать. Это позволит уменьшить затраты на приобретение, а также минимизировать время и стоимость внедрения.

Нажмите, чтобы узнать подробности

В документе рассматриваются понятие систем обработки текстов, их виды и функции, а также основные понятия текстового процессора Microsoft Word - структуру окна и структуру текстового документа в Microsoft Word


Системы обработки текстов – это программы для создания, редактирования и печати текстовых документов.

Текстовый редактор (программа для ввода и редактирования текста): Word Pad Блокнот

Текстовый процессор (программа, обладающая расширенными возможностями по обработке текстовых документов, обрабатывает не только текст, но и графические объекты): Microsoft Word, Writer

удобная работа с таблицами;

использование графики (рисунков, диаграмм, формул);

импорт данных из других программ.

по количеству алфавитов: одноалфавитные, многоалфавитные.

по форме текста: линейные, нелинейные.

по способу использования: автономные, сетевые.

по назначению: общего назначения, специального назначения.

Microsoft Word – текстовый процессор, предназначенный для создания и редактирования различных текстовых документов: писем, отчетов, блокнотов, брошюр, отчетной документации и т. д.

Запуск: Пуск – Все программы – Microsoft Office – Microsoft Office Word.

панель быстрого доступа, кнопка Office

панели инструментов: стандартная, форматирование;

Структура текстового документа

Тело документа – основная часть документа, которая отображает содержание и цель создания документа.

текст (отображает основное содержание документа);

рисунок (используют для иллюстрирования основного содержания документа с целью увеличения его наглядности: графики, диаграммы);

таблица (структурирование и группировка для иллюстрирования или анализа поданных данных в документе);

заголовок (структурная единица документа для логического структурирования поданной в документе информации);

колонтитул (часть документа, расположенная вверху или внизу страницы, содержащая информацию про автора, название раздела, номер страницы);

сноска (дополнительные пояснения специально обозначенных слов, словосочетаний, предложений, которые размещаются внизу страницы);

содержание (перечень заголовков документа с указанием страниц, на которых они размещаются).

Для работы с документами, представленными в электронной форме, необходимо иметь компьютерную систему и аппаратно-программные средства преобразования бумажных документов в электронную форму. Можно выделить следующие основные этапы такого преобразования:
- сканирование с помощью устройств оцифровки изображения, в процессе которого производится создание электронного образа документа;
- процесс распознания, позволяющий преобразовать электронное изображение в текстовые данные ( с сохранением элементов форматирования оригинала);

Файлы: 1 файл

информатика.doc

Автоматизация обработки документов

Для работы с документами, представленными в электронной форме, необходимо иметь компьютерную систему и аппаратно-программные средства преобразования бумажных документов в электронную форму. Можно выделить следующие основные этапы такого преобразования:

- сканирование с помощью устройств оцифровки изображения, в процессе которого производится создание электронного образа документа;

- процесс распознания, позволяющий преобразовать электронное изображение в текстовые данные ( с сохранением элементов форматирования оригинала);

- применение дополнительных средств автоматизированного перевода на другой язык для документов, исполненных на иностранном языке;

- создание рефератов и аннотаций для научно-исследовательской работы по направлению научной деятельности.

Сканеры формируют электронное изображение бумажного документа стандартного формата заданного качества изображения, которое гарантировало бы его надежное распознавание.

К средствам автоматизации перевода можно отнести два вида программ: электронные словари и программы перевода. Электронные словари представляют собой средства для перевода слов, отображаемых на экране или имеющихся в документе. Удобство их использования состоит в возможности немедленно получить перевод неизвестного слова без поиска его в отдельном большом словаре. Программы перевода получают на входе текст, выполненный на одном языке, и выдают текст на другом языке, т.е. автоматизируют процесс перевода.

Технология автоматического распознавания образов

Методы автоматического распознавания образов и их реализация в системах оптического распознавания текстов ( Optical Character Recognition – OCR-системы) – одна из самых прогрессивных технологий искусственного интеллекта. В развитии этой технологии российские ученые занимают ведущие позиции в мире.

OCR-системы понимается как система автоматического распознавания образов с помощью специальных программ изображений символов печатного или рукописного текста ( например, введенного в компьютер посредством сканера) и преобразование его в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т.д.

Аббревиатура OCR иногда расшифровывается как Optical Character Reader – устройство оптического распознавания символов или автоматического чтения текста. В настоящее время такие устройства в промышленном использовании обрабатывают до 100 тыс. документов в сутки.

Промышленное использование предполагает ввод документов хорошего и среднего качества – это обработка бланков переписки населения, налоговых деклараций и.т.д

Перечислим особенности предметной области, существенные с точки зрения OCR-системы:

    • шрифтовое и размерное разнообразие символов;
    • искажение в изображениях символов ( разрывы образов символов);
    • перекосы при сканировании;
    • посторонние включение в изображениях;
    • сочетание фрагментов текста на разных языках;
    • большое разнообразие классов символов, которые могут быть распознаны только при наличии дополнительной контекстной информации.

    Выделяются три принципа, на которых основаны все OCR-системы.

    1. Принцип целостности образа. В исследуемом объекте всегда есть значимые части, между которыми существуют отношения. Результаты локальных операций с частями образа интерпретируются только совместно в процессе интерпретации целостных фрагментов и всего образа в целом.
    2. Принцип целенаправленности. Распознавание является целенаправленным процессом выдвижения и проверки гипотез ( поиска того, что ожидается от объекта).
    3. Принцип адаптивности. Распознающая система должна быть способна к самообучению.

    Ведущие российские OCR-системы: FineReader; FineReader Рукопись; FormReader; CunieForm?Cognitive Forms.

    Система FineReader выпускается компанией ABBYY, которая была основана в 1989г.Разработки компании ABBYY ведутся в двух направлениях: машинное зрение и прикладная лингвистика. Стратегическим направлением научных исследований и разработок является естественно-языковой аспект технологий в области машинного зрения, искусственного интеллекта и прикладной лингвистики.

    CunieForm GOLD for Windows является первой в мире самообучаемой интеллектуальной OCR-системой, использующей новейшую технологию адаптивного распознавания текстов, поддерживает много языков. Для каждого языка поставляется словарь контекстной проверки и повышения качества результатов распознования. Распознает любые полиграфические, машинописные гарнитуры и шрифты, получаемые с принтеров, за исключением декоративных и рукописных, а также очень низкокачественных текстов.

    Характеристики систем распознавания образов.

    Среди OCR-технологий большое значение имеют специальные технологии решения отдельных классов задач автоматического распознавания образов:

    • Поиск людей по фотографиям;
    • Поиск месторождения полезных ископаемых и прогнозирование погоды по данным; аэрофотосъемки и снимкам со спутников в различных диапазонах светового излучения
    • Составление географических карт по исходной информации, используемой в предыдущей задаче;
    • Анализ отпечатков пальцев и рисунков радужной оболочки глаза в криминалистике, охранных и медицинских системах;

    На стадии подготовки и обработки информации, особенно при компьютеризации предприятия, автоматизация бухгалтерского учета, возникает задача ввода большого объема текстовой и графической информации в ПК. Основными устройствами для ввода графической информации являются: сканер, факс-модем и реже – цифровая фотокамера. Кроме того, используя программы оптического распознавания текстов, можно вводить в компьютер (оцифровывать) также и текстовую информацию. Современные программно-аппаратные системы позволяют автоматизировать ввод больших объемов информации в компьютер, применяя, например, сетевой сканер и параллельное распознавание текстов на нескольких компьютерах одновременно.

    Потом строки разбиваются на непрерывные области изображения, которые соответствуют отдельным буквам; алгоритм распознавания выдвигает предположения относительно соответствия этих областей символам, а затем осуществляется выбор каждого символа, в результате чего страница восстанавливается в символах текста, причем, как правило, в заданном формате. OCR-системы могут достигать наилучшей точности распознавания – свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому что, если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9% получается одна или две ошибки на странице. В таких случаях следует воспользоваться методом проверки по словарю, т.е если какого-то слова нет в словаре системы, то она по специальным правилам попытается найти похожее. Но это все равно не позволяет исправлять 100% ошибок и требует контроля результатов человеком.

    Программное обеспечение OCR-системы обычно работает с большим растровым изображением страницы, полученной из сканера. Изображение со стандартной степенью разрешения достигаются сканированием с точностью 9600 п/д. Изображение формата А4 при этом разрешение занимает около 1Мб памяти.

    Основное назначение OCR- систем состоит в анализе растровой информации и присвоение фрагменту изображения соответствующего символа. После завершения процесса распознания OCR-системы должны уметь сохранять формирование исходных документов, присваивать в нужном месте атрибут абзаца, сохранять таблицы, графику и т.д. Современные программы распознавания поддерживают все известные текстовые и графические форматы и форматы электронных таблиц, а также форматы HTML и PDF.

    Очень важно при работе с OCR- системой является выбор языка распознавания и типа распознавания материала ( пишущая машинка, факс, матричный принтер, газета и т.д.), а также интуитивная понятность пользовательского интерфейса. При распознавании текстов, в которых использовано несколько языковых, эффективность распознавания зависит от умения OCR- системы формировать группы языков. В тоже время в некоторых системах уже имеются комбинации для наиболее часто применяемых языков.

    На данный момент существует огромное кол-во программ, поддерживающих распознавания текста как одну из возможностей. Лидером в этой области являются система FineReader. Последняя версия программы (6.0) теперь имеет средства для разработки новых систем на базе технологии FineReader 6.0. Система FineReader 6.0, кроме того, что знает огромное кол-во форматов для сохранения, включает PDF, имеет возможность прямого распознавания из PDF-файлов. Новая технология Intelligent Background Filtering (интеллектуальная фильтрация фона) позволяет отсеять информацию о текстуре документа и фоновом шуме изображения. Программа Finereader умеет определять зоны, содержащие подобный текст, отделяя текст от фона документа, находя точки, размер которых меньше определенной величины, и удаляя их. При этом контуры букв сохраняются, так что точки фона, близко расположенные к данным контурам, не вносят помех, способных ухудшить качество распознавания текста.

    Система OmniPage 11 – продукт компании ScanSoft. Ограниченная версия этой программы обычно поставляется в комплекте с новыми сканерами. Разработчики утверждают, что их программа практически со 100%-ной точностью распознает печатные документы, восстанавливая их форматирование, включая столбцы, таблицы, переносы, заголовки, подписи, графики и картинки.

    Средства и технологии обработки текстовой информации Тема № 20 [24.10.12]

    Для массового пользователя ЭВМ наибольший интерес представляет прикладное программное обеспечение, позволяющее непосредственно решать задачи из его предметной области. Одной из важнейших функций в деятельности современного человека является обработка текстовой информации. Средства для обработки текстовой информации являются одной из составляющих компонент автоматизации учрежденческой деятельности в самом широком смысле ее понимания, позволяя пользователю с максимальными удобствами создавать высококачественные документы различного назначения посредством персонального компьютера и соответствующего программного обеспечения.

    Современные текстовые процессоры предоставляют пользователю широкие возможности по подготовке документов. Это и функции редактирования, допускающие возможность любого изменения, вставки, замены, копирования и перемещения фрагментов в рамках одного документа и между различными документами, функции форматирования символов, абзацев, страниц, разделов документа, проверки грамматики и орфографии, использования наряду с простыми текстовыми элементами списков, таблиц, рисунков, графиков и диаграмм.

    Целью курсовой работы является изучение средств и технологии обработки текстовой информации.

    Поставленная цель курсовой работы решается путем реализации комплекса взаимосвязанных задач, в числе которых:

    - рассмотреть средства и технологии обработки текстовой информации;

    - исследовать классификацию и возможности текстовых редакторов;

    - изучить характеристику текстовых редакторов и процессоров.

    1 Теоретическая часть

    1.1 Средства и технологии обработки текстовой информации

    Каждый пользователь компьютера встречается с необходимостью подготовки, редактирования, той или иной текстовой информации. Одними из первых программ, созданных для компьютера, были средства обработки текстов или, как их стали называть, текстовые редакторы.

    Несмотря на широкие возможности использования компьютеров для обработки самой разной информации, самыми популярными по-прежнему остаются программы, предназначенные для работы с текстом. При подготовке текстовых документов на компьютере используются три основные группы операций:

    • Операции ввода позволяют перенести исходный текст из его внешней формы в электронный вид, то есть в файл, хранящийся на компьютере. Ввод может осуществляться не только набором с помощью клавиатуры, но и путем сканирования бумажного оригинала и последующего перевода документа из графического формата в текстовый (распознавание).
    • Операции редактирования (правки) позволяют изменить уже существующий электронный документ путем добавления или удаления его фрагментов и т.д.
    • Оформление документа задают операциями форматирования. Команды форматирования позволяют точно определить, как будет выглядеть текст на экране монитора или на бумаге после печати на принтере.

    Основными функциями текстовых редакторов и процессоров являются: ввод и редактирование символов текста, возможность использования различных шрифтов символов и т.п. С помощью Word Pad можно: работать со шрифтами, использовать разнообразное начертание и цвет шрифтов; сохранять тексты, как в своем собственном формате, так и в других популярных форматах (в том числе в формате Microsoft Word); вставлять в текст картинки разнообразных форматов. Блокнот – текстовый процессор позволяет создавать простые файлы без форматирования. Microsoft Word – основа любого офиса и, пожалуй, самая нужная и популярная программа во всем Microsoft Office. Эта программа установлена практически на каждом ПК. С помощью Word можно не просто набрать текст, но и оформить его по своему вкусу: включить в него таблицы и графики, картинки и даже звуки и видеоизображения. Word поможет составить простое письмо и сложный объемный документ, яркую поздравительную открытку или рекламный блок. Окно программы Microsoft Word состоит из следующих элементов: строка заголовка, строка меню, панели инструментов, измерительные линейки, полосы прокрутки, текстовое поле, строка состояния [1, с. 8]

    1.2 Классификация и возможности текстовых редакторов

    Несмотря на широкие возможности использования компьютеров для обработки самой разной информации, самыми популярными по-прежнему остаются программы, предназначенные для работы с текстом.

    Программы для обработки текстовой информацией подразделяются на несколько категорий:

    • текстовые редакторы;
    • текстовые процессоры;
    • настольные издательские программы;
    • специализированные программы обработки текстов.

    Текстовые редакторы — это программы для создания, редактирования, форматирования, сохранения и печати документов. Современный документ может содержать, кроме текста, и другие объекты (таблицы, диаграммы, рисунки и т. д.).

    Простые текстовые редакторы (например, WordPad, Блокнот) предназначены для создания несложного текста с элементами простого форматирования. Мощный текстовый редактор, располагающий большими возможностями по обработке текстовых документов (например, поиск и замена символов, средства проверки орфографии, вставка таблиц и др.), обычно называют тестовыми процессорами.

    Основными функциями текстовых редакторов и процессоров являются:

    • ввод и редактирование символов текста;
    • возможность использования различных шрифтов символов;
    • копирование и перенос части текста с одного места на другое или из одного документа в другой;
    • контекстный поиск и замена частей текста;
    • задание произвольных параметров абзацев и шрифтов;
    • автоматический перенос слов на новую строку;
    • автоматическую нумерацию страниц;
    • обработка и нумерация сносок;
    • создание таблиц и построение диаграмм;
    • проверка правописания слов и подбор синонимов;
    • построение оглавлений и предметных указателей;
    • распечатка подготовленного текста на принтере и т.п.

    Также практически все текстовые процессоры обладают следующими функциями:

    • поддержка различных форматов документов;
    • многооконность, т.е. возможность работы с несколькими документами одновременно;
    • вставка и редактирование формул;
    • автоматическое сохранение редактируемого документа;
    • работа с многоколоночным текстом;
    • возможность работы с различными стилями форматирования;
    • создание шаблонов документов;
    • анализ статистической информации.

    При выборе для работы текстового редактора нужно учитывать многие факторы: характер содержания документа (например, простой текст или таблицы, формулы, уравнения и т. п.), сложность создаваемых документов, объемы текстов, требования к качеству напечатанного на бумаге документа. [2, c. 147]

    Наиболее известные редакторы текстов по специализации можно условно разделить на 5 групп:

    1. процессоры общего назначения (Microsoft Word, WordPerfect и др.);
    2. редакторы научных документов (ТEХ);
    3. издательские системы (Adobe PageMaker, Ventura Publisher, Microsoft Publisher, Quark Press и др.);
    4. редакторы;
    5. редакторы исходных текстов программ (MultiEdit и встроенные редакторы систем программирования Basic, Pascal, C и др.).

    Разумеется, с помощью Microsoft Word можно подготовить и текст программы, а с помощью MultiEdit – документ общего назначения. Специализация редактора заключается в добавлении или оптимизировании функций, которые необходимы для обслуживания документов определенного типа. Например, редактор ТЕХ более удобен для набора математических выражений, чем встроенный редактор формул Microsoft Word.

    Сегодня практически все мощные текстовые редакторы входят в состав интегрированных программных пакетов, предназначенных для нужд современного офиса. Так, например, Microsoft Word входит в состав самого популярного офисного пакета Microsoft Office.

    Издательские системы специализируются на подготовке набранного документа к публикации, создания макета издания. Основная функция, для которой используются издательские системы, - окончательная верстка документа (размещение текста на странице, вставка рисунков, использование различных шрифтов и пр.).

    К специализированным программам обработки текстов относятся:

    • перекодировщики;
    • программы стилистического, орфографического, грамматического контроля текста;
    • словари (например, для подбора синонимов);
    • переводчики.

    Для подготовки Web-страниц и Web-сайтов используют специализированные программы, называемые Web-редакторами (например, Microsoft FrontPage или Macromedia Dreamweaver).

    1.3 Характеристика текстовых редакторов и процессоров

    Блокнот. Чаще всего блокнот используют для проверки, и в некоторых случаях написания, HTML кода для web -страниц. Это связано с тем что, блокнот записывает в своё файл только чистый код символов без форматирования, что является очень удобным для программистов. И иногда это просмотр .dll, .inf, .cfg и .bat файлов, которые небольшие по размерам, но важные по содержанию.

    Microsoft Word – основа любого офиса и, пожалуй, самая нужная и популярная программа во всем Microsoft Office. Эта программа установлена практически на каждом ПК и стала стандартом в обработке текста. На примере Word очень удобно изучать интерфейс всех остальных программ Microsoft Office.

    Область применения Word весьма широка. С помощью Word можно не просто набрать текст, но и оформить его по своему вкусу: включить в него таблицы и графики, картинки и даже звуки и видеоизображения. Word поможет составить простое письмо и сложный объемный документ. Можно сказать, что Word применим практически везде, где требуется работа с текстом. Кроме того, в последние версии Word добавлены весьма развитые средства работы с гипертекстовыми документами и документами, предназначенными для публикации в Интернет. [3, c. 208]

    Общими элементами среды любого текстового редактора являются:

    • рабочее поле – пространство на экране, на котором отображается текст;
    • курсор – место активного воздействия на рабочее поле;
    • строка состояния – содержит информацию о текущем состоянии текстового редактора;
    • строка меню – содержит команды переключения режимов работы текстового редактора и др. действий;
    • полосы прокрутки - горизонтальная и вертикальные полосы справа и внизу окна документа, появляющиеся в случае не умещающегося в пределах окна содержимого;
    • панель инструментов и др.

    Текстовый процессор. Любой текст, созданный с помощью текстового редактора, а так же включённые в него нетекстовые материалы (графика, звуковые фрагменты) называют документом. Документ может быть статьёй, докладом, приглашением и т.д. При работе в сети части одного документа могут храниться на разных компьютерах , расположенных далеко друг от друга.

    Гипертекст- это способ организации документа, позволяющий быстро находить нужную информацию. Он часто используется при построении систем оперативной подсказки и компьютерных версий больших справочников и энциклопедий. Основными объектами текстового документа являются: символ, слово, строка, абзац, страница, фрагмент.

    Символы – это буквы, цифры, пробелы, знаки пунктуации, специальные символы. Символы можно форматировать (изменять их внешний вид). Среди основных свойств символов можно выделить следующие: шрифт, размер, начертание и цвет.

    Слово – произвольная последовательность символов (букв, цифр), ограниченная с двух сторон служебными символами.

    Абзац – произвольная последовательность символов, завершающаяся специальным символом конца абзаца. Допускаются пустые абзацы.

    Фрагмент – это некоторое количество рядом стоящих символов, которые можно рассматривать как единое целое. Фрагментом может быть отдельное слово, строка, абзац, страница и даже весь вводимый текст.

    Набор (ввод) текста, как правило, осуществляется с помощью клавиатуры. Роль бумаги при этом играет экран компьютера. Место для ввода очередного символа текста указывается на экране с помощью мерцающего прямоугольника – курсора. [4, c. 169]

    При наборе текста на компьютере человек не следит за концом строки: как только он достигнут, курсор автоматически переходит на начало следующей строки. Для того чтобы перейти к вводу нового абзаца, нажимается клавиша

    . С помощью стрелок вверх, вниз, влево, вправо курсор можно перемещать по всему экрану, подводить его к любому символу. Кроме того существует режим прокрутки, позволяющий быстро вывести на экран части текста, находящиеся за пределами документа. При перемещении курсора по экрану документ остаётся неподвижным, а при прокрутке неподвижным остаётся курсор.

    1.4 Форматы текстовых файлов

    Формат файла определяет способ хранения текста в файле. Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы – программы-конверторы. Рассмотрим распространенные форматы текстовых файлов.

    Только текст (Text Only) (TXT). Наиболее универсальный формат. Сохраняет текст без формирования, в текст вставляются только управляющие символы конца абзаца.

    Текст в формате RTF (Rich Text Format) (RTF). Универсальный формат, который сохраняет все формирование. Преобразует управляющие коды в команду, которые могут быть прочитаны и интерпретированы многими приложениями, в результате информационный объем файла существенно возрастает.

    Документ Word (DOC). Оригинальный формат используемой в настоящее время версии Word. Полностью сохраняет форматирование. Использует 16-битную кодировку символов.

    Works 4.0 для Windows (WPS). При преобразовании из формата Word форматирование сохраняется не полностью.

    HTML - документ (HTM, HTML). Формат хранения Web - страниц. Содержит управляющие коды (теги) языка разметки гипертекста.

    Выбор требуемого формата текстового документа или его преобразование производится в процессе сохранения файла. [5, c. 108]

    2 Практическая часть

    2.1 Общая характеристика задачи

    1. Построить таблицы по приведенным ниже данным.
    2. Произвести расчет начисленной суммы, баланса на конец месяца в у.е. и рублях за услуги предоставления доступа к Интернету для абонентов квартирного сектора. Для определения начисленной суммы использовать функцию ВПР() (рис. 1–3). Необходимо учитывать, что предоплаченный трафик входит в сумму абонентской платы и необходимо оплачивать только тот трафик, который получен сверх предоплаченного.

    Начислено, у.е. = Абонентская плата, у.е. + (Трафик, Mb – Предоплаченный трафик, Mb) x Стоимость трафика за 1Mb, у.е.

    Данные расчета занести в таблицу на рис. 3.

    Читайте также: