Возможности программы finereader кратко

Обновлено: 04.07.2024

А чуть более года назад очередное детище IBM, в свое время положившей начало триумфальным шахматным победам компьютеров (знаменитый Deep Blue), под названием Watson совершило новый прорыв, с большим отрывом победив сразу двух чемпионов популярной американской викторины Jeopardy. Показательно, однако, что хотя Watson самостоятельно озвучивал ответы, вопросы ему все же передавались в текстовом виде. Это говорит о том, что успехи во многих сферах приложения ИИ — распознавании речи и образов, машинном переводе — достаточно скромны, хотя это и не мешает нам уже сегодня применять их на практике. Наибольшие же успехи, пожалуй, демонстрируют системы оптического распознавания символов (OCR, Optical Character Recognition), с которыми наверняка так или иначе знакомы почти все пользователи ПК. Тем более, что российские разработки в данной области занимают достойное место в мире — я имею в виду ABBYY FineReader.

Немного истории

Базовые принципы

  1. Целостность (integrity) — объект рассматривается как совокупность своих частей и (для зрительных образов) пространственных отношений между ними. В свою очередь и части получают толкования только в составе всего объекта. Этот принцип помогает строить и уточнять гипотезы, быстро отсекая маловероятные.
  2. Целенаправленность (purposefulness) — поскольку любая интерпретация данных преследует определенную цель, то и распознавание представляет собой процесс выдвижения гипотез об объекте и целенаправленной их проверки. Система, действующая в соответствии с этим принципом, будет не только экономнее расходовать вычислительные мощности, но и реже ошибаться.
  3. Адаптивность (adaptability) — система сохраняет накопленную в процессе работы информацию и использует ее повторно, т. е. самообучается. Этот принцип позволяет создавать и накапливать новые знания и избегать повторного решения одних и тех же задач.

FineReader — единственная в мире OCR-система, которая действует в соответствии с вышеописанными принципами на всех этапах обработки документа. Соответствующая технология носит название IPA — по первым буквам английских терминов. К примеру, согласно принципу целостности, фрагмент изображения будет интерпретироваться как символ, только если в нем присутствуют все структурные части подобных объектов, причем находящиеся в определенных взаимоотношениях. Это помогает заменить перебор большого числа эталонов (в поисках более-менее подходящего) целенаправленной проверкой разумного количества гипотез, причем опираясь на накопленные ранее сведения о возможных начертаниях символа в распознаваемом документе.

Однако принципы IPA применяются при анализе не только фрагментов, соответствующих (предположительно) отдельным символам, но и всего исходного изображения страницы. Большинство OCR-систем основываются на распознавании иерархической структуры документа, т. е. страница разбивается на основные структурные элементы, такие как таблицы, изображения, блоки текста, которые, в свою очередь, разделяются на другие характерные объекты — ячейки, абзацы — и так далее, вплоть до отдельных символов.

Такой анализ может проводиться двумя основными способами: сверху-вниз, т. е. от составных элементов к отдельным символам, или, наоборот, снизу-вверх. Чаще всего применяется один из них, но в ABBYY разработали специальный алгоритм MDA (multilevel document analysis, многоуровневый анализ документа), который сочетает оба. Вкратце он выглядит следующим образом: структура страницы анализируется методом сверху-вниз, а воссоздание электронного документа по окончании распознавания происходит снизу-вверх, однако на всех уровнях дополнительно действует механизм обратной связи. В результате резко снижается вероятность грубых ошибок, связанных с неверным распознаванием высокоуровневых объектов.

  • основной текст;
  • верхние и нижние колонтитулы;
  • номера страниц;
  • заголовки одного уровня;
  • оглавление;
  • текстовые вставки;
  • подписи к рисункам;
  • таблицы;
  • сноски;
  • зоны подписи/печати;
  • шрифты и стили.

Процесс распознавания

Но наиболее интересное, конечно, начинается, когда процесс распознавания опускается на самые нижние уровни. Так называемая процедура линейного деления разбивает строки на слова, а слова на отдельные буквы; далее, в соответствии с принципом IPA, формирует набор гипотез (т. е. возможных вариантов того, что́ это за символ, на какие символы разбито слово и т. д.) и, снабдив каждую оценкой вероятности, передает на вход механизма распознавания символов. Последний состоит из ряда так называемых классификаторов, каждый из которых также формирует ряд гипотез, ранжированных по предполагаемой степени вероятности. Важнейшей характеристикой любого классификатора является среднее положение правильной гипотезы. Понятно, что чем выше она находится, тем меньше работы для последующих алгоритмов — к примеру, словарной проверки. Но для достаточно отлаженных классификаторов чаще всего оценивают такие характеристики, как точность распознавания по первым трем гипотезам или только по первой — т. е., грубо говоря, способность угадать верный ответ с трех или с одной попытки. ABBYY в своих системах применяет следующие типы классификаторов: растровый, признаковый, признаковый дифференциальный, контурный, структурный и структурный дифференциальный — которые сгруппированы на двух логических уровнях.

Принцип действия РК, или растрового классификатора, основан на попиксельном сравнении изображения символа с эталонами. Последние формируются в результате усреднения изображений из обучающей выборки и приводятся к некой стандартной форме; соответственно, для распознаваемого изображения также предварительно нормализуются размер, толщина элементов, наклон. Этот классификатор отличается простотой реализации, скоростью работы и устойчивостью к дефектам изображений, но обеспечивает сравнительно низкую точность и именно поэтому используется на первом этапе — для быстрого порождения списка гипотез.

Признаковый классификатор (ПК), как и следует из его названия, основывается на наличии в изображении признаков того или иного символа. Если всего таких признаков N, то каждую гипотезу можно представить точкой в N-мерном пространстве; соответственно, точность гипотезы будет оцениваться расстоянием от нее до точки, соответствующей эталону (который также нарабатывается на обучающей выборке). Понятно, что типы и количество признаков в значительной степени определяют качество распознавания, поэтому обычно их достаточно много. Этот классификатор также сравнительно быстр и прост, но не слишком устойчив к различным дефектам изображения. Кроме того, ПК оперирует не исходным изображением, а некой моделью, абстракцией, т. е. не учитывает часть информации: скажем, сам факт наличия каких-то важных элементов ничего не говорит об их взаимном расположении. По этой причине ПК используется не вместо, а вместе с РК.

Контурный классификатор (КК) представляет собой частный случай ПК и отличается тем, что анализирует контуры предполагаемого символа, выделенные из исходного изображения. В общем случае его точность ниже, чем у полновесного ПК.

Сам по себе ПДК не выдвигает гипотез, а лишь уточняет имеющиеся (список которых в общем случае сортируется пузырьковым методом), так что прямая оценка его эффективности не проводится, а косвенно ее приравнивают к характеристикам всего первого уровня OCR-распознавания. Однако понятно, что она зависит от корректности подобранных признаков и представительности выборки эталонов, обеспечение чего является достаточно трудоемкой задачей.

Качественные характеристики всех классификаторов собраны в следующую таблицу. Они, впрочем, позволяют лишь оценить эффективность алгоритмов друг относительно друга, т. к. не являются абсолютными, а получены на основе обработки конкретной тестовой выборки. Может создаться впечатление, что на последних этапах распознавания борьба идет буквально за доли процента, но на самом деле каждый классификатор вносит существенную лепту в повышение точности распознавания — так, к примеру, СК снижает количество ошибок на ощутимые 20%.

РКПКККПДК*СДК**СК**
Точность по первым трем вариантам, %99,2999,8199,3099,8799,88
Точность по первому варианту, %97,5799,1395,1099,2699,6999,73

* оценка всего первого уровня OCR-алгоритма ABBYY
** оценка для всего алгоритма после добавления соответствующего классификатора

Любопытно, однако, что, несмотря на довольно высокую точность, алгоритм собственно распознавания не принимает окончательного решения. В соответствии с принципом MDA, гипотезы выдвигаются на каждом логическом уровне, и число их может расти в геометрической прогрессии. Соответственно, последовательная проверка всех гипотез вряд ли окажется эффективной, и потому в OCR-системах ABBYY применяется метод структурирования гипотез, т. е. отнесения их к тем или иным моделям. Последних существует пара десятков, вот только несколько их типов: словарное слово, несловарное слово, арабские цифры, римские цифры, URL, регулярное выражение — а в каждый может входить множество конкретных моделей (к примеру, слово на одном из известных языков, латиницей, кириллицей и т. д.).

Не только OCR

Печатные документы — далеко не единственные, представляющие интерес с точки зрения их оцифровки и автоматической обработки. Довольно часто приходится работать с формами, т. е. документами с предопределенными и фиксированными полями, которые заполняются вручную, но сравнительно аккуратно (так называемыми рукопечатными символами) — примером могут служить различные анкеты. Технология их обработки имеет отдельное название — ICR (intelligent character recognition) — и достаточно существенно отличается от OCR. Так, поскольку в данном случае задача состоит не в воссоздании всего документа, а в извлечении из него конкретных данных, то она распадается на две основные подзадачи: нахождение нужных полей и собственно распознавание их содержимого.

Это достаточно специфическая область, и ABBYY предлагает для нее совершенно отдельный программный продукт ABBYY FlexiCapture. Он предназначен для создания автоматизированных и полуавтоматизированных систем, предполагает настройку на конкретные типы документов, для которых создаются специальные шаблоны, умеет интеллектуально находить на страницах различные поля и верифицировать данные в них и т. д. Однако в самой основе лежат алгоритмы распознавания символов, аналогичные тем, что применяются в FineReader, да и общая схема весьма похожа:

Процесс распознавания в FineReader

Впрочем, важное отличие все же имеется: структурный классификатор является обязательным участником процесса — это связано со спецификой рукопечатных символов. Кроме того, ICR предполагает большое число специфических дополнительных проверок: например, не является ли символ зачеркнутым, или действительно ли распознанные символы формируют дату.

Один из популярнейших функционалов по работе со сканированием и обработкой файлов различного типа — Файн Ридер. Функционал программного продукта был разработан российской компанией ABBYY, он позволяет не только распознавать, но и обрабатывать документы (переводить, менять форматы и другое). Многие пользователи могут только установить, а как пользоваться ABBYY FineReader, сразу разобраться не могут. На многие вопросы вы сможете найти ответы в этой статье.

Как пользоваться Abbyy Finereader

Программа позволяет сканировать и распознавать текст — и не только

Что представляет собой приложение от ABBYY?

Чтобы подробно разобраться, что это за программа ABBYY FineReader 12, необходимо подробно рассмотреть все её возможности. Первой и самой простой функцией является сканирование документа. Существует два варианта сканирования: с распознаванием и без него. В случае обычного сканирования печатного листа вы получите изображение, которое сканировали в указанной папке на вашем компьютерном устройстве.

ВНИМАНИЕ. Лист нужно класть на сканирующую часть принтера ровно, по указанным на принтере контурам. Не допускайте заламывания исходника, это может привести к плохому качеству итогового скана.

Сканирование документа

Поместите документ в сканер для того, чтобы перевести его в электронный вид

Вы должны самостоятельно решить, для чего нужен FineReader именно вам, так как утилита имеет значительный функционал, например, вы можете самостоятельно выбрать в каком цвете хотите получить изображение, есть возможность перевести все фото в чёрно-белый. В чёрно-белом цвете распознавание происходит быстрее, качество обработки возрастает.

Если же вас интересует функция распознавания текста ABBYY FineReader, перед сканированием вам нужно нажать специальную кнопку. В этом случае есть несколько вариантов получения информации. Стандартно на ваш экран выведется распознанный кусок листа, который вы сможете скопировать или отредактировать вручную.

Если вы выберите другие функции, то сможете сразу получить файл Word-документом или Excel-таблицей. Выбирать функции очень просто, меню интуитивно понятно, легко настраивается благодаря тому, что все нужные вам кнопки перед глазами.

ВАЖНО. Перед тем как распознать текст ABBYY FineReader, вам необходимо точно подобрать язык обработки. Несмотря на то, что утилита работает полностью автоматически, бывает, что низкое качество исходника не позволяет понять, что за язык был в исходнике. Это сильно снижает качество итоговых результатов работы приложения.

Несколько режимов работы

Распознавание текста с картинки

На иллюстрации показан результат работы программы — распознавание текста с изображения

Какие ещё есть функции?

Распознавание текста в программе ABBYY FineReader не единственная полезная функция. Для большего удобства пользователей имеется возможность переводить документ в необходимые пользователю форматы (pdf, doc, xls и др.).

Изменение текста

Теперь вы знаете, для каких целей служит программа FineReader, и сможете правильно её применять у себя дома или в офисе. Функционал приложения огромен, воспользуйтесь им и вы сможете убедиться в незаменимости этого программного продукта при обработке документов и файлов во время офисной работы.

Выполняйте различные задачи в одной программе. Повысьте эффективность за счет уменьшения количества используемых программ и предотвращения необходимости выполнять одну и ту же работу дважды. Наслаждайтесь простым и понятным интерфейсом и высококачественными результатами.

Windows

Работа с PDF

Совместная работа и согласование

Защита и подпись PDF

Создание PDF

Создание интерактивных PDF-форм

Сравнение документов разного формата

Оцифровка бумажных документов и сканов с помощью OCR

Оптимизация оцифровки и процесса конвертации

Работа с PDF

Экономьте время и силы, используя и дорабатывая документы простым способом. Работайте с любыми документами (цифровыми или сканами): открывайте, редактируйте тексты, таблицы и весь файл без дополнительных шагов преобразования.

Открытие и просмотр PDF

Просматривайте страницы, комментарии и метаданные в удобном для вас режиме. Добавляйте, удаляйте, упорядочивайте, поворачивайте и кадрируйте страницы, объединяйте документы в один PDF-файл.

Использование информации из PDF

Извлекайте (копируйте и вставляйте) текст и таблицы прямо из любого PDF-файла с сохранением форматирования. Просматривайте и обновляйте метаданные и проверяйте цифровые подписи, чтобы убедиться в подлинности документа.

Поиск информации в PDF

Находите информацию быстро и легко даже в сканах с помощью полнотекстового поиска по ключевым словам и закладок. Как только документ открыт, FineReader PDF автоматически обнаруживает PDF-документы, недоступные для поиска, и применяет OCR (оптическое распознавание символов), чтобы сделать поиск доступным.

Редактирование PDF

Редактируйте предыдущие версии документа или создавайте совершенно новые на основе уже существующих PDF-файлов. Вы можете редактировать абзацы или добавлять новые; добавлять или удалять картинки; редактировать текст внутри таблиц; и переставлять элементы на странице. С FineReader PDF вы можете редактировать отсканированный документ так же легко, как и PDF-файл, созданный в цифровом виде.

Управление PDF-документами

Добавляйте нумерацию Бейтса, используйте и создавайте собственные штампы и водяные знаки для удобной работы с документами. Добавляйте и редактируйте гиперссылки, закладки, колонтитулы и нумерацию страниц для упрощения навигации по документу.

Разделение PDF

Разделите PDF по размеру файла, по количеству страниц или по закладкам.

Заполнение PDF-форм

FЗаполните интерактивные поля в PDF-формах или отсканированных бумажных формах, чтобы добавить текст в отведенные места. Подпишите формы, используя факсимильную или цифровую подпись.

Совместная работа и согласование

Делитесь идеями, собирайте отзывы от команды и согласовывайте документы. Используйте инструменты, чтобы обсуждать и принимать решения в файле, оставляйте пометки, комментируйте.

Пометки и аннотации

Выбирайте удобные инструменты для добавления аннотаций к любому элементу документа (тексту, изображениям, графикам, подписям и т. д.) – заметки, комментарии, а также широкий набор инструментов для разметки и рисования.

Комментарии и обсуждение

Обменивайтесь идеями, добавляйте комментарии, задавайте вопросы и рисуйте пометки в любом месте документа. Присваивайте комментариям различные статусы, чтобы лучше понимать направление обсуждений.

Согласование документов

Делитесь документами с другими участниками процесса и проставляйте различные цифровые подписи в одном PDF-файле.

Управление комментариями для ускорения принятия решений

Просматривайте все комментарии на отдельной панели и выполняйте поиск по ним, используя ключевые слова, сортируйте и фильтруйте комментарии.

Защита и подпись PDF

В целях безопасности защищайте содержимое PDF-документов. Ставьте и проверяйте цифровые подписи, удаляйте конфиденциальную информацию и скрытые данные, а также управляйте доступом к вашим PDF-документам.

Удаление конфиденциальных данных

Перед отправкой или публикацией документа удалите из него всю конфиденциальную информацию (личные данные, номера банковских карт и т. д.) в специальном режиме. Используйте поиск по ключевым словам, чтобы выбрать нужные данные и удалить их сразу со всех страниц. Выполняйте поиск и редактируйте либо отдельные ключевые слова, либо заранее определенный список ключевых слов по всему документу.
Программа помогает удалить информацию не только с видимого изображения страницы, но и из текстового слоя, в том числе из основного текста, колонтитулов, комментариев и метаданных.

Удаление скрытых данных

Снижайте риск случайного разглашения конфиденциальной информации из PDF-документов за один щелчок мыши – с помощью функции удаления скрытых объектов и данных. Вы можете удалять текстовый слой, добавленный при распознавании, комментарии, вложенные файлы, закладки, метаданные, ссылки и т.д.

Защита с помощью пароля

С помощью пароля можно запретить доступ к документу или ограничить отдельные действия – просмотр, печать, редактирование и извлечение информации.

Цифровая подпись

Защищайте PDF-документы с помощью электронной цифровой подписи. Программа позволяет не только подписать документ, но и показать изменения, которые произошли после подписания. К цифровой подписи можно добавить изображение, например, вашей подписи от руки. Его можно сохранить как шаблон и добавлять на документ в удобное место и без создания электронной цифровой подписи.

Создание PDF

Создавайте PDF-документы любым удобным способом – через главное окно программы, через Проводник Windows® или напрямую из приложений Microsoft® Office. Можно быстро создать новый PDF-файл из отдельных страниц открытого документа. С помощью ABBYY FineReader PDF 15 можно создавать PDF-файлы из более чем 25-ти различных форматов файлов.

Создание PDF с возможностью поиска

С легкостью превращайте бумажные документы, сканы и отсканированные PDF в PDF-документы с возможностью поиска. Это удобно, если вам нужно создать цифровой архив и искать в документах нужную информацию. ABBYY FineReader PDF 15 поддерживает формат PDF/A, который является стандартом для долгосрочного архивирования с поддержкой всех вариантов от PDF/A-1 до PDF/A-3.

Быстрое конвертирование в редактируемые форматы

Быстро конвертируйте PDF-файлы в полностью редактируемые форматы (Microsoft Word, Excel и другие). Интеллектуальные технологии оптического распознавания текста и преобразования PDF-документов ABBYY обеспечивают превосходную точность, сохранность структуры документа для дальнейшего легкого редактирования.

Объединение несколько документов в один PDF

Объединяйте несколько документов разного формата (PDF, документы Microsoft® Word или Excel®, презентации PowerPoint® и др.) в один PDF или создавайте полностью новый файл, объединяя страницы из уже существующих PDF-документов.

Профессиональные инструменты для распознавания текста

OCR-редактор предоставляет расширенные инструменты и возможности для контроля и исключительной точности конвертирования PDF-документов в редактируемые форматы.

Создание интерактивных PDF-форм

Создавайте и редактируйте свои собственные заполняемые формы в PDF для эффективного сбора информации и создания шаблонов документов. Составляйте свои формы из интерактивных полей различных типов, изменяйте параметры форм, задавайте действия, редактируйте существующие PDF-формы или добавляйте формы в обычный документ PDF.

Создавайте новые PDF-формы

Добавляйте действия

Настраивайте внешний вид и параметры форм

Редактируйте интерактивные pdf-формы, созданные в других приложениях

Сравнение документов разного формата

Быстро и точно находите различия в двух версиях документа в различных форматах, включая сканы, чтобы предотвратить подписание или публикацию некорректной версии. Вам понадобится всего несколько секунд, чтобы обнаружить различия в двух версиях одного документа, проверить соответствие внесенных изменений договоренностям или подтвердить отсутствие исправлений.

Быстрое, точное и простое сравнение документов

Акцент на значимых различиях

Экспортируйте и делитесь результатами сравнения

Сравнение документов, написанных на разных языках

Оцифровка бумажных документов и сканов с помощью OCR

Воспользуйтесь специальными инструментами, чтобы автоматически оцифровывать сразу большое количество документов или конвертировать их в редактируемые форматы. Оцените непревзойденную точность ведущей на рынке технологии оптического распознавания символов (OCR) на основе искусственного интеллекта и узнайте, как она упрощает работу с документами.

Поиск в PDF

Легко превращайте бумажные документы и сканы в PDF-файлы с возможностью поиска.Упростите поиск по вашим бумажным и PDF-документам, приведите архивы в соответствие с отраслевыми стандартами (например, храните файлы в формате PDF/A), чтобы сделать хранение более безопасным.

Повторное использование и редактирование

Преобразуйте бумажные и отсканированные документы в редактируемые файлы в Microsoft Word, Excel, OpenOffice Writer и других распространенных форматах. Технологии оптического распознавания текста и преобразования документов ABBYY на базе искусственного интеллекта обеспечивают высокую точность и сохраняют макет и структуру для дальнейшего легкого редактирования.

Быстрое конвертирование

ABBYY FineReader PDF 15 позволяет быстро конвертировать PDF-файлы в редактируемые форматы – Microsoft® Word, Excel®, PowerPoint®, OpenOffice™ Writer, форматы электронных книг и многие другие. Интеллектуальные технологии обеспечивают превосходную точность распознавания и сохраняют разметку и структуру документа для удобного и легкого редактирования. ABBYY FineReader PDF 15 воспроизводит исходную структуру многостраничных документов, включая расположение текста, таблиц, колонтитулов, примечаний, нумерацию страниц, содержания, оглавления и др. Инструмент верификации позволит быстро и точно проверить только те символы в распознанном тексте, которые могли быть распознаны неверно.

Уменьшение размера файла

Уменьшите размер файлов PDF в 20 раз с помощью сжатия MRC.

Cканирование документов с помощью мобильного устройства *

С новым ABBYY FineReader PDF Mobile, установленным на вашем устройстве iOS или Android, вы можете сканировать документы и отправлять их прямо в FineReader PDF 15 на ПК с Windows для дальнейшей работы.

* Требуется мобильное приложение (ABBYY FineReader PDF для Android или ABBYY FineReader PDF для iOS). Вы можете скачать их из Google Play и App Store.

Оптимизация оцифровки и процесса конвертации

Используйте функции FineReader PDF, интегрированные в Microsoft Office. Воспользуйтесь подходом digital-first: работа с PDF-файлами вооружает солидными преимуществами. Автоматизируйте процессы конвертации разных видов документов и форматов: PDF, Microsoft® Word, Excel® и еще более 15 других.

Интеграция с Microsoft Office

Автоматизация с помощью Hot Folder

С помощью приложения ABBYY Hot Folder можно автоматизировать однотипные или повторяющиеся задачи по обработке документов. Просто укажите путь к папке с исходными файлами, которые нужно конвертировать, настройте параметры обработки и укажите, куда сохранить результат. С помощью приложения вы сможете упростить ежедневные задачи по конвертации большого количества документов и делать это в несколько кликов мыши. Горячая папка, созданная через приложение Hot Folder, может обрабатывать до 5 000 страниц в месяц*, используя при этом до 2 ядер процессора для конвертации.

Настройка задач для отслеживаемых папок

Настройте просмотр горячей папки на локальном или сетевом диске, FTP-сервере или почтовом ящике, и все файлы, которые в нее попадут, будут автоматически конвертироваться в соответствии с заданными настройками и графиком. С помощью горячих папок вы можете, например, подготовить документы, отсканированные на офисном сканере или полученные по электронной почте, к дальнейшей обработке. ABBYY Hot Folder позволяет настроить процесс обработки для каждой такой папки индивидуально: установить время выполнения задачи или регулярность, например, каждый час, ежедневно или еженедельно.

Настраиваемые задачи для стандартных процессов

Настройте автоматические задачи для ежедневного использования. Упростите выполнение повторяющихся работ с документами всего за несколько кликов.

Свидетельство и скидка на обучение каждому участнику

Зарегистрироваться 15–17 марта 2022 г.

КОНСПЕКТ ЗАНЯТИЯ

Тема занятия: Возможности программы FineReader. Технология распознавания. Распознавание текста.

Цель занятия : Изучить возможности программы FineReader. Технология распознавания.

ABBYY FineReader — программа для мгновенного распознавания цифровых изображений и PDF-файлов любых типов с возможностью преобразования результатов в наиболее популярные электронные форматы DOC, XLS, RTF, PPT, HTML, PDF, PDF/A, CSV, TXT и DJVU.

ABBYY — мировой флагман технологий оптического распознавания, разработчик программ и сервисов лингвистической поддержки. Популярные словари, разговорники и онлайн-переводчики ABBYY Language Services, ABBYY Lingvo , ABBYY PDF Transformer – всё это продукты компании АББИ. Но добилась наибольшего признания и получила самое широкое распространение программа для распознавания текста из результатов сканирования и файлов pdf - Abby Fine Reader, за двадцать пять лет существования став незаменимым помощником для миллионов людей во всём мире.

ABBYY FineReader 10 Home Edition скачать бесплатно на русском и еще на 178 языках можно с официального сайта АББИ. Файн Ридер 10 автоматически корректирует искажение перспективы и исправляет резкость снимков, а технология Digital OCR позволяет распознать фото документов с разрешением более 2 Мп. АББИ Файнридер 10 поддерживает 188 языков распознавания, имеет возможность сохранения результатов сканирования в формате DjVu , действует в течение 15 дней и распознаёт до 50 страниц. Размер: 110 МБ.

FineReader позволяет ввести документ одним нажатием на кнопку Scan&Read, не вдаваясь в подробности работы программы. Распознанный текст можно передать в текстовый редактор или электронную таблицу, сохранить в форматах PDF и HTML с полным сохранением оформления документа или сохранить в базе данных

В системе FineReader инструментальных панелей всего 4: Стандартная, Изображение, Форматирование и главная панель программы Scan&Read. Кнопки на инструментальных панелях - самое удобное средство доступа к операциям системы. Те же операции можно выполнять из меню программы или с помощью горячих клавиш.

Главная панель программы - Scan&Read

Кнопки на панели Scan&Read связаны с базовыми операциями системы: Сканирование, Распознавание, Проверка и Сохранение результатов распознавания. Цифры на кнопках указывают, в каком порядке нужно выполнить действия, чтобы получить электронную версию бумажного документа. Каждое из этих действий можно провести по отдельности или объединить в одно, нажав на кнопку Мастер Scan&Read. Она позволяет провести полный цикл обработки текста автоматически. Каждая из кнопок имеет несколько режимов работы. Нажав на стрелку справа от кнопки, в открывшемся локальном меню Вы можете выбрать один из них, при этом "информация" об этом отразится на иконке кнопки. Для того, чтобы повторить ту же операцию для другого изображения, Вам достаточно повторно нажать на кнопку.

На панели Форматирование находятся кнопки, позволяющие изменить оформление текста.

Панель Изображение содержит кнопки, позволяющие производить анализ макета страницы (например, создать и отредактировать блоки), а также кнопки, позволяющие увеличить/уменьшить масштаб изображения, отредактировать изображение (например, стереть ненужные участки изображения, такие, как подписи или большие участки мусора).

На панели Стандартная находятся кнопки, управляющие работой с файлами и изображением (отмена и повтор действия, перемещение по страницам пакета, очистка и поворот изображения), а также список языков распознавания.

Читайте также: