Реферат на тему инструменты распознавания текстов и компьютерного перевода

Обновлено: 05.07.2024

Обзор систем оптического распознавания изображений: ABBYY Finereader, SimpleOCR, FreeOCR, Microsoft Office Document Imaging. Алгоритм распознавания образов: захват кадра; предварительная обработка (предобработка); локализация и распознавание объекта.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 08.06.2019
Размер файла 583,7 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Министерство образования Российской Федерации

Государственное образовательное учреждение

высшего профессионального образования

Воронежский государственный технический университет

Кафедра систем информационной безопасности

Выполнил: студент гр. КБ-11

1. История развития

В 1929 году Gustav Tauschek получил патент на метод оптического распознавания текста в Германии, а в 1935 в США. Машина Таушека представляла собой механическое устройство, которое использовало шаблоны и фотодетектор.

Почтовая служба Соединённых Штатов с 1965 года для сортировки почты использует машины, работающие по принципу оптического распознавания текста, созданные на основе технологий, разработанных исследователем Яковом Рабиновым. В Европе первой организацией, использующей машины с оптическим распознаванием текста, был британский почтамт. Почта Канады использует системы оптического распознавания символов с 1971 года. На первом этапе в центре сортировки системы оптического распознавания символов считывают имя и адрес получателя и печатают на конверте штрих-код. Он наносится специальными чернилами, которые отчётливо видимы в ультрафиолетовом свете. Это делается, чтобы избежать путаницы с полем адреса, заполненным человеком, которое может быть в любом месте на конверте.

В 1993 году вышла технология распознавания текстов российской компании ABBYY. На её основе создан ряд корпоративных решений и программ для массовых пользователей. В частности, программа для распознавания текстов ABBYY FineReader, приложения для распознавания текстовой информации с мобильных устройств, система потокового ввода документов и данных ABBYY FlexiCapture. Технологии распознавания текстов ABBYY OCR лицензируют международные ИТ-компании, такие как Fujitsu, Panasonic, Xerox, Samsung, EMC и другие.

2. Обзор систем оптиче ского распознавания изображений

Оптическое распознавание символов (OCR) - перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующие для представления символов в компьютере (например, в текстовом редакторе).

Распознавание широко используется для конвертации книг и документов в электронный вид, автоматизации систем учёта в бизнесе или публикации текста в интернете. Распознанный текст может быть отредактирован, его удобно хранить, осуществлять поиск слов или фраз, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание изображений, содержащих текст, является широко исследуемой проблемой на стыке областей распознавания образов, искусственного интеллекта и компьютерного зрения.

На стадии подготовки и обработки информации, особенно при компьютеризации предприятия, автоматизации бухучета, возникает задача ввода большого объема текстовой и графической информации в персональный компьютер. Основными устройствами для ввода графической информации являются: сканер, факс - модем, реже, цифровая фотокамера. Кроме того, используя программы оптического распознавания текстов, можно вводить в компьютер (оцифровывать) также и текстовую информацию. Современные программно - аппаратные системы позволяют автоматизировать ввод больших объемов информации в компьютер, используя, например, сетевой сканер и параллельное распознавание текстов на нескольких компьютерах одновременно.

2.1 ABBYY Finereader

Программа позволяет переводить изображения документов (фотографий, результатов сканирования, PDF - файлов) в электронные редактируемые форматы. В частности, в Microsoft Word, Microsoft Excel, Microsoft Powerpoint, Rich Text Format, HTML, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы. Начиная с 11 версии файлы можно сохранять в формате djvu. Версия 12 поддерживает распознавание текста на 190 языках и имеет встроенную проверку орфографии для 48 из них.

2.2 SimpleOCR

SimpleOCR - это популярное бесплатное программное обеспечение для распознавания текста на английском и французском языках. Стоит отметить, что если документы содержать разметку с несколькими колонками, нестандартные шрифты, цветные изображения или изображения в низком качестве, в таком случае потребуется скачать одно из четырех платных приложений для программы распознавания.

Программа может работать с документами на английском и французском языках, но не сможет распознать символы с различными надстрочными и подстрочными знаками (например, ц, д, й и т.д.), используемые только в других языках.

SimpleOCR - простая программа для распознавания текста, но, к сожалению, программа не рассчитана на работу с русским языком. При необходимости получения более широкого функционала потребуется приобретение платных дополнений.

2. 3 FreeOCR

FreeOCR - бесплатная программа для распознавания отсканированного текста. Она работает только с файлами изображений, но и с PDF - файлами и непосредственно со сканером. Для сканирования необходим только подключенный сканер. Для установки данной утилиты необходим доступ к интернету, т.к. запускаемое приложение весит около 150 Кб, дополнительные базы и словари скачиваются во время работы из сети Интернет. В общей сложности программа займет на жестком диске не более 11 Мб. Основным плюсом программы является ее полная автоматизация и отсутствие каких - либо настроек. Поддерживаются форматы JPG, GIF, TIFF BMP и PDF (только первая страница, в скором времени обещают поддержку первых 10 страниц). Так же существует лимит на 10 изображений в час. Утверждается, что система способна распознавать большинство восточноевропейских языков, в том числе русский и украинский. Поддержка русского языка была анонсирована в октябре 2010 года для движка Tesseract 3.0.

2.4 Microsoft Office Document Imaging

Microsoft Office Document Imaging (MODI) - компонент, входящий в состав пакета Microsoft Office и служащий для распознавания и редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включается в последующие версии пакета, в том числе Office 2007. Не доступен, начиная с Office 2010. Для установки Document Imaging в Office 2010 Microsoft выпустила пакет SharePoint Designer 2007.

MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF - файл. По умолчанию движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save (), он может записать исправленное положение страницы в исходный файл.

Имеет невысокую точность распознавания символов, кроме того, предъявляет высокие требования к качеству входных изображений.

2.5 OCRFeeder

OCRFeeder -- программа, предоставляющая графический интерфейс пользователя для нескольких систем оптического распознавания символов, таких как CuneiForm, Tesseract, GOCR и Ocrad. OCRFeeder является свободно распространяемой программой для операционной системы Linux.

1) PIL -- библиотека Python для работы с изображениями.

2) Unpaper -- для обработки изображений.

3) ReportLab -- для импорта PDF - файлов.

4) PyGTK и Libgnome -- для графического интерфейса.

1. Графические форматы ввода данных: PNG, JPEG, BMP, TIFF, GIF, Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF - файлов.

2. Форматы вывода данных: текстовый файл, , ODT, HTML, PDF.

3. Обработка изображений для улучшения качества распознавания - фильтры шумов, чёрного цвета и оттенков серого; и другие виды обработок, доступных для Unpaper (компонента для обработки изображений).

4. Ручное выделение блоков на странице.

5. Проверка орфографии.

6. Получение изображений со сканера посредством программы SANE.

7. Распознавание нескольких изображений по порядку за один проход

3. Сравнение систем оптического распознавания изображений

Представленные OCR - системы являются наиболее популярными и известными, однако ввиду активного развития области распознавания, подобных систем существует очень мало. Проведем сравнительный анализ по приведенным выше системам оптического распознавания символов.

Для оценки качества OCR - систем существуют различные критерии оценки качества. Поток всех операций, входящий в процесс оптического распознавания, можно разделить на два этапа, которые с большой значимостью влияют на конечный результат: это структурный анализ и распознавание текста. Для каждого этапа существуют собственные оценки качества.

1) Оценка результатов структурного анализа документов;

2) Оценка результатов распознавания по эталоном;

3) Оценка результатов распознавания без эталонов.

Имеется ряд существенных проблем, связанных с распознаванием рукописных и печатных символов. Наиболее важные из них:

1. Разнообразие форм начертания символов;

2. Искажение изображения символов;

3. Вариации размеров и масштаба символов.

В таблице 1 представлено сравнение систем по приведенным проблемам и с учётом способов оценки качества:

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

§ 4.5. Инструменты распознавания текстов и компьютерного перевода

Информатика. 7 класса. Босова Л.Л. Оглавление

4.5.1. Программы оптического распознавания документов

Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией.

Очень часто возникает необходимость ввести в компьютер несколько страниц текста из книги, статью из журнала или газеты и т. д. Конечно, можно затратить определённое время и просто набрать этот текст с помощью клавиатуры. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.

Вычислим общее количество символов в романе:

590 • 48 • 53 = 1 500 960 символов.

Вычислим время, необходимое для ввода этого массива символов в память компьютера: 1 500 960 : 150 ? 10 000 мин. А это приблизительно 167 часов.

При этом мы не обсуждаем вопрос о времени на исправление возможных ошибок при таком способе ввода текста, не принимаем в расчёт усталость человека.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является ABBYY FineReader. Упрощённо работу с подобными программами можно представить так:

1. Бумажный носитель помещается под крышку сканера.
2. В программе отдаётся команда Сканировать и распознать. Сначала создаётся цифровая копия исходного документа в формате графического изображения. Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
3. Распознанный текст переносится в окно текстового редактора (например, Microsoft Word).

Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Например, при работе с книгами в библиотеке вы можете сфотографировать интересующие вас страницы. Скопировав снимки на компьютер, вы можете запустить ABBYY FineReader, распознать тексты и продолжить работу с ними в текстовом процессоре (рис. 4.20).


4.5.2. Компьютерные словари и программы-переводчики

Возможности современных компьютеров по хранению больших массивов данных и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.

В обычном словаре, содержащем несколько сотен страниц, поиск нужного слова является длительным и трудоёмким процессом. Компьютерные словари обеспечивают мгновенный поиск словарных статей. Многие словари предоставляют пользователям возможность прослушивания слов в исполнении носителей языка.

Компьютерные словари (русско-английские и англо-русские, русско-французские, русско-немецкие и др.) могут быть установлены на компьютер как самостоятельные программы, бывают встроены в текстовые процессоры, существуют в on-line-режиме в сети Интернет.

Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики. Они основаны на формальном знании языка — правил словообразования и правил построения предложений. Программа-переводчик сначала анализирует текст на исходном языке, а затем конструирует этот текст на том языке, на который его требуется перевести.

САМОЕ ГЛАВНОЕ

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.

Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков. Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Вопросы и задания

1. Ознакомьтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Дополняет ли презентация информацию, содержащуюся в тексте параграфа?

2. В каких случаях программы распознавания текста экономят время и силы человека?

4. Найдите в Интернете информацию о технологии сканирующего листания. В чём её суть?

5. Какие, по вашему мнению, основные преимущества компьютерных словарей перед обычными словарями в форме печатных книг?

6. Почему программы-переводчики успешно переводят деловые документы, но не годятся для перевода текстов художественных произведений?

§ 4.5. Инструменты распознавания текстов и компьютерного перевода

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВО.

Описание презентации по отдельным слайдам:

ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВО.

ИНСТРУМЕНТЫ РАСПОЗНОВАНИЯ ТЕКСТОВ И КОМПЬЮТЕРНОГО ПЕРЕВОДА ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ

Ключевые слова программы распознавания документов компьютерные словари програ.

Ключевые слова программы распознавания документов компьютерные словари программы-переводчики

Программы оптического распознавания документов Для ввода текстов в память ком.

Программы оптического распознавания документов Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является ABBYY FineReader. Бумажный носитель помещается под крышку сканера В программе отдаётся команда Сканировать и распознать Распознанный текст переносится в окно текстового редактора Работа с программой распознавания текста Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Отсканированные документы Фотографии текстов Оптическое распознавание документов

Компьютерные словари и программы-переводчики Компьютерные словари обеспечиваю.

Компьютерные словари и программы-переводчики Компьютерные словари обеспечивают мгновенный поиск словарных статей. Многие словари предоставляют пользователям возможность прослушивания слов в исполнении носителей языка. Установлен на компьютер как самостоятельная программа Встроен в текстовый процессор В on-line-режиме в сети Интернет Конструирование текста на требуемом языке Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики. Формальное знание языка Анализ текста на исходном языке Программа-переводчик Техническая документация Деловая переписка Компьютерный словарь

Самое главное Для ввода текстов в память компьютера с бумажных носителей испо.

Самое главное Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков. Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Вопросы и задания В каких случаях программы распознавания текста экономят вре.

Сканеры и программы распознавания символов используют для ввода текстов с бум.

Сканеры и программы распознавания символов используют для ввода текстов с бумажных носителей в память компьютера. Опорный конспект Компьютерный словарь Перевод отдельных слов Перевод словосочетаний Программа-переводчик Техническая документация Деловая переписка


Современный мир меняется и улучшается каждую минуту. Ещё недавно для того, чтобы почитать, мы были вынуждены покупать книги или ходить в библиотеку и брать книги там. А сейчас достаточно зайти в интернет, найти интересную книгу и читать её с компьютера, телефона или специального устройства – электронной книги. На этом уроке учащиеся узнают, как в интернет попали книги. Узнают, какие программы предназначены для распознавания документов, что называют компьютерными словарями, для чего предназначены программы-переводчики.


В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобретя в каталоге.

Получите невероятные возможности




Конспект урока "Инструменты распознавания текстов и компьютерного перевода"

Современный мир меняется и улучшается каждую минуту. Ещё недавно для того чтобы почитать мы были вынуждены покупать книги или ходить в библиотеку и брать книги там. А сейчас достаточно зайти в интернет, найти интересную книгу и читать её с компьютера, телефона или специального устройства – электронной книги.

А задумывались вы, как в интернет попали все эти книги. Можно предположить, что какой-то ответственный человек сидел и набирал тексты книг на компьютере.


Как вы уже догадались, данный способ перевода печатного текста на компьютер не эффективен и не практичен.

Гораздо быстрее и удобнее использовать специальный инструмент, такой как например сканер, который за считаные секунды переведёт любую бумажную информации в цифровую.


А когда же появился сканер? Давайте рассмотрим историю появления этого инструмента.

Можно сказать, что создание сканера началось со времён изобретения всем известного телеграфа. Был изобретён прибор, который передавал изображение на расстояния.


Но очень бурное развитие сканера началось в начале XX века, в те времена, когда был изобретён фототелеграф, как мы привыкли его называть – телефакс. В 1902 году, немецкий физик Артур Корн запатентовал технологию фотоэлектрического сканирования, получившую впоследствии название телефакс.


Передаваемое изображение закреплялось на прозрачном вращающемся барабане, луч света от лампы, перемещающейся вдоль оси барабана, проходил сквозь оригинал и через расположенные на оси барабана призму и объектив попадал на селеновый фотоприёмник.


Эта технология до сих пор применяется в барабанных сканерах.


После этого учёными было сделано, новое прорывное в будущее изобретение – был изобретён новый способ сканирования, который гордо носит название – планшетный.

Рассмотрим принцип действия планшетных сканеров.

Сканируемый объект кладётся на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отражённый от объекта, через систему зеркал попадает на чувствительную матрицу и передаётся в компьютер. За каждый шаг двигателя сканируется полоска объекта, все полоски потом объединяются программным обеспечением в общее изображение.

Данная конструкция имеет ряд преимуществ перед своими предками, основное из которых – это то, что сканер передаёт изображение в компьютер.

На сегодняшний день рынок компьютерной техники насчитывает огромное количество моделей сканеров.


Многие привыкли называть сканер – фотоаппарат, который фотографирует изображения.

Сканеры используются для ввода изображений на компьютер. С помощью сканера мы получаем на своём компьютере электронный снимок. Сканер иногда заменяет нам факс. Любой документ, любую фотографию мы можем отсканировать и передать по электронной почте.

Итак, отсканированный снимок попал в компьютер. Но дальше эту информацию нужно распознать, отредактировать и изменить. Для этого нам нужно воспользоваться специальной программой ABBYY FineReader.


Остановимся подробнее на работе такой программы:

1) В начале, вам необходимо отсканировать текст с помощью сканера. Для этого вы помещаете текст под крышку сканера, и в программе отдаёте команду Сканировать и распознать. Тем самым мы создаём цифровую копию исходного документа в формате графического изображения.

2) Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы и картинки. Строки разбиваются на слова, а слова на буквы. Затем программа сравнивает найденные символы с шаблонами из своей памяти. Кроме того, в программу встроены словари, которые позволяют производить более точный анализ и распознавание и проверку распознанного текста. Проанализировав огромное количество вариантов, программа выдаёт окончательное решение пользователю распознанного текста.

3) И наконец, распознанный текст переносится в окно текстового редактора, например, Microsoft Word.

Однако, качество распознанного текста зависит от того как хорошо виден исходный текст. Отсканированный и распознанный текст обязательно нужно перечитать и отредактировать.

Современные технологии позволяют не использовать сканер, а вместо него воспользоваться фотоаппаратом или даже телефоном.

А теперь вспомните те далёкие годы, когда ещё не было печатных станков и нашим предкам приходилось вручную переписывать рукописи, чтобы они дошли до наших дней. Каким тяжёлым и важным был труд писарей, и как ценна была каждая книга.


Теперь разберёмся для чего предназначены компьютерные словари и программы-переводчики

Основная цель современных компьютерных технологий упрощать, улучшать жизнь человека, делать её комфортнее и динамичнее. Одним из таких удобств являются компьютерные словари и программы-переводчики, которые позволяют мгновенно найти нужное слово, перевести его и даже если нужно - прослушать произношение. Ещё совсем недавно это казалось невозможным. Люди, которые попадали за границу, должны были иметь при себе разговорник или карманный словарь, чтобы иметь возможность общаться с местными жителями.


Сегодня достаточно установить специальное приложение на телефон и общение проходит быстро и комфортно. Вы можете, как набрать на телефоне нужную фразу, так и произнести её, а приложение переведёт её на нужный язык.

Остановимся подробнее на программах переводчиках, установленных на компьютер.


Перейдём к практической части урока.

Затем полученный результат с помощью той же программы переведём на русский язык и сравним исходной текст и конечный результат.

Итак, откроем поисковую систему интернета Гугл. в поисковик запишем переводчик Гугл. В результатах поиска нажимаем на Открыть Google Переводчик.

Скопируем текст из текстового редактора и вставим в окно переводчика. В окошках исходный текст и перевод выберем необходимые языки.

Как видим наш текст мгновенно перевёлся на английский язык.

Теперь скопируем текст на английском языке и вставим его в окно Исходный текст.

Сравним исходный текст и переведённый.

Как видим в первом же слове отличия. Слово Информатика переводчик перевёл как Компьютерные науки.

Анализируя текст, мы видим, что переводчик переводит тексты не точно и может допускать ошибки.

То есть у программ есть свои достоинства и недостатки. В зависимости от задачи, одна особенность может и достоинством, и недостатком.

Достоинством программ является высокая скорость перевода. Всего несколько секунд, и Вы получаете перевод многостраничного текста.

Недостатком же можно назвать то, что программы-переводчики работают не точно. Они годятся для того, чтобы в общих чертах передать, о чём идёт речь, и допускают ошибки в переводе.

Пришло время подвести итоги урока.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.

Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.

Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Читайте также: