Основные характеристики сканера кратко

Обновлено: 30.06.2024

Чтобы выбрать подходящий сканер, нужно заранее определиться, какие задачи вы собираетесь решать с его помощью. Будете ли сканировать фотографии или только текстовые документы, как часто и в каких объёмах. Нужна ли возможность сканирования книг, например, для создания электронной библиотеки, или нет. Планируете ли использование сканера только дома или выбираете вариант для поездок. Также важно изучить, какие виды сканеров существуют и какие параметры влияют на качество результата и стоимость устройств.

Основные характеристики сканеров

Разрешающая способность сканера показывает максимальное количество точек на каждый линейный дюйм (dots per inch), которое может различить устройство. Измеряется в dpi. От разрешения зависит, насколько детализированным получится оцифрованное изображение и как сильно вы сможете увеличить его без потери качества.

Производители указывают два значения, например 1200×1200 dpi.

Первая цифра — оптическое (горизонтальное) разрешение. Зависит от плотности светочувствительных датчиков, приходящихся на каждый дюйм изображения по горизонтали.

Вторая цифра — механическое (вертикальное) разрешение. Показывает точность перемещения сканирующей каретки, либо сканируемого оригинала (в случае если каретка неподвижна) При выборе модели стоит ориентироваться на следующие характеристики.

Глубина цвета — количество цветов, которое способен распознать сканер в каждом пикселе оригинала (внутренняя глубина) и передать в оцифрованном виде (внешняя глубина). Это значение важно при сканировании цветных изображений и практически не учитывается при работе с текстовыми документами.

Скорость сканирования — количество отсканированных изображений за единицу времени. Зависит от выбранного разрешения и режима сканирования (чёрно-белый, цветной или оттенки серого), а также формата оригинала.

Размер поля сканирования — формат, который технически может обработать сканер. Большинство небольших сканеров работают с форматом А4, тогда как профессиональные сканируют и А3, который часто используется для проектов и чертежей.

Типы сканеров

В глобальном смысле все сканеры можно разделить на промышленные и домашние. Промышленные сканеры являются важной частью многих производственных процессов, поэтому к их рабочим возможностям и характеристикам предъявляют повышенные требования. Нагрузка на сканер дома или в малом офисе гораздо ниже, чем в специализированных компаниях, например, архитектурных бюро или полиграфических агентствах, поэтому такие сканеры бывают проще и дешевле своих старших коллег.

По области применения все сканеры делятся на несколько видов.

Планшетные сканеры — одни из самых популярных вариантов, которые используют дома и в офисе. Оригинал (лист бумаги, фотография, книжный или журнальный разворот и т. д.) помещают лицевой стороной на стеклянную рабочую поверхность (планшет) и накрывают откидывающейся крышкой. Сканирующий блок с фотоэлементами и подсветкой перемещается вдоль оригинала и считывает изображение.

Планшетные сканеры могут быть оснащены автоподатчиком, что делает его более функциональным и производительным.

Один из типов планшетных сканеров — паспортные. Они гораздо компактнее и адаптированы для сканирования документов в формате А5 и меньше: паспортов, водительских удостоверений и других.

Протяжные сканеры могут сканировать только отдельные не сшитые листы, протягивая их через неподвижную систему светочувствительных элементов. Работают очень быстро благодаря системе автоматической подачи листов. Такие модели часто используют в офисах для автоматизированного сканирования большого объёма документов, поэтому их иногда называют документными.

Барабанные сканеры отличаются быстротой сканирования, высоким качеством получаемого изображения, правильной передачей даже самых светлых и тёмных оттенков. Сканируемый оригинал закрепляется на внешней поверхности цилиндра (барабана). Барабан вращается с высокой частотой, а сканирующий фотоприёмник перемещается вдоль него и точка за точкой считывает всё изображение. Такие устройства позволяют сканировать как непрозрачные оригиналы (фотографии), так и прозрачные (слайды), поэтому часто используются в полиграфии и фотостудиях.

Плёночные сканеры относятся к специализированным, т. к. предназначены для сканирования только прозрачных оригиналов, таких как слайды, диапозитивы и негативы. Такие устройства редко покупают для дома, в основном их используют в фотостудиях.

Чтобы отсканировать документ ручным сканером, необходимо плавно, по возможности без резких движений провести устройством над изображением. Существуют и другие варианты, представляющие собой компактные версии протяжных сканеров. Ручные сканеры отличаются небольшими размерами и портативностью, работают на батарейках или аккумуляторах, позволяют передавать результат на смартфон или планшет и подходят для сканирования небольшого количества документов, например, во время путешествий или в командировках.

Зная, какие бывают сканеры и предварительно изучив информацию о каждом из них, вы без труда сможете выбрать модель, полностью подходящую под ваши задачи.

Как выбрать сканер (2019)

Любительский

Аватар пользователя

Сканер – устройство, предназначенное для оцифровки изображений, т.е., для создания электронной копии с бумажного носителя.

Сканерами пользуются фотографы, полиграфисты и художники; они необходимы при распознавании текста с бумажных носителей и организации электронного документооборота. Да и в быту потребность в сканере возникает частенько: оцифровать для сохранности старую фотографию, сохранить на диск копию важного документа, сделать электронную копию паспорта для отправки по e-mail – со всем этим сканер справляется намного лучше, чем фотоаппарат.

Еще лет 10-15 назад сканер часто можно было обнаружить как возле офисного, так и домашнего компьютера. Но сегодня на их месте чаще встречаются струйные и лазерные многофункциональные устройства – возможностей встроенного в МФУ сканера вполне достаточно для решения бытовых и нечастых офисных задач.


Отдельный сканер вам потребуется, если вам нужно:

- сканировать изображения с высоким разрешением и точной цветопередачей;

- сканировать изображения с листов большого формата;

- сканировать изображение в дороге, без доступа к сети 220В;

- сканировать множество документов одного формата с высокой скоростью;

- перевести в электронный формат изображения со слайдов, фото- и кинопленки;

- сделать электронную копию с нестандартных носителей: толстых книг, картин, исторических документов, с которыми следует обращаться с особой осторожностью.

И во всех этих случаях потребуются различные сканеры с различными характеристиками.

Характеристики сканеров

Вид.

Планшетный сканер – наиболее привычный для нас вид сканеров с откидывающейся крышкой. Сканируемый документ кладется под крышку лицевой стороной на стекло, под которым движется сканирующий блок - сенсор и лампы подсветки.


Это простая и недорогая конструкция, однако пользоваться таким сканером не всегда удобно. Если документов много, да еще и сканировать их нужно с двух сторон, то процесс может затянуться надолго. Кроме того, стекло хорошо собирает пыль и краску с документов и его время от времени надо вытирать. Так что для оцифровывания больших объемов планшетный сканер непригоден. Зато в него можно помещать нерасшитые документы – журналы, брошюры, буклеты и т.д. Такие сканеры часто используются фотографами и полиграфистами – планшетными являются все профессиональные модели с высоким разрешением.


Среди этого вида сканеров существуют и компактные модели с питанием от аккумуляторов – они объединяют присущее стационарным сканерам высокое качество изображения с компактностью и мобильностью ручных сканеров.


В ручном сканере отсутствуют, как бумагопротяжный механизм, так и движущийся сканирующий блок – для сканирования документа пользователю самому надо провести сканером по документу.


Такие сканеры легки, компактны, недороги, часто могут работать от аккумуляторов или батареек. С их помощью можно сканировать сшитые документы, страницы книг, и даже наклеенные на стену объявления.

Основной минус – качество изображения сильно зависит от равномерности движения сканера по листу. Для того, чтобы получить изображение без заметных глазу искажений, нужно иметь твердую руку и некоторую сноровку. Да и в этом случае изображения будет заметно уступать по качеству полученным стационарным сканером.

Слайд-сканер предназначен для просветного сканирования негативов и слайдов. Такие сканеры используются профессионалами для оцифровки изображений с фото- и кинопленок.


Среди планшетных сканеров также есть модели со слайд-адаптером, способные сканировать плёнку. Но качественно оцифровать слайды планшетным сканером можно только в том случае, если у него есть отдельный режим просветного сканирования и вторая лампа на крышке.


Многие обычные планшетные сканеры снабжены слайд-адаптером, но качество оцифровки слайдов на них будет невысоким – на свет лампы, отраженной от самой пленки, накладывается свет, прошедший сквозь пленку и отраженный от крышки, что приводит к размытию деталей и снижению четкости изображения. Да и сенсор в слайд-сканерах намного качественнее.

Впрочем, для бытового использования и оцифровки любительских слайдов будет достаточно и простого планшетного сканера со слайд-адаптером.

Фотоаппаратный сканер – достаточно редкое профессиональное устройство, выглядящее как цифровой фотоаппарат, закрепленный на L-образном кронштейне вместе с осветительными лампами. От обычного фотоаппарата на штативе такой сканер отличается программным обеспечением, облегчающим обработку документов и сопряжение с соответствующим ПО в компьютере.


Фотоаппаратный сканер позволяет производить сканирование нерасшитых документов с минимальной нагрузкой для них – это позволяет использовать его в библиотеках для оцифровки редких книг и ветхих документов.

Разрешение сканера определяет максимальное количество пикселей на дюйм сканируемого документа, которое сканер способен различить. Чем выше разрешение, тем более мелкое и детальное изображение может быть оцифровано без потери качества.

Но тут следует иметь в виду, что большинство сканируемых документов имеют свое разрешение – то, с которым они были отпечатаны. И это разрешение редко превышает 300 dpi, поэтому 600х600 dpi достаточно для сканирования большинства документов.


Большие значения могут потребоваться при оцифровке качественной полиграфии и фотографий – от 1200х1200 до 2400х2400 dpi.

Наибольшее разрешение требуется при оцифровке изображений с пленки: в этом случае лучше ориентироваться на разрешение 3600х3600 dpi и выше.

Тип датчика (сенсора) сканера оказывает немалое влияние на качество оцифрованного изображения.

В сканере на основе CCD-матрицы свет лампы подсветки, отразившись от сканируемого документа, пройдя сквозь систему зеркал и линз, попадает на линейную CCD-матрицу.


Несколько лет назад CCD-матрицы частенько встречались и в фотоаппаратах, наряду с CMOS-матрицами. Они обладали хорошими показателями по качеству изображения, но сильно уступали по скорости его получения и энергоптреблению, в конце концов, из фотоаппаратов полностью исчезнув. А вот в сканерах требования к скорости получения изображения не такие высокие. Сканеры с датчиком на основе CCD-матрицы значительно дороже, но и качество изображения обеспечивают заметно лучшее. Особенно это касается глубины резкости, что хорошо заметно, когда сканируемое изображение не идеально плоское.


СIS – единый элемент, содержащий в себе три линейки светодиодов разного цвета, оптический элемент и линейку светочувствительных сенсоров. Размер CIS-сенсора равен ширине сканирования, поэтому системы линз для масштабирования изображения здесь не нужно.


Сканер на основе такого сенсора дешевле, но и качество изображения у него похуже. Кроме уже упомянутой меньшей глубины резкости, CIS-сенсор хуже передает цвета. Впрочем, технология совершенствуется и на топовых моделях цветопередача уже почти не зависит от вида сенсора, но у недорогих моделей сравнение будет, скорее всего, не в пользу CIS.

CMOS, многим знакомый по цифровым камерам, в сканерах применяется редко – его используют только некоторые специализированные слайд-сканеры. По качеству изображения такие сканеры не уступают моделям с CCD-матрицами.

Скорость сканирования будет очень важна, если сканировать нужно часто и много.

Выбирая модель по скорости сканирования, не обольщайтесь высокими показателями планшетных сканеров без автоподачи – они не учитывают времени, потраченного на замену документа. Скорость 10 страниц в минуту для такого сканера означает лишь, что один лист он отсканирует за 6 секунд. И, если вы не успеете мгновенно поменять документ в сканере, 10 страниц в минуту вам добиться не удастся.

Если сканировать нужно много, выбирать следует среди сканеров с автоподачей – т.е., таких, которые могут автоматически брать очередной лист из входного лотка и проводить его сканирование.


Обратите внимание, что тип устройства автоподачи может быть различным – если вам нужно сканировать документы с обеих сторон, вам нужен сканер с двусторонней автоподачей.

Также имейте в виду, что в характеристиках сканера обычно приводится максимальная скорость сканирования, достигаемая при минимальном разрешении (обычно – 300 dpi). Уточните этот момент, если вам важна скорость на высоком разрешении, потому что увеличение разрешения ведет к пропорциональному увеличению времени сканирования.

Глубина цвета показывает, сколько цветов в каждом пикселе может распознать сенсор сканера (внутренняя глубина цвета) и сколько он может передать в компьютер (внешняя глубина цвета).


Варианты выбора сканеров.

Если вы вводите электронный документооборот и вам нужен сканер, способный оцифровать большой объем документации, выбирайте среди высокоскоростных протяжных сканеров с автоподачей.


Планшетный сканер работает медленнее, но зато его можно использовать для оцифровки брошюр, книг и журналов.

Если же вам нужен сканер, который может, и автоматически оцифровать пачку листов, и снять цифровую копию с книжного разворота, выбирайте среди планшетных или планшетно-протяжных сканеров с автоподачей.


Для качественной оцифровки фотографий вам потребуется планшетный сканер с высоким разрешением.

Для качественной оцифровки слайдов и изображений с пленки, вам потребуется слайд-сканер.


Чтобы иметь возможность отсканировать чертеж, таблицу или картину формата А3, выбирайте среди сканеров с соответствующим максимальным форматом бумаги.

Ручной сканер может пригодиться в командировке или в дороге, когда стационарный сканер использовать затруднительно.


Фотоаппаратный сканер обеспечит максимально бережное обращение со сканируемым документом.

Сканер — устройство ввода, назначение которого оцифровка информации, хранящейся на нецифровом носители, с её последующей передачей в память ПК в виде графики.

Основные характеристики сканера

Основными параметрами, на которые стоит опираться при выборе данного периферийного устройства, являются: тип сканера, тип установленного датчика, разрешение, оптическая плотность, глубина цвета, скорость сканирования и поддерживаемый формат нецифрового носителя (А4, А3).

Тип сканера

По типу, сканеры подразделяются на планшетные, протяжные и слайд-сканеры.

Планшетный сканер

Планшетный тип сканера наиболее распространен. Конструктивно сканер состоит из стеклянной основы (планшета) и считывающего механизма под ней. В процессе сканирования документ или книга неподвижны, а информация снимается за счет перемещения линии считывающих фотоэлементов вдоль оригинала.

Протяжный сканер

Сканер имеющий протяжный тип, осуществляет сканирование лишь отдельных листов бумаги, которые проходят через считывающую светочувствительную линию. К сожалению, такой подход не позволяет оцифровывать объемные носители информации.

Слайд-сканер

Слайд-сканер. Данный тип сканера используется для сканирования материалов имеющих прозрачную или полупрозрачную основу. К таким нецифровым носителям, например, можно отнести фотопленку или рентгеновский снимок.

Тип датчика

Тип датчика Contact Image Sensor, CIS

Contact Image Sensor, CIS — представляет собой линию фотоэлементов, которая перемещается вдоль сканируемого материала, и строка за строкой передает информацию с носителя в виде электроимпульсов. Для подсветки оригинала используются светодиоды, расположенные вблизи фотоэлементов. Недостатком данного типа датчиков является малая глубина резкости.

Тип датчика Charge-Coupled Device, CCD

Charge-Coupled Device, CCD – не что иное, как интегральная микросхема, обладающая линией фоточувствительных элементов. При построении картинки, используется оптическая конструкция -включающая в себя зеркало и объектив. Для подсветки сканируемого материала применяется люминесцентная подсветка. Плюсом CCD-сканеров является хорошая глубина резкости и цветопередача. К минусам, можно отнести большую толщину и вес датчика, а также стоимость в сравнении с CIS.

Разрешение

Разрешение сканера зависит от количества фоточувствительных элементов линейки на один дюйм по оси X и минимальным интервалом хода шагового двигателя, также на дюйм, по оси Y. Разрешение – основной параметр при выборе сканера, подавляющее большинство моделей имеет минимальное разрешение 600 х 1200 точек на дюйм (dpi). Почему минимальное? Существует понятие улучшенного разрешения, когда готовое изображение формируется по принципу интерполяции. Для того чтобы получить картинку превышающую разрешение оригинала, пространство между соседними точками заполняется по принципу градации яркости и цвета исходя из данных полученных оптическим способом о цвете и яркости оригинальных точек.

Оптическая плотность

Глубина цвета

Влияет на цветопередачу при сканировании исходных материалов. Различают два вида цветопередачи:

  • внутренняя – количество цветов, различаемых системой сканера;
  • внешняя – количество цветов, которые сканер отправляет на ПК.

В основном используется 24-битная цветопередача, что вполне достаточно для задач офиса или дома. Но, если работать с графикой, необходим сканер с большей разрядностью.

Скорость сканирования

Чем выше этот показатель, тем лучше. Но, нужно помнить, что скорость также зависит от выбранного разрешения и площади сканируемого материала.

Формат сканирования

Максимальный формат оригинала, который может отсканировать устройство. Сканеры, поддерживающие формат A4, получили большее распространение.

Является основной характеристикой сканера. Сканер снимает изображение не целиком, а по строчкам. По вертикали планшетного сканера движется полоска светочувствительных элементов и снимает по точкам изображение строку за строкой. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Оно определяется количеством светочувствительных элементов (фотодатчиков), приходящихся на дюйм горизонтали сканируемого изображения.

Скорость сканирования зависит от разрешения при сканировании и от размера оригинала. Обычно производители указывают этот параметр для формата А4. Скорость сканирования может измеряться количеством страниц в минуту или временем, необходимым для сканирования одной страницы. Иногда измеряется в количестве сканируемых линий в секунду.

Как правило, производители указывают два значения для глубины цвета - внутреннюю глубину и внешнюю. Внутренняя глубина - это разрядность АЦП (аналого-цифрового преобразователя) сканера, она указывает на то, сколько цветов сканер способен различить в принципе. Внешняя глубина - это количество цветов, которое сканер может передать компьютеру. Большинство моделей используют для цветопередачи 24 бита (по 8 на каждый цвет). Для стандартных задач в офисе и дома этого вполне достаточно.

Максимальная оптическая плотность

Максимальная оптическая плотность у сканера - это оптическая плотность оригинала, которую сканер отличает от 'полной темноты'. Чем больше это значение, тем больше чувствительность сканера и тем выше качество сканирования темных изображений.

Устройство сканера

Сканируемый объект кладется на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на чувствительную матрицу, далее на АЦП и передается в компьютер. За каждый шаг двигателя сканируется полоска объекта, которые потом объединяются программным обеспечением в общее изображение.

Виды сканеров

планшетные — наиболее распространённый вид сканеров, поскольку обеспечивает максимальное удобство для пользователя — высокое качество и приемлемую скорость сканирования. Представляет собой планшет, внутри которого под прозрачным стеклом расположен механизм сканирования.

ручные — в них отсутствует двигатель, следовательно, объект приходится сканировать пользователю вручную, единственным его плюсом является дешевизна и мобильность, при этом он имеет массу недостатков — низкое разрешение, малую скорость работы, узкая полоса сканирования, возможны перекосы изображения, поскольку пользователю будет трудно перемещать сканер с постоянной скоростью.

листопротяжные (протяжные) — лист бумаги вставляется в щель и протягивается по направляющим роликам внутри сканера мимо лампы. Имеет меньшие размеры, по сравнению с планшетным, однако может сканировать только отдельные листы, что ограничивает его применение в основном офисами компаний. Многие модели имеют устройство автоматической подачи, что позволяет быстро сканировать большое количество документов.

планетарные или книжные сканеры — применяются для сканирования книг или легко повреждающихся документов. При сканировании нет контакта со сканируемым объектом (как в планшетных сканерах). Книжные сканеры - предназначены для сканирования брошюрованных документов. Сканирование производится лицевой стороной вверх - таким образом, Ваши действия по сканированию неотличимы от перелистывания страниц при обычном чтении. Это предотвращает их повреждение и позволяет пользователю видеть документ в процессе сканирования.

5. Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.




Назначение, устройство и основные характеристики сканеров изображений. Сущность оптического распознавания тексов.

Назначение

Сканер – это устройство, которое анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс получения этой копии называется сканированием.

Является основной характеристикой сканера. Сканер снимает изображение не целиком, а по строчкам. По вертикали планшетного сканера движется полоска светочувствительных элементов и снимает по точкам изображение строку за строкой. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Оно определяется количеством светочувствительных элементов (фотодатчиков), приходящихся на дюйм горизонтали сканируемого изображения.

Скорость сканирования зависит от разрешения при сканировании и от размера оригинала. Обычно производители указывают этот параметр для формата А4. Скорость сканирования может измеряться количеством страниц в минуту или временем, необходимым для сканирования одной страницы. Иногда измеряется в количестве сканируемых линий в секунду.

Как правило, производители указывают два значения для глубины цвета - внутреннюю глубину и внешнюю. Внутренняя глубина - это разрядность АЦП (аналого-цифрового преобразователя) сканера, она указывает на то, сколько цветов сканер способен различить в принципе. Внешняя глубина - это количество цветов, которое сканер может передать компьютеру. Большинство моделей используют для цветопередачи 24 бита (по 8 на каждый цвет). Для стандартных задач в офисе и дома этого вполне достаточно.

Максимальная оптическая плотность

Максимальная оптическая плотность у сканера - это оптическая плотность оригинала, которую сканер отличает от 'полной темноты'. Чем больше это значение, тем больше чувствительность сканера и тем выше качество сканирования темных изображений.

Устройство сканера

Сканируемый объект кладется на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на чувствительную матрицу, далее на АЦП и передается в компьютер. За каждый шаг двигателя сканируется полоска объекта, которые потом объединяются программным обеспечением в общее изображение.

Виды сканеров

планшетные — наиболее распространённый вид сканеров, поскольку обеспечивает максимальное удобство для пользователя — высокое качество и приемлемую скорость сканирования. Представляет собой планшет, внутри которого под прозрачным стеклом расположен механизм сканирования.

ручные — в них отсутствует двигатель, следовательно, объект приходится сканировать пользователю вручную, единственным его плюсом является дешевизна и мобильность, при этом он имеет массу недостатков — низкое разрешение, малую скорость работы, узкая полоса сканирования, возможны перекосы изображения, поскольку пользователю будет трудно перемещать сканер с постоянной скоростью.

листопротяжные (протяжные) — лист бумаги вставляется в щель и протягивается по направляющим роликам внутри сканера мимо лампы. Имеет меньшие размеры, по сравнению с планшетным, однако может сканировать только отдельные листы, что ограничивает его применение в основном офисами компаний. Многие модели имеют устройство автоматической подачи, что позволяет быстро сканировать большое количество документов.

планетарные или книжные сканеры — применяются для сканирования книг или легко повреждающихся документов. При сканировании нет контакта со сканируемым объектом (как в планшетных сканерах). Книжные сканеры - предназначены для сканирования брошюрованных документов. Сканирование производится лицевой стороной вверх - таким образом, Ваши действия по сканированию неотличимы от перелистывания страниц при обычном чтении. Это предотвращает их повреждение и позволяет пользователю видеть документ в процессе сканирования.

5. Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.

Назначение, устройство и основные характеристики сканеров изображений. Сущность оптического распознавания тексов.

Назначение

Сканер – это устройство, которое анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс получения этой копии называется сканированием.

Полезная информация о характеристиках и возможностях современных сканеров знание которой пригодится и для работы и для развлечения.

Есть такая история.
На одном светском обеде пожилой джентльмен сидит рядом с молоденькой девушкой. И, чтобы поддержать беседу, говорит:
— Порой мне бывает стыдно. Появляется столько технических новинок, а я до сих пор не знаю, как работает телевизор.
На что девушка отвечает:
— А что здесь сложного? Нажимаешь на кнопку, и он работает._

Для простейшей офисной работы этого достаточно. В принципе, и для более сложной есть пакеты, например, HP PrecisionScan Pro. Это среда, которая, при минимальном вмешательстве человека, сама неплохо оформляет офисные документы. Она сама неплохо сканирует, выставляя разные параметры сканирования для разных фрагментов: для web-картинок — одни, для текста — другие, для фото на рекламу — третьи. И даже переводит чертежи в векторную графику 3 . В итоге, человек, практически ничего не знающий о тонкостях сканирования и оформления документов, может неплохо и быстро работать.

Современный сканер и его основные характеристики
Оптическое разрешение. Сканер снимает изображение не целиком, а по строчкам. Если назвать длинную сторону сканера вертикалью планшета, а короткую — горизонталью, то по вертикали движется полоска светочувствительных элементов и снимает изображение строку за строкой.

Но и строки снимаются не целиком, а по точкам. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Обычно его считают по количеству точек на дюйм — dpi (dots per inch). Сегодня даже для недорогих сканеров считается нормой уровень разрешения 600 dpi. Этого достаточно для выполнения 95% работ с бумажными носителями. Увеличивать разрешение еще дальше — значит, применять более дорогую оптику, более дорогие светочувствительные элементы, а также многократно затягивать время сканирования. Это может понадобиться разве что для обработки слайдов: для сканирования кадров обычной 35-миллиметровой пленки обычно необходимо разрешение 1200 dpi.

Тип оптической системы. В основном, он зависит от типа светочувствительных элементов. Более качественными по праву считаются приборы с зарядовой связью (ПЗС или CCD). Но сканеры на их базе приходится оснащать сложной оптической системой, чтобы проецировать широкую строку изображения на миниатюрную матрицу ПЗС. Недостатки этого типа — большие размеры и большое энергопотребление (не настолько большое, чтобы разорить владельца сканера, но питание, как правило, приходится получать от сети).

Разрядность цвета. Стандартом в большинстве компьютерных систем де факто стал так называемый формат TrueColor, в котором каждая точка кодируется тремя байтами или 24 битами (в каждом байте — восемь бит). То есть, на представление каждого основного цвета (R — красный, G — зеленый, B — синий; а вместе — RGB) отводится восемь бит. При этом общее количество цветов, которые можно закодировать, составляет более 16 миллионов.

Внутри сканера цвет может кодироваться и большим числом бит. Для непрофессионального пользователя это не так уж важно — на выходе он все равно получит стандартный 24-битный цвет. Но увеличение числа разрядов внутри сканера открывает возможность цветовой коррекции изображения без внесения искажений. Причем коррекция может быть как ручной, так и автоматической.

USB-подключение — наиболее удобное, достаточно быстрое и практически бесконфликтное. В общем, сегодня — это самый популярный интерфейс, разъемы которого есть в любом современном компьютере.

LPT считается наиболее неудачным типом подключения — устаревшим, медленным и ненадежным. Вообще-то, LPT-порт обычно используется для подключения принтеров, но и они потихоньку перебираются на USB. А если еще не перебрались, то принтер и сканер приходится подключать к одному порту. Это главный недостаток сканеров с LPT-подключением, поскольку иногда принтер и сканер начинают конфликтовать — особенно, если их используют одновременно. Данная ситуация не смертельна: можно попробовать разнести устройства по разным портам (например, принтер перевести на USB) или использовать разветвитель LPT. Но если есть возможность, лучше сразу купить сканер с USB. А тип LPT можно порекомендовать для подключения к устаревшим компьютерам.

Что касается скорости ввода, то она является узким местом только при обработке больших цветных изображений с высоким разрешением — когда в результате сканирования образуется файл в несколько десятков мегабайт. А в повседневной работе сканирование листа А4 в градациях серого цвета с разрешением 200 dpi не потребует большого объема данных. Что на LPT-, что на SCSI-сканере сканирование пройдет быстро и разница будет незаметна.

Атавизмы
Мы, пожалуй, уже перебрали все характеристики сканера, которые имеют практическое значение для большинства пользователей. Теперь осталось перечислить те, которые не имеют такого значения, но встречаются в документации.

Работа
Думаю, теперь самое время поговорить о возможностях сканера, но не технических, а чисто функциональных.

Сейчас мы коснулись двух основных задач, для которых применяются сканеры. Это, во-первых, перевод текста в электронную форму и его распознавание. Вторая задача — перевод любого изображения в форму электронной картинки.

При распознавании текста пользователю не важно, в каком виде будет представлен оригинал. Главное, чтобы программа сделала как можно меньше ошибок в чтении символов. Но при сканировании изображений задача как раз противоположная — оригинал необходимо перевести в электронную форму с минимальными потерями в цвете и форме, включая тонкие цветовые переходы и мельчайшие графические детали. При профессиональном подходе к делу, тут приходится проводить довольно сложную процедуру — цветокоррекцию. А именно, параметры сканера подгоняются под параметры монитора и принтера так, чтобы изображение на экране монитора и, соответственно, на отпечатке выглядело как можно ближе к оригинальному. Но для задач большинства простых пользователей цветокоррекцию с успехом заменяют автоматические настройки драйверов. То есть, управляющие программы сканеров, мониторов и принтеров сами принимают решение, в каком виде представить изображение. И, надо сказать, автоматические настройки удовлетворяют запросы пользователей практически на 100%. При этом задача верной передачи особенностей оригинала, как правило, превращается в другую — передать изображение в таком виде, чтобы пользователь остался доволен.

Для серьезных занятий сканографией имеет смысл ознакомиться с теми характеристиками сканера, которые никогда не приводятся в документации.

Впрочем, можно обойтись и без этих премудростей, а просто попробовать сделать сканограммы монет, располагая их на разном расстоянии от центра стекла (разумеется, изображение будет меняться только при перемещении предмета вдоль света лампы, а не поперек). Также можно поэкспериментировать не только с перемещением, но и просто с поворотом монеты на одном месте. В том и состоит основная особенность сканографирования, что даже небольшое перемещение или разворот предмета дает видимый эффект — в итоге этих манипуляций совершенно по-разному подсвечиваются разные фрагменты объекта. Совместив в графическом редакторе несколько сканограмм одной монеты, можно получить уникальное изображение, сделать которое с помощью фотоаппарата очень непросто, практически невозможно.

Последний факт не может не радовать любителей сканирования, поскольку сегодня все больше ощущается, что сканеры потихоньку уходят, сдают позиции цифровым фотоаппаратам. Например, чтобы перевести книгу в электронный вид, бывает проще закрепить цифровую камеру на горизонтальном штативе и быстро щелкать затвором, лихо переворачивая страницы. Программе распознавания совершенно безразлично, откуда взялись графические файлы. А переворачивать страницы у книги, обращенной обложкой вниз, намного легче, чем когда вниз обращены страницы, как положено при сканировании. И бумажную фотографию порой бывает проще переснять цифровой камерой. Так что приятно, что сканеры еще хоть в чем-то, да сильны.

  1. Наиболее распространенный графический формат. Позволяет уменьшать размер файла в несколько раз, но качество изображения при этом теряется. В других распространенных форматах — BMP и TIFF — изображение не сжимается вовсе или сжимается незначительно. Графические файлы при этом занимают много места на диске, но и потери качества отсутствуют (здесь и далее — прим. ред.). вернуться

2. Очень известные программные продукты, предназначенные, соответственно, для распознавания текстов и обработки изображений. вернуться

3. Векторная форма позволяет уменьшать или увеличивать изображение без потери качества. Наиболее известный пример векторной графики — обычные шрифты, используемые во всех приложениях Windows. В отличие от векторной, растровая графика представляет собой математически не связанный набор точек и подвержена искажениям при уменьшении или увеличении. вернуться

4. CorelDraw и QuarkXPress — мощные пакеты, используемые профессиональными дизайнерами. вернуться

5. Кстати, редко, но попадаются CCD-модели, также обходящиеся без сетевого питания (энергия поступает от SCSI-контроллера). вернуться

6. Если точнее, это характеристика самого оригинала — десятичный логарифм отношения потока падающего света к отраженному (если оригинал непрозрачный) или отношения падающего — к проходящему (для прозрачных носителей). А применительно к сканеру, оптическая плотность показывает, какие оригиналы он в состоянии обрабатывать. вернуться

8. Наименьших искажений при сканировании можно добиться, если установленное разрешение кратно максимальному. Например, при максимальном разрешении 600 dpi результат будет лучше, если установить уровень разрешения 300, а не 400 dpi. вернуться

Читайте также: