Дать характеристику поиска информации как информационного процесса кратко

Обновлено: 04.07.2024

Основные понятия информационного поиска. Релевантность, пертинентность и их отличие.

Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

История

Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.

Информационный поиск как процесс

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.

В общем случае поиск информации состоит из четырех этапов:

  • определение (уточнение) информационной потребности и формулировка информационного запроса;
  • определение совокупности возможных держателей информационных массивов (источников);
  • извлечение информации из выявленных информационных массивов;
  • ознакомление с полученной информацией и оценка результатов поиска.

Виды поиска

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

  • Xcavator
  • Retrievr
  • PolarRose
  • Picollator Online by Recogmission

Методы поиска

Адресный поиск

Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:

  1. Наличие у документа точного адреса
  2. Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.

Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.

Семантический поиск

Процесс поиска документов по их содержанию.
Условия:

  • Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
  • Составление поискового описания, в котором указывается дополнительное условие поиска.

Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов.
В этом принципиальное отличие каталогов и картотек.
Библиотека - собрание библиографических записей без указания адресов.

Документальный поиск

Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска:

  1. Библиотечный, направленный на нахождение первичных документов.
  2. Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Фактографический поиск

Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.

Различают два вида:

  1. Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  2. Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск как наука

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.

Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.

В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является TREC, организованной в 1992 Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.

Запрос и объект запроса

Говоря о системах ИП, употребляют термины запрос и объект запроса.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.

Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;
  • Классификация документов;
  • Фильтрация документов;
  • Кластеризация документов;
  • Проектирование архитектур поисковых систем и пользовательских интерфейсов
  • Извлечение информации, в частности аннотирования и реферирования документов;
  • Языки запросов и др.

Пертине́нтность (англ. pertinent ) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent ) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя

1. Информационные процессы. Характеристика основных информационных процессов.

Поиск информации - это извлечение хранимой информации.

Методы поиска информации:

• общение со специалистами по интересующему вас вопросу;

• чтение соответствующей литературы;

• просмотр видео, телепрограмм;

• прослушивание радиопередач, аудиокассет;

• работа в библиотеках и архивах;

• запрос к информационным системам, базам и банкам компьютерных данных;

2. Сбор и хранение.

Сбор информации не является самоцелью. Чтобы полученная информация могла использоваться, причем многократно, необходимо ее хранить.

Хранение информации - это способ распространения информации в пространстве и времени.

В процессе передачи информации обязательно участвуют источник и приемник информации: первый передает информацию, второй ее получает. Между ними действует канал передачи информации - канал связи.

Канал связи - совокупность технических устройств, обеспечивающих передачу сигнала от источника к получателю.

Обработка информации - преобразование информации из одного вида в другой, осуществляемое по строгим формальным правилам. Обработка информации по принципу "черного ящика" - процесс, в котором пользователю важна и необходима лишь входная и выходная информация, но правила, по которым происходит преобразование, его не интересуют и не принимаются во внимание.

Информация используется при принятии решений.

Достоверность, полнота, объективность полученной информации обеспечат вам возможность принять правильное решение.

Ваша способность ясно и доступно излагать информацию пригодится в общении с окружающими.

Умение общаться, то есть обмениваться информацией, становится одним главных умений человека в современном мире.

Компьютерная грамотность предполагает:

знание назначения и пользовательских характеристик основных устройств компьютера;

Знание основных видов программного обеспечения и типов пользовательских интерфейсов;

умение производить поиск, хранение, обработку текстовой, графической, числовой информации с помощью соответствующего программного обеспечения.

Информационная культура пользователя включает в себя:

понимание закономерностей информационных процессов;

знание основ компьютерной грамотности;

технические навыки взаимодействия с компьютером;

эффективное применение компьютера как инструмента;

привычку своевременно обращаться к компьютеру при решении задач из любой области, основанную на владении компьютерными технологиями;

применение полученной информации в практической деятельности.

Защитой информации называется предотвращение:

доступа к информации лицам, не имеющим соответствующего разрешения (несанкционированный, нелегальный доступ);

непредумышленного или недозволенного использования, изменения или разрушения информации.

Более подробно о защите информации мы остановимся далее.

Под защитой информации, в более широком смысле, понимают комплекс организационных, правовых и технических мер по предотвращению угроз информационной безопасности и устранению их последствий

Информационные процессы – процессы сбора, обработки, накопления, хранения, поиска и распространения информации.

Основные процессы:

Поиск информации

Поиск информации - это извлечение хранимой информации. Существует ручной и автоматизированный методы поиска информации в хранилищах.

Методы поиска информации:

- общение со специалистами по интересующему вас вопросу;

- чтение соответствующей литературы;

- просмотр видео, телепрограмм;

- прослушивание радиопередач, аудиокассет;

- работа в библиотеках и архивах;

- запрос к информационным системам, базам и банкам компьютерных данных;

2.Сбор и хранение.

Чтобы полученная информация могла использоваться, причем многократно, необходимо ее хранить.

Хранение информации - это способ распространения информации в пространстве и времени.

Информационная система - это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации..

Передача.

В процессе передачи информации обязательно участвуют источник и приемник информации: первый передает информацию, второй ее получает. Между ними действует канал передачи информации - канал связи.

Канал связи - совокупность технических устройств, обеспечивающих передачу сигнала от источника к получателю.

Обработка.

Обработка информации - преобразование информации из одного вида в другой, осуществляемое по строгим формальным правилам. Примеры обработки информации

Выходная информация – это информация , которая получается после обработки человеком или устройсвтом.

Защита.

Для предотвращения потеря информации разрабатываются различные механизмы её защиты, которые используются на всех этапах работы с ней.

Для защиты информации используют различные способы защиты:

- криптографическое преобразование информации с помощью шрифтов.

Эволюция ЭВМ, функциональная схема ЭВМ, принципы построения ЭВМ.

Эволюция ЭВМ

1. Проект Чарльза Бэббиджа – универсальная аналитическая счетная машина (1843 г.)

2. А. Тьюринг – описал схему абстрактно машины и предложил называть алгоритмами то, что умеет делать такая машина. (1936 г.)

3. 1945г. –первая ЭВМ.

4. Джон фон Нейман –сформулировал основные принципы ЭВМ и представил в виде функциональной схемы.

Функциональная схема


Принципы построения ЭВМ:

1. Любую ЭВМ образуют три основных компонента : процессор, память, устройства ввода-вывода (УВВ)

2. Информация с которой работает ЭВМ делится на два типа

- набор команд по обработке (программы)

- данные подлежащие обработке

3. И команды, и данные вводятся в память (ОЗУ) - принцип хранимой информации.

4. Руководит обработкой процессор, устройство управления (УУ) которого выбирает команды из ОЗУ и организует их выполнение, а арифметико-логическое устройство (АЛУ) проводит арифметические и логические операции над данными.

5. С процессором и ОЗУ связаны устройства ввода-вывода (УВВ).

Информационные процессы – процессы сбора, обработки, накопления, хранения, поиска и распространения информации.

Основные процессы:

Поиск информации

Поиск информации - это извлечение хранимой информации. Существует ручной и автоматизированный методы поиска информации в хранилищах.

Методы поиска информации:

- общение со специалистами по интересующему вас вопросу;

- чтение соответствующей литературы;

- просмотр видео, телепрограмм;

- прослушивание радиопередач, аудиокассет;

- работа в библиотеках и архивах;

- запрос к информационным системам, базам и банкам компьютерных данных;

2.Сбор и хранение.

Чтобы полученная информация могла использоваться, причем многократно, необходимо ее хранить.

Хранение информации - это способ распространения информации в пространстве и времени.




Информационная система - это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации..

Передача.

В процессе передачи информации обязательно участвуют источник и приемник информации: первый передает информацию, второй ее получает. Между ними действует канал передачи информации - канал связи.

Канал связи - совокупность технических устройств, обеспечивающих передачу сигнала от источника к получателю.

Обработка.

Обработка информации - преобразование информации из одного вида в другой, осуществляемое по строгим формальным правилам. Примеры обработки информации

Выходная информация – это информация , которая получается после обработки человеком или устройсвтом.

Защита.

Для предотвращения потеря информации разрабатываются различные механизмы её защиты, которые используются на всех этапах работы с ней.

Для защиты информации используют различные способы защиты:

- криптографическое преобразование информации с помощью шрифтов.

Эволюция ЭВМ, функциональная схема ЭВМ, принципы построения ЭВМ.

Эволюция ЭВМ

1. Проект Чарльза Бэббиджа – универсальная аналитическая счетная машина (1843 г.)

2. А. Тьюринг – описал схему абстрактно машины и предложил называть алгоритмами то, что умеет делать такая машина. (1936 г.)

3. 1945г. –первая ЭВМ.

4. Джон фон Нейман –сформулировал основные принципы ЭВМ и представил в виде функциональной схемы.

Функциональная схема


Принципы построения ЭВМ:

1. Любую ЭВМ образуют три основных компонента : процессор, память, устройства ввода-вывода (УВВ)

2. Информация с которой работает ЭВМ делится на два типа

- набор команд по обработке (программы)

- данные подлежащие обработке

3. И команды, и данные вводятся в память (ОЗУ) - принцип хранимой информации.

4. Руководит обработкой процессор, устройство управления (УУ) которого выбирает команды из ОЗУ и организует их выполнение, а арифметико-логическое устройство (АЛУ) проводит арифметические и логические операции над данными.


Конспект учеников по теме Информатики "".

Поиск информации. Поисковые системы

Код ОГЭ по информатике: 2.4.1. Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов

Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.

Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.

Информационно-поисковые системы позволяют добавлять, удалять и изменять хранимую информацию. Существуют информационно-поисковые системы двух видов:

  • документальные (в результате поиска выдаётся документ);
  • справочные (в результате поиска информация предъявляется или сообщается).

Справочные ИПС, в свою очередь, делятся на:

  • фактографические (в результате поиска предъявляется искомая информация, факт);
  • адресные (в результате поиска предъявляется адрес, где информация хранится).

Документальные и фактографические ИПС. Документальными ИПС являются книжные фонды, открытые для доступа в читальных залах библиотек или в магазинах. Однотипные информационные объекты (книги) стоят на стеллажах чаще всего в порядке отраслей знаний (философия, математика, физика и т. п.). Читатель (покупатель), проходя вдоль стеллажей, ищет сначала названия отраслей знаний, а затем книги в разделах.

В словарях однотипные информационные объекты (слова и связанные с ними описания) расположены в алфавитном порядке, что существенно ускоряет поиск нужного слова или словосочетания. В энциклопедиях в аналогичном порядке расположены другие однотипные информационные объекты — статьи с описанием понятий. По такому же принципу организованы алфавитные книжки для записи телефонов и адресов, а также список учеников класса в классном журнале.

В другом порядке — хронологическом — организованы фактографические ИПС, которые называются расписаниями. Имеются в виду расписания занятий, расписания движения поездов, самолётов и т. п.

Адресные ИПС в документах. Адресные ИПС распространены гораздо шире документальных и фактографических. Каждый бумажный документ, исключая словари и энциклопедии, имеет собственную адресную ИПС в виде оглавления (содержания). В оглавлении записаны названия разделов документа и указаны их адреса — номера страниц, на которых эти названия находятся.

Поиск информации в документе состоит из трёх этапов:

  • поиск в оглавлении подходящего названия раздела с адресом (номером страницы);
  • поиск в документе страницы по адресу (номеру);
  • поиск информации в разделе.

Адресные ИПС в хранилищах информационных объектов. В хранилищах бумажных документов (библиотеках, архивах) создаются адресные ИПС, которые называются каталогами.

Традиционные каталоги содержат бумажные карточки с описаниями документов и их адресов в хранилище (номер хранилища, номер стеллажа и т. д.). Адрес документа в хранилище называется шифром. Аналогичным образом организуется хранение и адресация звуко-, кино- и видеозаписей.

Поиск информации в хранилище информационных объектов состоит также из трёх этапов:

  • поиск в каталоге карточки подходящего информационного объекта с адресом (шифром);
  • поиск в хранилище информационного объекта по адресу (шифру);
  • поиск информации в информационном объекте.

Оценка результатов поиска информации. Поиск информации в информационных объектах или в хранилищах информационных объектов редко бывает однократным. Результат поиска всегда оценивается с точки зрения полноты требуемой информации. Если информации недостаточно, поиск других источников информации проводят снова и снова, пока результат не станет удовлетворительным.

Поиск внутри компьютера

Для запуска процесса поиска в поле поиска вводят символы из имени файла или его содержимого. В области просмотра появляется список файлов и папок, которые отвечают запросу. В строке каждого файла указан реальный путь к нему.

Список с результатами поиска анализируется пользователем самостоятельно. Одно можно сказать точно: если файл на самом деле находится в компьютере, то его имя непременно окажется в списке результатов поиска.

Чтобы просмотреть файл в содержащей его папке, по строке файла щёлкают левой, потом правой клавишей мыши, а затем в контекстном меню щёлкают по пункту Расположение файла. В области просмотра открывается папка, содержащая файл.

Поиск в Интернете

Существует несколько сайтов, которые представляют в Интернете поисковые системы (поисковые машины), в том числе русскоязычные:


Поисковые системы представляют собой адресные информационно-поисковые системы. Они обычно включают два компонента:

  • базу рефератов электронных документов, которые размещены на серверах Интернета, вместе с гиперссылками на эти документы;
  • поисковый механизм, который позволяет автоматически по запросу найти информацию в этой базе данных (базе рефератов).

Процедура поиска информации. Для проведения автоматического поиска вводят текстовый запрос в поле поиска поисковой системы.


По умолчанию поисковые системы настроены на поиск в Интернете веб-страниц, которые содержат ключевые слова. Иногда требуется сузить область поиска, чтобы, например, найти новостную страницу или страницу-словарь, либо изменить объект поиска, чтобы, например, найти картинку, музыку, видео.


Для выбора объекта и области поиска поисковые системы в Интернете предлагают меню. После ввода данных щёлкают по кнопке Найти (или аналогичной). Через некоторое время окно браузера обновляется и в нём появляются результаты поиска в виде списка гиперссылок на документы. Этот список может содержать тысячи гиперссылок. По первой двадцатке списка всегда видно, точным ли был запрос. Иногда запрос следует уточнить и запустить поисковую систему ещё раз. В любом случае для получения ответа достаточно просмотреть первую сотню документов, обращаясь к ним с помощью гиперссылок из списка.

Поисковые каталоги. Многие поисковые системы на своих веб-страницах имеют поисковые каталоги, которые построены в виде меню, пунктами которого являются разделы каталога. Принцип построения поисковых каталогов аналогичен принципу построения дерева папок в компьютере. Выбор пункта каталога открывает новое меню, в котором также делают выбор. И так до тех пор, пока на экран не будет выведен список ссылок, входящих в конечный пункт каталога. В процессе поиска следует только правильно определяться с выбором пунктов каталога.

Сохранение информации из Интернета. Просмотр веб-страниц может сопровождаться сохранением информации с этих страниц.

Именно так в Интернете можно собрать информацию для подготовки реферата практически на любую тему.

Читайте также: