Входное сообщение в информационно поисковую систему отражающее информационную потребность

Обновлено: 28.04.2024

Поиск информации или информационный поиск представляет один из основных информационных процессов. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.

Интернет-технологии и программно-технические средства, доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.

Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

Термин информационный поиск (англ. information retrieval) ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов. Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.

С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.

1 Информационный поиск: виды, этапы поиска

Побудительная причина информационного поиска - информационная потребность, выраженная в форме информационного запроса. Объектами информационного поиска могут быть документы, сведения о их наличии и (или) местонахождении, фактографическая информация.

Условно информационный поиск делится на четыре основных вида: библиографический, документальный, фактографический и аналитический. Например, чтобы найти информационный источник (документ или издание), надо знать определенную совокупность библиографических данных (фактов), характеризующих его, отличающих от многих других: хотя бы от написанных тем же автором, на одну и ту же тему и т. д. Следовательно, нужно сначала осуществить библиографический поиск. И, наоборот, чтобы провести фактографический поиск в какой-либо отрасли знаний или практики, требуется сначала найти те литературные источники (документы, издания), в которых могут быть интересующие нас факты. Поэтому сначала надо провести библиографический и документальный поиск.

Этапы информационного поиска:


1. Уточнение информационной потребности и формулировка запроса.
2. Выбор источников информации, соответствующих запросу пользователя.
3. Извлечение информации из информационных массивов
4. Оценка результатов поиска.

Уточнение информационной потребности.


Информационная потребность – это тема, о которой пользователь хочет знать больше. Ее следует отличать от запроса, т.е. оттого, что пользователь вводить в строку поиска. Информационная потребность должна быть выражена средствами, которые "понимает" ИПС.
Нередко человек, осуществляющий поиск, имеет самое приблизительное представление об интересующей его тематике, либо он ищет документ, который сам собирается написать. Пользователю обычно требуется найти не какой-то конкретный, заранее известный документ, а некие сведения (факты), знание которых необходимо для решения поставленной задачи.
Формулировка запроса по теме должна быть оформлена в виде ключевых слов или словосочетаний. Ключевые слова – это набор слов или словосочетаний, отражающих основную тему документа и описывающих информационную потребность.
Точность и полнота поиска зависят не только от характеристик самой ИПС, но и от того, как создается запрос. Современные системы еще не обладают искусственным
интеллектом и не могут задать вам уточняющие вопросы, поэтому удовлетворяющий вашу информационную потребность ответ может быть получен только на очень точно сформулированный запрос, но далеко не всегда пользователь может четко и однозначно сформулировать именно тот набор ключевых слов, который и приведет его к искомому результату. Основные проблемы связаны с неудачным выбором ключевых слов и просмотром ненужных документов, полученных в списке результатов запроса.
И поэтому, поиск по возможности лучше вести по нескольким словам, их сочетаниям, а иногда и по конкретным фразам. Все служебные слова (предлоги, союзы, частицы и т.п.) следует считать не ключевыми, термины, частота встречаемости которых мала не следует включать в поиск, часто встречающиеся (Москва) – надо употреблять в сочетании с другими словами сужающими их значение.

Выбор источников информации, соответствующих запросу пользователя включает определение, какой тип информационного источника в каждой конкретной ситуации будет соответствовать ИП: источник на традиционных носителях или доступ к информации в режиме онлайн, в т.ч. и подписные БД.

Извлечение информации из информационных массивов.


После четкого определения границ запроса и выбора источника информации следующим этапом справочного процесса является выбор модели поиска для извлечения информации . Исторически первой моделью информационного поиска является булева модель .
Основным достоинством ее является простота, способность работать с большими объемами информации и высокая скорость выполнения поисковых запросов. По этой причине на основе булевой модели было построено большое количество поисковых систем.

Оценка результатов поиска.


Два основных понятия, в которых дается оценка эффективности поиска, определены в ГОСТ 7.73-96. Релевантными (
В автоматизированных системах поиск основан на формальной релевантности. Если поисковый запрос сформулирован точно, подробно, то релевантный ответ, скорее всего будет пертинентным. Идеальная ИПС должна выдавать документы, содержательно релевантные запросу, и ничего кроме них. Однако на практике это обычно не достигается, наблюдаются молчание ИПС (невыдача некоторого количества релевантных документов) и шум (выдача лишних документов).
Качество поиска в информационно-поисковых системах обычно характеризуется двумя критериями – полнотой и точностью. Полнота поиска определяется общим количеством найденных документов, а точность – соотношением между найденными релевантными и не релевантными документами.
Важно иметь ввиду, что информация, содержащаяся в научных документах, объективно подчиняется законам рассеяния. Данные характеристики зависят друг от друга, при увеличении полноты, как правило, снижается точность и наоборот.
В реальных системах коэффициент полноты достигает 70%, а коэффициент точности поиска колеблется в очень широких пределах, иногда снижаясь до 10%. Величины этих коэффициентов зависят от целого ряда факторов: как внутренних свойств собственно поисковой системы (объема и характеристик информационного массива, информационно-поискового языка, критерия выдачи), так и от многих "внешних" условий: степени специфичности информационных запросов, способности пользователя правильно сформулировать свои информационные потребности на естественном языке, правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Из-за ошибок и неточностей, возникающих на каждом из этапов работы, как пользователя, так и системы, результаты могут сильно отличаться от того, что хотел получить пользователь, обращаясь к ИПС.

Важно иметь ввиду, что информация, содержащаяся в научных документах, объективно подчиняется законам рассеяния.
Данные характеристики зависят друг от друга, при увеличении полноты, как правило, снижается точность и наоборот.
В реальных системах коэффициент полноты достигает 70%, а коэффициент точности поиска колеблется в очень широких пределах, иногда снижаясь до 10%. Величины этих коэффициентов зависят от целого ряда факторов: как внутренних свойств собственно поисковой системы (объема и характеристик информационного массива, информационно-поискового языка, критерия выдачи), так и от многих "внешних" условий: степени специфичности информационных запросов, способности пользователя правильно сформулировать свои информационные потребности на естественном языке, правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Из-за ошибок и неточностей, возникающих на каждом из этапов работы, как пользователя, так и системы, результаты могут сильно отличаться от того, что хотел получить пользователь, обращаясь к ИПС.

Читайте также: