Виды информационного поиска реферат

Обновлено: 06.07.2024

Основные понятия информационного поиска. Релевантность, пертинентность и их отличие.

Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

История

Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.

Информационный поиск как процесс

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.

В общем случае поиск информации состоит из четырех этапов:

  • определение (уточнение) информационной потребности и формулировка информационного запроса;
  • определение совокупности возможных держателей информационных массивов (источников);
  • извлечение информации из выявленных информационных массивов;
  • ознакомление с полученной информацией и оценка результатов поиска.

Виды поиска

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

  • Xcavator
  • Retrievr
  • PolarRose
  • Picollator Online by Recogmission

Методы поиска

Адресный поиск

Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:

  1. Наличие у документа точного адреса
  2. Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.

Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.

Семантический поиск

Процесс поиска документов по их содержанию.
Условия:

  • Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
  • Составление поискового описания, в котором указывается дополнительное условие поиска.

Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов.
В этом принципиальное отличие каталогов и картотек.
Библиотека - собрание библиографических записей без указания адресов.

Документальный поиск

Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска:

  1. Библиотечный, направленный на нахождение первичных документов.
  2. Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Фактографический поиск

Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.

Различают два вида:

  1. Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  2. Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск как наука

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.

Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.

В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является TREC, организованной в 1992 Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.

Запрос и объект запроса

Говоря о системах ИП, употребляют термины запрос и объект запроса.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.

Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;
  • Классификация документов;
  • Фильтрация документов;
  • Кластеризация документов;
  • Проектирование архитектур поисковых систем и пользовательских интерфейсов
  • Извлечение информации, в частности аннотирования и реферирования документов;
  • Языки запросов и др.

Пертине́нтность (англ. pertinent ) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent ) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя

Когда человеку нужна информация, одним из первых встает вопрос, где и как её можно найти, и человек начинает свою навигационную деятельность в море информации. Часто он обращается в информационную службу.
Поисковое поведение имеет биологические корни, но в обществе навигационно-поисковые задачи - сложная часть человеческой деятельности, человеческой культуры.

Вложенные файлы: 1 файл

реферат.docx

Когда человеку нужна информация, одним из первых встает вопрос, где и как её можно найти, и человек начинает свою навигационную деятельность в море информации. Часто он обращается в информационную службу.

Поисковое поведение имеет биологические корни, но в обществе навигационно-поисковые задачи - сложная часть человеческой деятельности, человеческой культуры.

Навигация, как движение по определенным алгоритмам в информационном пространстве (т. е. стратегия поиска), предшествует, по-моему мнению, таким процедурам поиска, как сравнение, отбор и идентификация с предметом поиска.

Печатные указатели, содержащие выходные данные книг и статей, веками служили важным инструментом распространения информации. Начиная с 1960-х годов, издатели стали переводить эти библиографические справочники в электронный формат, что на сегодняшний день облегчает работу по поиску необходимой информации, литературы.

Как уметь читать, писать или публично выступать, сегодня в условиях информационного общества умение грамотно осуществлять профессиональный поиск – непреложный навык специалиста-интеллектуала.

Быстрый рост и динамическое развитие информационных ресурсов (прежде всего представленных в сети Интернет) обязывает каждого иметь разнообразные навыки сложного поиска. Уметь быстро и правильно искать в Интернете значит экономить время, владеть достоверной и актуальной информацией, а значит делать верные выводы и принимать правильные решения.

Проблема поиска и использования информации – одна из самых актуальных в современной науке. Разумеется, для эффективного и качественно поиска информации Интернет незаменим. Однако сам факт хранения в Интернете огромного пласта знаний человечества не является свидетельством высокой эффективности поиска и использования информации. Пусть даже информация выдается и в удобной форме, но осваивать ее в конечном итоге приходится человеку. И от того, насколько он владеет методами и методикой поиска, будет зависеть эффективность и качество его труда.

Следовательно, в основе использования информации лежит проблема поиска и преобразования ее в такие содержание и форму, которые создают возможность более удобного и оперативного освоения информации и ее эффективного использования в общественной деятельности.

1.1 Информационный поиск как процесс

Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.

В общем случае поиск информации состоит из четырех этапов:

-определение (уточнение) информационной потребности и формулировка информационного запроса;

-определение совокупности возможных держателей информационных массивов (источников);

-извлечение информации из выявленных информационных массивов;

-ознакомление с полученной информацией и оценка результатов поиска.

1.2 Общие методические требования к процессу информационного поиска

В первую очередь следует четко определить основные этапы информационного поиска и особенности каждого из них. В самом общем виде процесс информационного поиска можно разделить на следующие этапы: 1) формулирование задачи поиска; 2) разработка рабочей программы поиска; 3) реализация поиска и 4) оформление результатов поиска.

Формулирование задачи поиска обусловлено соответствующей задачей библиографирования или библиографического обслуживания. По существу - это краткое определение темы (содержания) библиографической работы. Формулирование задачи может быть выполнено: 1) в виде элементарной тематической рубрики; 2) в виде плана (тезисов, рубрикатора); 3) в виде аннотации .

Формулирование задачи поиска позволяет определить область и особенности используемой литературы, облегчить составление программы поиска. Последняя должна максимально развернуть и конкретизировать поставленную задачу, определяя: объект, виды и методы, возможные направления (маршруты), необходимые ограничения поиска - тематические, хронологические, языковые, жанровые и т.п., возможные объективные и субъективные затруднения, степень полноты, форму представления результатов поиска.

В качестве примера составим рабочую программу поиска.

1. Объект поиска - а) определяем основные области общественной деятельности (науки), объектом и результатом изучения которых является выбранная тема: книговедение, информатика, библиотековедение, библиографоведение, педагогика и т.п.; б) определяем основные издающие организации, выпускающие литературу по данной теме.

2. Виды и методы поиска - библиографический поиск ( поиск литературы вопроса), все возможные методы библиографической эвристики.

4. Необходимые ограничения поиска - только статьи и монографии на русском языке, выпущенные центральными издательствами нашей страны за последние 10 лет.

5. Форма представления результатов - аннотированный список литературы по заданной теме, причем аннотации преимущественно аналитического характера, с указанием наиболее примечательных фактов, разделов, фрагментов и страниц изученной и отобранной литературы вопроса, т.е. с максимальным приближением к последующей возможной стадии фактографического поиска по теме .

В процессе реализации информационного поиска следует руководствоваться рядом общих методических рекомендаций. Так, характер поиска всецело определяется содержанием поставленной задачи. И в этом отношении важно различать, что сначала поиск как бы привязан к теме и к цели детальной, всесторонней разработки ее плана, когда особенно необходим широкий охват информационных источников, литературы. Следовательно, сначала в большей мере используется библиографический и документальный виды поиска. И лишь затем информационный поиск конкретизируется, ограничивается непосредственным содержанием решаемой библиографической задачи - библиографирования или библиографического обслуживания. На этом этапе преобладает уже фактографический поиск. В то же время, на протяжении всего процесса информационного поиска следует сочетать различные виды и методы поиска в двух основных направлениях: с одной стороны, от общих библиографических пособий к отдельным источникам и содержащимся в них фактам, а с другой - от отдельных фактов и источников к общим библиографическим пособиям.

В каждом конкретном случае важно четко определить исходную координатную точку поиска в системе информационного обеспечения (источниковедения). Например, предпочтительнее вести поиск в обратном хронологическом порядке, т. е. с новых пособий и источников, по необходимости последовательно углубляясь в историю. Или начинать с того, что уже известно, имеется под руками или легко доступно, т.е. с домашней библиотеки (картотеки), библиотеки по месту работы или жительства. И лишь затем - обращаться в другие библиотеки, информационные центры. Следует соблюдать также строгую последовательность в восхождении от исходных точек и материалов. С одной стороны, нужно идти от общего к частному и наоборот, а с другой - сочетать полноту и глубину поиска с выбором наиболее существенных, значимых информационных источников .

При информационном поиске следует особо учитывать специфику различных типов и видов литературы и изданий. Это дает не только нужный ориентир в определении границ и объема поиска, но и позволяет выявить наиболее важные пособия и источники для первоначального изучения.

Система основных пособий и источников, необходимых для поиска литературы, может быть представлена в следующем виде .

I. Издания библиографической информации второй степени: государственной библиографии второй степени; ретроспективные указатели второй степени, выпускаемые органами НТИ, издательствами.

II. Издания библиографии (первой степени): государственной библиографии; научно-вспомогательной библиографии; рекомендательной библиографии; сводные тематические, ретроспективные и другие виды изданий каталогов библиотек, издательств, книжного репертуара; издательско-книготорговой библиографии.

III. Издания реферативной информации: реферативные журналы и сборники; критико-библиографические периодические и продолжающиеся

издания, отделы критики и библиографии в специальной и массовой периодике.

IV. Издания обзорной информации: органов НТИ и специализированных издательств, обзорные статьи в специальной периодике; обзоры рекомендательного характера, обзорные статьи в массовой периодике.

V. Справочные издания: биобиблиографические словари универсального характера; биобиблиографические словари отраслевого характера; биобиблиографические словари краеведческого характера; энциклопедии универсального характера; справочники различного характера.

VI. Периодические и продолжающиеся издания: универсального академического уровня; специального и ведомственного характера; массового и популярного характера.

VII. Тематические сборники: специальные (научно-технические); учебные сборники и книги для чтения; массовые (научно-популярные).

VIII. Монографические издания: научные монографии; учебники и учебные пособия для вузов; популярные монографии.

IX. Собрания сочинений, избранные собрания сочинений: научные ( академические); массовые.

X. Книжные серии: научные; учебно-педагогические; популярные .

Особое внимание нужно обратить на наличие по теме поиска реферативных, обзорных, справочно-энциклопедических изданий. Именно в этих изданиях концентрируется и обобщается содержание большого количества источников, отражается самая новая и ценная информация. Подчас только обращения к таким источникам достаточно, чтобы оперативно и качественно решить искомую задачу.

Каждый библиограф в процессе своей работы обязан определить для себя оптимальный круг поискового чтения, т.е. тот минимум информационно- библиографических, справочных, периодических и продолжающихся изданий, систематически обращаясь к которым, он может быть всегда в курсе интересующих его проблем и которые при необходимости он может привлечь для решения той или иной конкретной задачи информационного поиска. Кроме того, следует постоянно с учетом текущей и перспективной проблематики формировать и совершенствовать свой служебный или домашний фонд информационного обеспечения, т.е. иметь у себя под руками как необходимые пособия и источники, так и самостоятельно составленные различного рода картотеки, конспекты, досье и т.п., что особенно важно.

В любом случае, только при систематическом и целенаправленном изучении, знании и умении рационально применять действующую в нашей стране систему информационного обеспечения библиограф может быть твердо уверен в эффективности и качестве своей работы.

Поиск информации или информационный поиск представляет один из основных информационных процессов. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.

Интернет-технологии и программно-технические средства, доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.

Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

Термин информационный поиск (англ. information retrieval) ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов. Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.

С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.

1 Информационный поиск: виды, этапы поиска

Побудительная причина информационного поиска - информационная потребность, выраженная в форме информационного запроса. Объектами информационного поиска могут быть документы, сведения о их наличии и (или) местонахождении, фактографическая информация.

Условно информационный поиск делится на четыре основных вида: библиографический, документальный, фактографический и аналитический. Например, чтобы найти информационный источник (документ или издание), надо знать определенную совокупность библиографических данных (фактов), характеризующих его, отличающих от многих других: хотя бы от написанных тем же автором, на одну и ту же тему и т. д. Следовательно, нужно сначала осуществить библиографический поиск. И, наоборот, чтобы провести фактографический поиск в какой-либо отрасли знаний или практики, требуется сначала найти те литературные источники (документы, издания), в которых могут быть интересующие нас факты. Поэтому сначала надо провести библиографический и документальный поиск.

Этапы информационного поиска:


1. Уточнение информационной потребности и формулировка запроса.
2. Выбор источников информации, соответствующих запросу пользователя.
3. Извлечение информации из информационных массивов
4. Оценка результатов поиска.

Уточнение информационной потребности.


Информационная потребность – это тема, о которой пользователь хочет знать больше. Ее следует отличать от запроса, т.е. оттого, что пользователь вводить в строку поиска. Информационная потребность должна быть выражена средствами, которые "понимает" ИПС.
Нередко человек, осуществляющий поиск, имеет самое приблизительное представление об интересующей его тематике, либо он ищет документ, который сам собирается написать. Пользователю обычно требуется найти не какой-то конкретный, заранее известный документ, а некие сведения (факты), знание которых необходимо для решения поставленной задачи.
Формулировка запроса по теме должна быть оформлена в виде ключевых слов или словосочетаний. Ключевые слова – это набор слов или словосочетаний, отражающих основную тему документа и описывающих информационную потребность.
Точность и полнота поиска зависят не только от характеристик самой ИПС, но и от того, как создается запрос. Современные системы еще не обладают искусственным
интеллектом и не могут задать вам уточняющие вопросы, поэтому удовлетворяющий вашу информационную потребность ответ может быть получен только на очень точно сформулированный запрос, но далеко не всегда пользователь может четко и однозначно сформулировать именно тот набор ключевых слов, который и приведет его к искомому результату. Основные проблемы связаны с неудачным выбором ключевых слов и просмотром ненужных документов, полученных в списке результатов запроса.
И поэтому, поиск по возможности лучше вести по нескольким словам, их сочетаниям, а иногда и по конкретным фразам. Все служебные слова (предлоги, союзы, частицы и т.п.) следует считать не ключевыми, термины, частота встречаемости которых мала не следует включать в поиск, часто встречающиеся (Москва) – надо употреблять в сочетании с другими словами сужающими их значение.

Выбор источников информации, соответствующих запросу пользователя включает определение, какой тип информационного источника в каждой конкретной ситуации будет соответствовать ИП: источник на традиционных носителях или доступ к информации в режиме онлайн, в т.ч. и подписные БД.

Извлечение информации из информационных массивов.


После четкого определения границ запроса и выбора источника информации следующим этапом справочного процесса является выбор модели поиска для извлечения информации . Исторически первой моделью информационного поиска является булева модель .
Основным достоинством ее является простота, способность работать с большими объемами информации и высокая скорость выполнения поисковых запросов. По этой причине на основе булевой модели было построено большое количество поисковых систем.

Оценка результатов поиска.


Два основных понятия, в которых дается оценка эффективности поиска, определены в ГОСТ 7.73-96. Релевантными (
В автоматизированных системах поиск основан на формальной релевантности. Если поисковый запрос сформулирован точно, подробно, то релевантный ответ, скорее всего будет пертинентным. Идеальная ИПС должна выдавать документы, содержательно релевантные запросу, и ничего кроме них. Однако на практике это обычно не достигается, наблюдаются молчание ИПС (невыдача некоторого количества релевантных документов) и шум (выдача лишних документов).
Качество поиска в информационно-поисковых системах обычно характеризуется двумя критериями – полнотой и точностью. Полнота поиска определяется общим количеством найденных документов, а точность – соотношением между найденными релевантными и не релевантными документами.
Важно иметь ввиду, что информация, содержащаяся в научных документах, объективно подчиняется законам рассеяния. Данные характеристики зависят друг от друга, при увеличении полноты, как правило, снижается точность и наоборот.
В реальных системах коэффициент полноты достигает 70%, а коэффициент точности поиска колеблется в очень широких пределах, иногда снижаясь до 10%. Величины этих коэффициентов зависят от целого ряда факторов: как внутренних свойств собственно поисковой системы (объема и характеристик информационного массива, информационно-поискового языка, критерия выдачи), так и от многих "внешних" условий: степени специфичности информационных запросов, способности пользователя правильно сформулировать свои информационные потребности на естественном языке, правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Из-за ошибок и неточностей, возникающих на каждом из этапов работы, как пользователя, так и системы, результаты могут сильно отличаться от того, что хотел получить пользователь, обращаясь к ИПС.

Важно иметь ввиду, что информация, содержащаяся в научных документах, объективно подчиняется законам рассеяния.
Данные характеристики зависят друг от друга, при увеличении полноты, как правило, снижается точность и наоборот.
В реальных системах коэффициент полноты достигает 70%, а коэффициент точности поиска колеблется в очень широких пределах, иногда снижаясь до 10%. Величины этих коэффициентов зависят от целого ряда факторов: как внутренних свойств собственно поисковой системы (объема и характеристик информационного массива, информационно-поискового языка, критерия выдачи), так и от многих "внешних" условий: степени специфичности информационных запросов, способности пользователя правильно сформулировать свои информационные потребности на естественном языке, правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Из-за ошибок и неточностей, возникающих на каждом из этапов работы, как пользователя, так и системы, результаты могут сильно отличаться от того, что хотел получить пользователь, обращаясь к ИПС.

развитой части человечества от индустриального общества к информационному.

Одним из наиболее ярких явлений этого процесса является возникновение и

развитие глобальной информационной компьютерной сети. С появлением

Интернета проблема поиска становилась б олее актуальной. Инт ернет- это единая

информационная среда, также это большое количество полезной информации, для

Основные протоколы, используемые в Интернет, не обеспечены достаточными

встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся

навигации, которая рассматривается только как средство просм отра страниц, но не

их поиска. То же самое относится и к протоколу FTP, который даж е более

навигационные методы просмотра быстро достигают предела их функциональных

возможностей, не говоря уже о пределе их эффективности. Не указывая конкретных

цифр, можно сказать, что нужную информацию уж е не представляется возможным

получить сразу, так как в Сети сейчас находятся миллиарды докум ентов и все они в

распоряжении пользователей Интернет, к то му же сегодня их колич ество

возрастает. Количество изменений, которым эта информация подвергнута, огромно

и, самое главное, они произошли за очень короткий период времени. Основная

проблема заключается в том, что единой полной функциональной систем ы

обновления и занесения подобного объема информации, одновременно доступного

всем пользователям Интернет во всем мире, никогда не было. Для того, чтобы

структурировать информацию, накопленную в сети Интернет, и обеспечить ее

пользователей удобными средствами поиска необходимых им данных, были

Автоматизированная поисковая система – система, состоящая из персонала и

комплекса средств автоматизации его деятельности, реализующая информационную

технологию выполнения установленных функций. Опыт и практика создания систем

в различных сферах деятельности позволяет дать более широкое и универсальное

определение, которое по лнее отражает все аспекты их сущности. Под

информационной системой в дальнейшем понимается – организованная

совокупность программно–технических и других вспомогательных средств,

технологических процессов и функционально–определённых групп работников,

обеспечивающих сбор, представление и накопление информационных ресурсов в

определённой предметной области, поиск и выдачу сведений, необходимых для

удовлетворения информационных потребностей установленного контингента

Следовательно, и нформационно-поисковая система выполняет следующие

- добавления, удаления и изменения хранимой информации;

Создание и использование информационно-поисковой системы началось в

конце 1950-х - начале 1960-х годов. Информационно-поисковая система опирается

на базу данных, в которой осуществляет поиск нужных документов по заявкам

пользователей. Частным случаем и нформационно-поисковой системы яв ляется

информационно-справочная система, которая в ответ на запросы выдает сведения, в

явной форме отсутствующие в базе данных. Широко информационно-поисковые

Обратимся к истории возникновения сети Internet, которая была создана в связи

с возникшей необходимостью совместного использов ания информационных

ресурсов, распределенных между различными компьютерными системами.

Большинство первых приложений, включая FTP и электронную почту, были

разработаны исключительно для обмена данными между хост-компьютерами

Другие приложения, такие как Telnet, создавались для того, чтобы пользователь

получил возможность доступа не только к информации, но и к рабочим ресурсам

удаленной системы. По мере развития I nternet (увеличения пользователей и хост-

компьютеров) прежние методы обмена данными перестали отвечать возросшим

потребностям пользователей. Возникла необходимость разработки новых способов

поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать

информацию независимо от ее формата и расположения.

Для удовлетворения таких потребностей сначала были созданы поисковая

система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система

Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были

разработаны сетевые информационные системы WWW и WAIS, предлагающие

абсолютно новые методы получения инф ормации. Принципы работы этих систем

позволяют легко ориентироваться в огромном количестве информационных

ресурсов без необходимости предоставления механизмов работы самой сети Internet.

Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных

компьютерных систем, а об особых информационных пространствах сети.

Система Archie представляет собой комплекс программных средств,

работающих со специальными базами данных. В этих базах данных содержится

постоянно пополняющаяся инф ормация о ф айлах, к которым можно получить

доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить

поиск файла по шаблону его имени. При этом пользователь получит список файлов

с точным указанием места их хранения в сети, а также с информацией о типе,

времени создания и размере файлов. Доступ к информационно-поисковой системе

Archie может осуществляться различными путями, начиная от запросов по

электронной почте и с помощью сервиса Telnet и заканчивая использованием

Система Gopher была разработана для упрощения процесса локализации FTP-

ресурсов Internet и для более удобного представления сведений о содержании

хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной

форме (в виде меню) представлять пользователям об имеющихся файлах и их

содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и

FTP-серверы. Таким образом, пользователь получает воз можность

“путешествовать” по Internet, не обращая внимания на местонахождение

интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве

по заголовкам пунктов меню. После ввода ключевого слова, систем а Veronica

выясняет, встречается ли оно в меню на каком-либо Gopher- сервере, и в качестве

результатов поиска выдает список заголовков пунктов меню, содержащих ключевое

слово. Поскольку система Veronica не является автономной поисковой программ ой,

а тесно свя зана с систем ой Gopher, она обладает тем же, что и система Gopher,

недостатком: далеко не всегда по заголовку можно сказать, что собой представляет

тот или иной информационный ресурс. Достоинства системы заключается в том, что

нет необходимости узнавать, где расположена найденная информация, достаточно

Читайте также: