Отечественные поисковые службы реферат

Обновлено: 04.07.2024

развитой части человечества от индустриального общества к информационному.

Одним из наиболее ярких явлений этого процесса является возникновение и

развитие глобальной информационной компьютерной сети. С появлением

Интернета проблема поиска становилась б олее актуальной. Инт ернет- это единая

информационная среда, также это большое количество полезной информации, для

Основные протоколы, используемые в Интернет, не обеспечены достаточными

встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся

навигации, которая рассматривается только как средство просм отра страниц, но не

их поиска. То же самое относится и к протоколу FTP, который даж е более

навигационные методы просмотра быстро достигают предела их функциональных

возможностей, не говоря уже о пределе их эффективности. Не указывая конкретных

цифр, можно сказать, что нужную информацию уж е не представляется возможным

получить сразу, так как в Сети сейчас находятся миллиарды докум ентов и все они в

распоряжении пользователей Интернет, к то му же сегодня их колич ество

возрастает. Количество изменений, которым эта информация подвергнута, огромно

и, самое главное, они произошли за очень короткий период времени. Основная

проблема заключается в том, что единой полной функциональной систем ы

обновления и занесения подобного объема информации, одновременно доступного

всем пользователям Интернет во всем мире, никогда не было. Для того, чтобы

структурировать информацию, накопленную в сети Интернет, и обеспечить ее

пользователей удобными средствами поиска необходимых им данных, были

Автоматизированная поисковая система – система, состоящая из персонала и

комплекса средств автоматизации его деятельности, реализующая информационную

технологию выполнения установленных функций. Опыт и практика создания систем

в различных сферах деятельности позволяет дать более широкое и универсальное

определение, которое по лнее отражает все аспекты их сущности. Под

информационной системой в дальнейшем понимается – организованная

совокупность программно–технических и других вспомогательных средств,

технологических процессов и функционально–определённых групп работников,

обеспечивающих сбор, представление и накопление информационных ресурсов в

определённой предметной области, поиск и выдачу сведений, необходимых для

удовлетворения информационных потребностей установленного контингента

Следовательно, и нформационно-поисковая система выполняет следующие

- добавления, удаления и изменения хранимой информации;

Создание и использование информационно-поисковой системы началось в

конце 1950-х - начале 1960-х годов. Информационно-поисковая система опирается

на базу данных, в которой осуществляет поиск нужных документов по заявкам

пользователей. Частным случаем и нформационно-поисковой системы яв ляется

информационно-справочная система, которая в ответ на запросы выдает сведения, в

явной форме отсутствующие в базе данных. Широко информационно-поисковые

Обратимся к истории возникновения сети Internet, которая была создана в связи

с возникшей необходимостью совместного использов ания информационных

ресурсов, распределенных между различными компьютерными системами.

Большинство первых приложений, включая FTP и электронную почту, были

разработаны исключительно для обмена данными между хост-компьютерами

Другие приложения, такие как Telnet, создавались для того, чтобы пользователь

получил возможность доступа не только к информации, но и к рабочим ресурсам

удаленной системы. По мере развития I nternet (увеличения пользователей и хост-

компьютеров) прежние методы обмена данными перестали отвечать возросшим

потребностям пользователей. Возникла необходимость разработки новых способов

поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать

информацию независимо от ее формата и расположения.

Для удовлетворения таких потребностей сначала были созданы поисковая

система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система

Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были

разработаны сетевые информационные системы WWW и WAIS, предлагающие

абсолютно новые методы получения инф ормации. Принципы работы этих систем

позволяют легко ориентироваться в огромном количестве информационных

ресурсов без необходимости предоставления механизмов работы самой сети Internet.

Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных

компьютерных систем, а об особых информационных пространствах сети.

Система Archie представляет собой комплекс программных средств,

работающих со специальными базами данных. В этих базах данных содержится

постоянно пополняющаяся инф ормация о ф айлах, к которым можно получить

доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить

поиск файла по шаблону его имени. При этом пользователь получит список файлов

с точным указанием места их хранения в сети, а также с информацией о типе,

времени создания и размере файлов. Доступ к информационно-поисковой системе

Archie может осуществляться различными путями, начиная от запросов по

электронной почте и с помощью сервиса Telnet и заканчивая использованием

Система Gopher была разработана для упрощения процесса локализации FTP-

ресурсов Internet и для более удобного представления сведений о содержании

хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной

форме (в виде меню) представлять пользователям об имеющихся файлах и их

содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и

FTP-серверы. Таким образом, пользователь получает воз можность

“путешествовать” по Internet, не обращая внимания на местонахождение

интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве

по заголовкам пунктов меню. После ввода ключевого слова, систем а Veronica

выясняет, встречается ли оно в меню на каком-либо Gopher- сервере, и в качестве

результатов поиска выдает список заголовков пунктов меню, содержащих ключевое

слово. Поскольку система Veronica не является автономной поисковой программ ой,

а тесно свя зана с систем ой Gopher, она обладает тем же, что и система Gopher,

недостатком: далеко не всегда по заголовку можно сказать, что собой представляет

тот или иной информационный ресурс. Достоинства системы заключается в том, что

нет необходимости узнавать, где расположена найденная информация, достаточно

Кроме средств поиска служба @Rus предоставляет удобный каталог-портал Мой @Rus. Пользователь может настроить его на быстрое получение наиболее нужной ему информации. Средства настройки каталога позволяют также отключить все лишнее на основной странице поисковой сиетемы, что делает работу с ней особенно быстрой и удобной.

Rambler — это рейтинговая система, обладающая всеми основными функциями поисковых указателей. Как поисковый указатель, служба обладает одним из крупнейших индексов в России, но ей явно недостает быстро­действия и современных алгоритмов рейтингования результатов поиска. Впрочем, это не очень существенно, ведь основную популярность служба приобрела в первую очередь как рейтинговая система. Она позволяет быстро выявить круг Web-узлов, поставляющих информацию на заданную тему и оценить их популярность по количеству посещений за последние сутки. Мы уже говорили о том, что эта характеристика качественности Web-ресурса является относительной, но в тех случаях, когда речь идет о теме, имеющей общественный интерес, ей можно доверять.

Но и в области простого поиска служба Яndех имеет ряд технологических достижений, прежде всего интеллектуальный механизм морфологичес­кого разбора слов, что особенно важно для русского языка.

Приемы простого поиска информации в WWW

Каждая поисковая система предоставляет свои методы поиска и имеет свои особенности в правилах записи комбинации ключевых слов. Однако есть общие элементы, одинаково справедливые для большинства поисковых систем.

Прежде всего, надо заметить, что чем точнее сформулировано задание на поиск, тем точнее будут и результаты. Например, если вы хотите найти документы с описанием замеченных ошибок Windows 98, то так и надо формулировать запрос: ошибки Windows 98, а не просто Windows. На англо­язычных серверах очень часто срабатывает простое человеческое описа­ние проблемы: printer works incorrectly (принтер работает неправильно).

Ловушка для начинающих

Обычно наша задача состоит в том, чтобы выделить в пространстве Web самые нужные документы, однако многие начинающие ловятся на один и тот же крючок. Например, если вы хотите найти информацию о компьютерных играх ( computer games ), то кажется, что так и надо оформить запрос:

Увы, для большинства поисковых систем этот запрос будет ошибочным. При таком запросе система будет искать все Web-страницы, в которых встречается либо слово computer, либо слово games, либо оба вместе. В WWW полно страниц, на которых упоминаются компьютеры и нет ни слова про игры. Точно так же там полно страниц со спортивными, настольными и другими играми, которые нам не интересны. Вот всю эту массу и надо как-то отсеять, а мы наоборот ее запрашиваем.

Вот список поисковых систем, которые рассматривают группу слов, вве­денных через пробел, как задание на поиск любого из этих слов:

AltaVista Excite GoTo

Infoseek LookSmart Netscape Search

Snap WebCrawler Yahoo!

Следующие системы тоже способны выполнять поиск по любому из слов группы, но для этого надо либо установить соответствующий флажок, либо выбрать соответствующий пункт в меню:

HotBot (через меню);

Lycos (в режиме расширенного поиска);

MSN Search (через меню);

Rambler (после установки флажка Все словоформы).

Сложение наоборот

'Поисковая система выдаст список страниц, на которых встречаются оба слова, хотя, конечно, не исключено, что между ними нет прямой связи. Список слов может быть больше — тогда результаты поиска будут точнее, например:

+свет +оптика +линза

Lycos MSN Search

Northern Light Aport 2000

Rambler (в режиме простого поиска при сброшенном флажке Все словоформы).

Арифметика вычитания

Если, к примеру, нам надо написать реферат по оптике, но только по гео­метрической, а не по волновой, то поиск может быть таким:

+свет -оптика -волна

Последняя команда разыщет все страницы, где присутствуют слова свет и оптика, но покажет только ссылки на страницы, не содержащие слова волна.

Применим джокера

Возьмем следующее предложение:

В геометрической оптике световой луч рассматривается как прямая линия.

MSN Search Northern Light

Некоторые из крупнейших поисковых служб поддерживают нормализа­цию слов по умолчанию, то есть, они уже учитывают сокращение слов до основы, и потому в них не надо использовать подстановочный символ. В частности, к таким службам относится Infoseek.

Контекстный поиск

А почему бы нам сразу не искать то, что надо?

Может быть, это и было бы хорошим решением, но такой поиск выдаст ссылки на страницы, где упоминаются оба эти слова, причем совсем не Необязательно, что вместе. То есть, слово геометрическая может быть в одном конце текста, а слово оптика — совсем в другом. Если же мы хотим объедить оба эти слова в одно сочетание, то надо применить кавычки:

"Геометрическая оптика" "геометрическая оптика"

случае использования кавычек поисковая система разыскивает документы, в которых абсолютно точно есть тот текст, который в них заключен. Поиск с помощью кавычек называется контекстным поиском.

Роль прописных букв

Прописные буквы при проведении поиска имеют особый статус. Вам ведь понятна разница между сочетаниями красная шапочка и Красная Шапочка? прописными буквами поисковые системы обращаются буквально, то есть разыскивают тексты, в которых слова записаны точно такими же буквами. Со строчными буквами все происходит демократичнее. Совпадения засчитываются и в том случае, когда в тексте стоит прописная буква, и в том случае, когда буква строчная.

поиск по словам:

вернет результаты, в которых будут и красная шапочка, и Красная шапочка, ДЦ красная Шапочка, и Красная Шапочка.

Ир Другой стороны, поиск по словам:

И| +красная +шапочка Издаст гораздо более узкий результат: Красная Шапочка, — и все.

Поиск по заголовкам

Каждая Web-страница может иметь заголовок, если Web-мастер не поленился его создать. Когда мы разыскиваем Web-страницы с помощью поисковых систем, то по результатам поиска нам обычно выдается ссылка, в которой присутствует заголовок Web-страницы, если он есть. Если его нет, то обычно выдается одно-два предложения первого абзаца.

Многие поисковые системы позволяют разыскивать Web-документы по тексту, содержащемуся в заголовках. Такой поиск существенно уменьшает количество возвращаемых ссылок, но очень точно выводит на нужные мате­риалы. Например, если вам нужны данные для доклада о Солнечной сис­теме, имеет смысл искать не просто словосочетание Solar System (Солнечная система), а страницы, в которых это сочетание присутствует в заголовке. Командой такого поиска является title:, например:

title: Solar System или (лучше)

title: solar system

Поиск заголовков Web-страниц по команде title: поддерживают следующие поисковые системы:

AltaVista GoTo HotBot Infoseek MSN Search Northern Light

Поисковый каталог Yahoo! тоже имеет команду для поиска заголовков. Она записывается так:

Система Lycos разыскивает заголовки только в режиме расширенного поиска.

Поисковая система Aport 2000 имеет несколько альтернативных команд для поиска заголовков. Основная команда — title = . Примеры:

title = Солнечная система

t = Солнечная система

заг = Солнечная система

з = Солнечная система В поисковой системе Япс1ех команда поиска в заголовке записывается так:

$title (Солнечная система) а в поисковой системе Rambler — похоже, но без скобок, через двоеточие:

Поиск Web-узлов

Сам по себе поиск Web-узлов используется достаточно редко, но команды этого поиска часто применяют для сокращения числа ссылок, возвращен­ных другими методами и ограничения их одним Web-узлом или, наобо­рот, исключения некоего Web-узла из результатов поиска.

Эту команду обычно комбинируют с другими. Если, например, нас интересуют планеты солнечной системы, но мы уже сыты по горло трудами Национального управления по исследованию космического пространства

США (NASA), то сервер NASA можно исключить из поиска командой:

+solar + system -host: nasa .:

В команду можно включать не полное доменное имя сервера, а только его часть, например только имя домена. Так, если мы хотим обыскать только российские серверы, то можно использовать имя домена ru, например:

Не все поисковые системы позволяют проводить поиск по Web-узлам, да

и команда поиска у них может быть различной. Вот список систем, кото­рые такой поиск выполняют:

Alta Vista host:

& f InfoSeek site:

MSN Search domain:

Поисковая система Lycos выполняет поиск Web-узлов только в режиме расширенного поиска.

Поиск URL-адресов

Этот поиск очень похож на поиск Web-узлов. Суть и смысл его те же, только Команда другая — uri:. Эту команду поддерживают следующие поисковые службы:

Поиск ссылок бывает полезен владельцам Web-страниц и Web-мастерам. Он позволяет, к примеру, количественно оценить динамику популярности своей страницы регулярным контролем числа ссылок, которые к ней ведут. Типовая команда для такого поиска — link:.

Команду link: поддерживают следующие поисковые службы:

AltaVista Infoseek Google

Некоторые поисковые службы поддерживают команду linkpage:

GoTo HotBot S MSN Search Snap

Как обычно, российские поисковые системы имеют свои особенности. Например. Апорт 2000 поддерживает четыре разных представления команды:

Средства расширенного поиска

Выше мы рассмотрели лишь десять методов формулирования задания на поиск, однако их достаточно для проведения 90% поисковых работ в 90% поисковых служб. Все рассмотренные выше методы являются методами простого поиска. Кроме средства простого поиска обычно поисковые службы предоставляют средства расширенного поиска. Эти средства позволяют более точно формулировать поисковое задание, но требуют определенного опыта и работают заметно медленнее. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд и рассчитаны на профессионалов. Удобство использования логических команд в частности связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного поиска — наиболее стандартными.

Логическая команда OR (ИЛИ) служит для формирования поискового зада­ния, состоящего из нескольких ключевых слов, если надо, чтобы разыс­киваемый документ содержал любые из этих слов в любой комбинации. Например, по команде solutions OR hints будут разысканы Web-страницы, содержащие решения к компьютерным играм ( solutions ) или подсказки к ним ( hints ).

Команду OR поддерживают абсолютное большинство основных поисковых служб, за исключением следующих:

Google Infoseek LookSmart Yahoo!

Службы Infoseek, LookSmart и Yahoo! по умолчанию выполняют поиск по принципу ИЛИ, если через пробел задано несколько ключевых слов, и поэтому нс нуждаются в этой команде. Лишь поисковая система Google вообще не имеет таких средств.

Команда AND

Google Infoseek LookSmart Yahoo!

Команда NOT

Логической командой NOT (HE) устанавливают исключения из результатов поиска, то есть это аналог рассмотренной выше команды простого поиска Lycos (в пределах 25 слов, гибко); WebCrawler (в пределах 2 слов, гибко);

средство поиск/ (-2 4)

Такая команда позволит разыскать на только средства расширенного поиска, но и поисковые средства.

Вложение команд

Вложение команд позволяет создавать весьма сложные запросы. Оно выпол­няется с помощью круглых скобок ( ). Команда, стоящая в скобках, выпол­няется в первую очередь. Рассмотрим пример поиска решений или подсказок к компьютерной игре Diablo:

diablo AND (solution OR hint)

В этом случае сначала будут отобраны документы, в которых приводятся подсказки или решения для компьютерных игр, а потом из них будут выбра­ны те, в которых упоминается игра Diablo.

Использование круглых скобок для управления порядком исполнения зада­ния на поиск разрешается большинством крупнейших поисковых систем, за редким исключением:

Google Infoseek LookSmart Yahoo!

Выбор поисковой службы

Выбор средства поиска зависит от задачи. Есть задачи, для которых подхо­дят крупнейшие поисковые системы, но есть задачи, для которых неболь­шой список на пару сотен ссылок будет гораздо полезнее. Правда, его тоже надо еще разыскать, но это уже проще, поскольку если он существует не один год, то наверное хорошо известен поисковым системам.

Как проверить незнакомую поисковую службу

Лет пять назад лучшей считалась та служба, которая владела наибольшим индексом. Пока Web-страниц было немного, в результатах поиска можно было ориентироваться относительно легко. Тогда проверить незнакомую службу было очень просто — надо было набрать достаточно распростра­ненное слово, например Pentium, и сравнить, сколько ссылок на него дают разные поисковые системы.

Сегодня величина индекса уже не имеет того значения, как его качество, хотя принцип проверки остается тем же самым. Введите простое и понятное слово и посмотрите, насколько найденные Web-страницы соответствуют вашим ожиданиям. Если, например, при поиске по слову Шахматы поис­ковая система в качестве первой (самой важной!) ссылки выдает Web-стра-ннцу, посвященную скульптуре, то этой системе нужно еще какое-то время на адаптацию, прежде чем ею можно будет пользоваться

В этом случае начинать исследование темы надо с поискового каталога. Это ничего, что в нем отражен только один миллион страниц — нам и этого много. Двух-трех страниц с содержательной информацией обычно бывает доста­точно, чтобы сделать свое дело. К тому же эти страницы тоже имеют полез­ные ссылки. Вы можете быть уверены в том, что лучшая часть сетевой информации в таких каталогах, как Yahoo! обязательно присутствует.

Например, ваша собака заболела демодекозом. Вы слышали, что болезнь эта неизлечимая, но интересно проверить, что по этому поводу говорят мировые светила. Вы можете получить сотни ссылок с помощью поискового указателя типа Alta Vista. Среди них, конечно же, будут ссылки на самого лучшего специалиста в мире по данному вопросу, но как их угадать? С помошью Yahoo! вы гораздо быстрее найдете его Web-узел.

Каждый, кто является специалистом в какой-то области, знает ключевые слова, характерные для нее, а умение грамотно сформулировать задание на поиск достигается методом проб и ошибок. Допустим, вы считаете себя специалистом в области стратегических игр реального времени и с основ­ными достижениями в этой области уже знакомы. Допустим, вы хотите найти новую для себя информацию. Вряд ли Yahoo! даст то, чего вы не зна­ете — все это вы уже читали. Попробуйте с помощью системы Alta Vista сде­лать поиск по ключевым словам:

( realtime NEAR strategy) AND computer AND game

Это пример расширенного поиска. Он вернет ссылки на документы, в кото­рых присутствуют все эти слова и, более того, слово realtime находится рядом (NEAR) со словом strategy. В ответ на такой запрос вы получите немало ссы­лок. Но вы же специалист! Вы уже знаете основные ресурсы и сумеете в этом длинном списке выделить те ссылки, которые ведут к ранее неизвест­ным ресурсам.

Специальный поиск труден и в поисковых каталогах, и в поисковых ука­зателях. Если, например, вы занимаетесь физикой лазеров, то утонете в ссылках, ведущих к научно-фантастическим романам, в которых упомина­ются лазеры. Как специалисту, вам лучше всего пользоваться списками ссылок, составленными другими специалистами или небольшими поис­ковыми системами научных учреждений. А чтобы выйти на них, следует начинать с поискового каталога.

Выводы и рекомендации

Обобщая все сказанное выше, можно дать следующие рекомендации:

• для реферативного поиска пользуйтесь поисковыми каталогами;

• для углубленного поиска пользуйтесь поисковыми указателями;

• для специального поиска предварительно разыщите персональные списки ссылок, составленные коллегами;

Вы можете изучить и скачать доклад-презентацию на тему отечественные поисковые службы. Презентация на заданную тему содержит 18 слайдов. Для просмотра воспользуйтесь проигрывателем, если материал оказался полезным для Вас - поделитесь им с друзьями с помощью социальных кнопок и добавьте наш сайт презентаций в закладки!

500
500
500
500
500
500
500
500
500
500
500
500
500
500
500
500
500
500

Введение Сегодня, в этой презентации, мы разберем историю появления и развития таких отечественных поисковых служб, как aport, артус (@Rus), Rambler, Yandex. Всех их объединяет одна причина появления: сделать самый удобный поисковик для русского сегмента на то время, т. к. зарубежные поисковые службы плохо или вообще не работали с кириллицей.

27 июля в возрасте 48 лет скончался сооснователь Яндекса Илья Сегалович, занимавший пост технического директора. Информация о смерти появилась ещё 25 июля, когда у Сегаловича была зафиксирована смерть головного мозга и он был подключен к аппарату искусственного жизнеобеспечения. Через несколько дней, после отключения от аппарата жизнеобеспечения, о смерти было объявлено официально. По случаю трагедии Яндекс открыл страницу памяти. Свои соболезнования выразил премьер-министр России Дмитрий Медведев. 27 июля в возрасте 48 лет скончался сооснователь Яндекса Илья Сегалович, занимавший пост технического директора. Информация о смерти появилась ещё 25 июля, когда у Сегаловича была зафиксирована смерть головного мозга и он был подключен к аппарату искусственного жизнеобеспечения. Через несколько дней, после отключения от аппарата жизнеобеспечения, о смерти было объявлено официально. По случаю трагедии Яндекс открыл страницу памяти. Свои соболезнования выразил премьер-министр России Дмитрий Медведев.

Важную роль в становлении и развитии отечественного сектора Интернета сыграли отечественные поисковые службы (за что им огромное спасибо). Не знаю, смогли ли они к сегодняшнему дню подойти к самоокупаемости, но в первые годы без сомнения работали на энтузиазме, доброй воле своих сотрудников и вере в будущее. В России есть как универсальные, так и специализированные поисковые службы. Как и везде в мире, в первую очередь развиваются поисковые указатели и рейтинговые системы, но имеется и полноценный каталог.

Русскоязычные поисковые системы в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.

Таблица - Некоторые из отечественных систем

один из первых поисковых указателей российского Интернета

рейтинговая система, обладающая всеми основными функциями поисковых указателей

Она позволяет быстро выявить круг Web-узлов, поставляющих информацию на заданную тему и оценить их популярность по количеству посещений за последние сутки. Обладает одним из крупнейших индексов в России, но ей явно недостает быстродействия и современных алгоритмов рейтингования результатов поиска

мощная поисковая служба, основанная на указателе, обладающая как большой и представительной базой данных по отечественным Web-ресурсам, так и изощренной системой индексации.

предоставляет уникальные в своем роде инструменты, сосредоточенные в разделе расширенного поиска. Возможно, он даже несколько опережают свое время и украсили бы западную поисковую службу, имеющую дело с сотнями миллионов проиндексированных документов. В области простого поиска служба Яndех имеет ряд технологических достижений, прежде всего интеллектуальный механизм морфологического разбора слов

Поисковик и почтовая службаКрупнейший портал российского Интернета Это не только мощнейшая почтовая служба, карты словари и софт, но и более 40 интернет-сервисов.

Определитесь, какую именно поисковую машину лучше использовать. Учитывайте её специфику. Выявите основные слова (или словосочетания), которые характерны для той информации, которую ищите. Попробуйте выявить ключевые слова. Задавая отдельные слова и фразы, учитывайте язык запросов, операторы поиска, логические связки искомых слов и т.п. элементы, которые делают поиск значительно более эффективным. Если вам известна точная фраза из искомых материалов, используйте её как цитату.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Читайте также: