Зарубежные поисковые системы реферат

Обновлено: 04.05.2024

Собрала для вас похожие темы рефератов, посмотрите, почитайте:

Введение

Интернет — это информационное пространство, где вы можете найти ответ практически на любой интересующий вас вопрос. Это огромная глобальная сеть, в которой потоки небольших сетей текут как информационные ручьи. Любой пользователь, имеющий компьютер и соответствующие программы, может подключиться к сети и использовать ее возможности для различных целей — досуга, образования, чтения научных работ, отправки электронной почты и т.д. По различным данным, число пользователей глобальной системы Интернет в 2004 году составляло от 600 до 900 млн. человек. Это число продолжает быстро расти, достигнув в 2006 году миллиарда человек. Сегодня глобальная сеть становится важным социальным и политическим фактором современного информационного общества. Развитие Интернет-технологий создало новый обширный источник информационных ресурсов, которые не только относительно дешевы, но и очень быстро доступны.

Поиск в компьютерных сетях становится искусством и требует очень специфических знаний, которые современный человек должен уметь освоить. Я выбрала эту тему эссе потому, что считаю, что одним из компонентов компетентной работы в Интернете является умение работать в глобальной сети. А чтобы не утонуть в изобилии информации, нужно научиться не только искать, но и находить ее.

Задачи и стратегии поиска

Этот пример иллюстрирует другой элемент стратегии: читайте найденные документы в поисках наиболее точных терминов и связей между терминами. Вы можете думать совершенно иначе, чем авторы документов, которые вы ищете (потому что культурные различия играют большую роль!).

Третий элемент стратегии: использование более одной IPS. Если вы регулярно ищете информацию по определенной теме, выберите наиболее эффективную для вас IPS.

Инструменты поиска в Интернете

По принципу организации и использования поискового инструмента можно разделить на каталоги (каталоги, каталоги) и поисковые системы.

Одним из самых известных каталогов является Yahoo, который содержит множество иерархически упорядоченных тематических категорий. Категории на всех уровнях разветвлены на подкатегории. Корень — домашняя страница каталога, содержащая 14 тематических ветвей. Вы можете перемещаться вверх или вниз по тематическому дереву, нажимая на названия страниц. Индексы всех веб-ресурсов, связанных с темой, включены в Yahoo! Все каталоги и подкатегории выделены жирным шрифтом, а гиперссылки на существующие сайты выделяются жирным шрифтом. На каждой странице Yahoo! встроены специальные иконки.

Поисковая система Yahoo может быть активирована на каждой странице каталога. Для поиска во всем каталоге или на одной из страниц используются специальные кнопки и поле поиска. Поиск Yahoo! основывается на типе адресов, выбранных через опции меню (под поисковым полем). Помимо системы адресации, используемой в тематическом каталоге, в дополнение к электронной почте можно обратиться в информационную службу Usenet. При выборе опций меню Yahoo! осуществляется поиск среди сайтов, содержащихся в каталоге тематических новостных сервисов.

В Интернете размещены узлы и другие каталоги, которые оснащены поисковыми системами, аналогичными поисковым системам Yahoo!

Некоторые поисковые каталоги перечислены ниже:

Основным недостатком поисковых каталогов веб-ресурсов является то, что их поисковые системы извлекают большое количество документов, которые не соответствуют введенному поисковому запросу. Документы в нижней части списка обычно содержат мало полезной информации. Ключевые слова могут быть интерпретированы поисковой системой в совершенно ином контексте, либо они могут соответствовать множественным интерпретациям.

Поисковые системы. Для детального поиска документов используются специализированные поисковые системы. Задача поисковых систем — постоянно и последовательно проверять все доступные для этой поисковой системы Интернет-узлы со всеми их соединениями и разветвлениями. Поскольку информация постоянно обновляется, поисковая система регулярно по истечении определенного периода времени (около месяца) возвращается на уже проверенные узлы, чтобы обнаружить и записать изменения. Вся прочитанная информация индексируется, т.е. создается специализированная база данных, в которой шифруются все просматриваемые системой интернет-страницы.

При получении запроса от пользователя поисковая система проверяет всю проиндексированную информацию и создает список документов, соответствующих поисковому заданию. Найденные документы ранжируются в соответствии с расположением ключевых слов (в заголовке, в начале текста, в первых абзацах) и частотой их появления в тексте.

Несмотря на сходные принципы работы, поисковые системы различаются по языкам запросов, диапазонам поиска, глубине поиска в документе, методам ранжирования и приоритетам, поэтому использование разных поисковых систем приводит к разным результатам.

В настоящее время существует ряд поисковых систем, которые работают на отечественных ресурсах. Существуют фирменные и даже отдельные сайты, которые включают в себя определенные поисковые системы. Элементы поиска можно найти практически во всех Интернет-газетах и образовательных порталах.

Ниже представлены наиболее распространенные поисковые системы:

Однако можно программно запретить регистрацию всего сайта или отдельных элементов сайта в целом, а также определенных поисковых систем. Для таких целей существуют так называемые мета-теги или мета-детерминанты. Однако это отдельная дискуссия о том, кто и с какой целью вводит такой запрет. Компьютер сети Интернет.

Заключение

Наконец, мы хотели бы определить базовый алгоритм поиска.

Сначала определите, к какому разделу относится искомая информация.

Определите, какая поисковая система лучше всего подходит. Учитывайте его особенности.

Определите ключевые слова (или фразы), которые относятся к информации, которую вы ищете Попробуйте определить ключевые слова.

При указании отдельных слов и фраз учитывайте язык поисковых запросов, поисковые операторы, логические строки искомых слов и т.д. Элементы, которые делают поиск более эффективным.

Если вы знаете точную формулировку из материалов, которые вы ищете, используйте ее в качестве цитаты.

Правильно расположите материал и отсортируйте его в соответствии с характеристиками, которые вам подходят. Это значительно ускоряет дальнейшую обработку материала.

Список литературы

Помощь студентам в учёбе
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal
lfirmal

Образовательный сайт для студентов и школьников

© Фирмаль Людмила Анатольевна — официальный сайт преподавателя математического факультета Дальневосточного государственного физико-технического института

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу).

Содержание

Содержание
Введение
Отечественные поисковые системы.
Яндекс
Рамблер
Апорт
Зарубежные поисковые системы
Google
MSN
Заключение

Работа состоит из 1 файл

ИТ в образовании поисковики.doc

РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ СОЦИАЛЬНЫЙ УНИВЕРСИТЕТ

Факультет информационных технологий

Кафедра социальной и педагогической информатики

Выполнила студентка 1 курса

ПОИ – Д – Б – 1 Бизюкина Анастасия

Проверил к.п.н., доцент Ежова Г.Л.

Отечественные поисковые системы.

Зарубежные поисковые системы

Введение

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу).

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

Для простоты восприятия информации о классификации поисковых систем была составлена следующая схема:

Ранжирование по группа производилось по следующим признакам: форма и способ занесения информации о сайтах и возможности, предоставляемые для нахождения необходимой информации.

В самую обширную зону А входят сайты с примитивными каталогами. Сайты в этих каталогах либо вообще не сортированы, либо сортировка производится по нескольким общим группам.

В каталогах (зона В) информация о сайтах Internet, так же как в подборках, упорядочена по категориям специально разработанного дерева-рубрикатора, но, в отличие от предыдущего случая, в них имеются механизмы поиска информации по запросам. В основную массу каталогов информация заносится авторами сайтов, сообщающими о себе при регистрации необходимые сведения. Как правило, работа поисковых механизмов ограничивается поиском лишь в кратких аннотациях сайтов.

Особого внимания заслуживают современные каталоги (зона С), отличающиеся расширенной, а иногда и полной индексацией содержимого сайтов и мощными механизмами контекстного поиска в индексных базах.

Опишем основные характеристики поисковых систем:

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.

Состав и принципы работы поисковой системы.

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:

дата, когда страница была скачана

тело страницы (html-код)

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ФИЛИАЛ В г. НОВЫЙ УРЕНГОЙ

Выполнил: студент гр. СА-162

Серов Геннадий Петрович

Преподаватель: Малышева С.И.

г. Новый Уренгой

Сегодня, почти каждый человек хотя бы раз пользовался поисковой системой. Неважно какой именно. Цифровые технологии и IT – технологии настолько плотно вошли в нашу жизнь, что некоторые уже не могут жить без них и интернета. Каждый день среднестатистический человек, у которого есть доступ в сеть Интернет, пользуется поисковой системой в среднем около 25-30 раз. Сейчас подробно рассмотрим тему поисковых систем.

Поисковая система

Поисковая система (поисковик) — это сайт, который осуществляет поиск ответа на запрос пользователя по всем известным данной системе сайтам.

Существует множество поисковых систем, каждая из которых использует собственные алгоритмы построения списка сайтов, содержащих по мнению поисковика ответ на запрос пользователя. Помимо алгоритмов поисковая система использует в работе роботов, которые индексируют сайты, изображения, проверяют доступность сайтов и пр.

Большинство поисковых систем учитывают региональность сайта, пользователя и его запроса, выдавая посетителю наиболее корректный по мнению поисковика ответ в виде списка сайтов.

Виды поисковых систем

Как не удивительно это не звучало, но даже поисковые системы делятся на несколько видов

Поисковые системы делятся на следующие виды:

Национальные поисковые системы
Поисковые системы разрабатываемые изначально для поиска сайтов внутри конкретной страны, т.е. для внутреннего рынка. Большинство из них постепенно вышли за рамки своего государства, но при этом не перешли в разряд транснациональных.

Транснациональные поисковые системы
Поисковые системы, осуществляющие поиск ответа на запрос пользователя по сайтам всех стран, независимо от их доменной зоны и страны нахождения.

Пример транснациональных поисковых систем: Google , Baidu, Yahoo!, Bing.

Самой популярной, крупной и часто используемой транснациональной поисковой системой конечно же является Google .

Google — американская транснациональная публичная корпорация, реорганизованная 2 октября 2015 года в международный конгломерат Alphabet Inc. , компания в составе холдинга Alphabet , инвестирующая в интернет-поиск , облачные вычисления и рекламные технологии. Google поддерживает и разрабатывает ряд интернет-сервисов и продуктов и получает прибыль в первую очередь от рекламы через свою программу AdWords .

Первая поисковая система

Wandex и другие первые сервисы имели весьма несовершенную систему поиска. При запросе слова они выдавали не наиболее релевантные ссылки, а все страницы, его содержащие, без анализа и ранжирования. Поэтому некоторое время реальными конкурентами поисковиков были каталоги страниц — сайты с вручную отсортированными коллекциями ссылок на веб-ресурсы.

развитой части человечества от индустриального общества к информационному.

Одним из наиболее ярких явлений этого процесса является возникновение и

развитие глобальной информационной компьютерной сети. С появлением

Интернета проблема поиска становилась б олее актуальной. Инт ернет- это единая

информационная среда, также это большое количество полезной информации, для

Основные протоколы, используемые в Интернет, не обеспечены достаточными

встроенными функциями поиска, не говоря уже о миллионах серверах, находящихся

навигации, которая рассматривается только как средство просм отра страниц, но не

их поиска. То же самое относится и к протоколу FTP, который даж е более

навигационные методы просмотра быстро достигают предела их функциональных

возможностей, не говоря уже о пределе их эффективности. Не указывая конкретных

цифр, можно сказать, что нужную информацию уж е не представляется возможным

получить сразу, так как в Сети сейчас находятся миллиарды докум ентов и все они в

распоряжении пользователей Интернет, к то му же сегодня их колич ество

возрастает. Количество изменений, которым эта информация подвергнута, огромно

и, самое главное, они произошли за очень короткий период времени. Основная

проблема заключается в том, что единой полной функциональной систем ы

обновления и занесения подобного объема информации, одновременно доступного

всем пользователям Интернет во всем мире, никогда не было. Для того, чтобы

структурировать информацию, накопленную в сети Интернет, и обеспечить ее

пользователей удобными средствами поиска необходимых им данных, были

Автоматизированная поисковая система – система, состоящая из персонала и

комплекса средств автоматизации его деятельности, реализующая информационную

технологию выполнения установленных функций. Опыт и практика создания систем

в различных сферах деятельности позволяет дать более широкое и универсальное

определение, которое по лнее отражает все аспекты их сущности. Под

информационной системой в дальнейшем понимается – организованная

совокупность программно–технических и других вспомогательных средств,

технологических процессов и функционально–определённых групп работников,

обеспечивающих сбор, представление и накопление информационных ресурсов в

определённой предметной области, поиск и выдачу сведений, необходимых для

удовлетворения информационных потребностей установленного контингента

Следовательно, и нформационно-поисковая система выполняет следующие

- добавления, удаления и изменения хранимой информации;

Создание и использование информационно-поисковой системы началось в

конце 1950-х - начале 1960-х годов. Информационно-поисковая система опирается

на базу данных, в которой осуществляет поиск нужных документов по заявкам

пользователей. Частным случаем и нформационно-поисковой системы яв ляется

информационно-справочная система, которая в ответ на запросы выдает сведения, в

явной форме отсутствующие в базе данных. Широко информационно-поисковые

Обратимся к истории возникновения сети Internet, которая была создана в связи

с возникшей необходимостью совместного использов ания информационных

ресурсов, распределенных между различными компьютерными системами.

Большинство первых приложений, включая FTP и электронную почту, были

разработаны исключительно для обмена данными между хост-компьютерами

Другие приложения, такие как Telnet, создавались для того, чтобы пользователь

получил возможность доступа не только к информации, но и к рабочим ресурсам

удаленной системы. По мере развития I nternet (увеличения пользователей и хост-

компьютеров) прежние методы обмена данными перестали отвечать возросшим

потребностям пользователей. Возникла необходимость разработки новых способов

поиска сетевых ресурсов и доступа к ним, которые позволяли бы использовать

информацию независимо от ее формата и расположения.

Для удовлетворения таких потребностей сначала были созданы поисковая

система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система

Gopher, упрощающая доступ к различным сетевым ресурсам. Затем были

разработаны сетевые информационные системы WWW и WAIS, предлагающие

абсолютно новые методы получения инф ормации. Принципы работы этих систем

позволяют легко ориентироваться в огромном количестве информационных

ресурсов без необходимости предоставления механизмов работы самой сети Internet.

Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных

компьютерных систем, а об особых информационных пространствах сети.

Система Archie представляет собой комплекс программных средств,

работающих со специальными базами данных. В этих базах данных содержится

постоянно пополняющаяся инф ормация о ф айлах, к которым можно получить

доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществить

поиск файла по шаблону его имени. При этом пользователь получит список файлов

с точным указанием места их хранения в сети, а также с информацией о типе,

времени создания и размере файлов. Доступ к информационно-поисковой системе

Archie может осуществляться различными путями, начиная от запросов по

электронной почте и с помощью сервиса Telnet и заканчивая использованием

Система Gopher была разработана для упрощения процесса локализации FTP-

ресурсов Internet и для более удобного представления сведений о содержании

хранящихся на FTP-серверах файлов. Система Gopher дает возможность в удобной

форме (в виде меню) представлять пользователям об имеющихся файлах и их

содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и

FTP-серверы. Таким образом, пользователь получает воз можность

“путешествовать” по Internet, не обращая внимания на местонахождение

интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве

по заголовкам пунктов меню. После ввода ключевого слова, систем а Veronica

выясняет, встречается ли оно в меню на каком-либо Gopher- сервере, и в качестве

результатов поиска выдает список заголовков пунктов меню, содержащих ключевое

слово. Поскольку система Veronica не является автономной поисковой программ ой,

а тесно свя зана с систем ой Gopher, она обладает тем же, что и система Gopher,

недостатком: далеко не всегда по заголовку можно сказать, что собой представляет

тот или иной информационный ресурс. Достоинства системы заключается в том, что

нет необходимости узнавать, где расположена найденная информация, достаточно

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.



1. Структура справочно-поисковых систем сети Интернет

1.1 Как работают механизмы поиска
2. Сравнительный обзор справочно-поисковых систем
2.1 Gopher
2.2 WAIS
2.3 WWW
2.4 AltaVista
2.5 Yahoo
2.6 OpenText
2.7 Infoseek

3. Поисковые роботы

5. Наиболее популярные зарубежные поисковики для русскоязычного пользователя

5.1 Googlе

1. Структура справочно-поисковых систем сети интернет

3. Поисковые роботы

За последние годы Всемирная паутина стала настолько популярной, что сейчас Интернет является одним из основных средств публикации информации. Когда размер Сети вырос из нескольких серверов и небольшого числа документов до огромных пределов, стало ясно, что ручная навигация по значительной части структуры гипертекстовых ссылок больше не представляется возможной, не говоря уже об эффективном методе исследования ресурсов.
Эта проблема побудила исследователей Интернет на проведение экспериментов с автоматизированной навигацией по Сети, названной "роботами". Веб-робот - это программа, которая перемещается по гипертекстовой структуре Сети, запрашивает документ и рекурсивно возвращает все документы, на которые данный документ ссылается. Эти программы также иногда называют "пауками", " странниками", или " червями" и эти названия, возможно, более привлекательны, однако, могут ввести в заблуждение, поскольку термин "паук" и "странник" cоздает ложное представление, что робот сам перемещается, а термин "червь" мог бы подразумевать, что робот еще и размножается подобно интернетовскому вирусу-червю. В действительности, роботы реализованы как простая программная система, которая запрашивает информацию из удаленных участков Интернет, используя стандартные cетевые протоколы.

Читайте также: