Виды поисковых систем сравнительный анализ пс доклад кратко

Обновлено: 28.06.2024

Поисковая оптимизация сайтов обычно включает в себя преобразование структуры сайта, наполнение текстовым содержимым в зависимости от продвигаемых запросов, а также различные способы повышения цитируемости ресурса. Кроме стандартных оптимизационных процессов имеются многочисленные методы, которые применяются уже к конкретной поисковой системе. Конечно, поисковики с открытыми кодами пока редкость, и оптимизаторам есть над чем поломать головы, но некоторые основные закономерности поведения можно проследить и у уже утвердившихся систем.

В этом мастер-классе мы с оттенком сравнительного анализа рассмотрим самые популярные зарубежные поисковики и поисковые системы России.

2. Российские поисковые системы

Google, Yandex, и Rambler на сегодняшний день считаются наиболее популярными поисковыми машинами в России. Система Yandex является более посещаемой и имеющей в необходимой степени релевантную выдачу, следовательно, чаще всего оптимизаторы берутся продвигать ресурс именно в этой системе.

Рассмотрим более подробно каждую их этих поисковых систем.

Google

Google имеет свой российский аналог, менее популярный чем исходный американский, но ничем ему не уступающий по качеству поиска. У Google в России есть многочисленные поклонники, считающие, что этот поисковик выдает наилучший результат.

PageRank, используемый в Google, в основном основан на link popularity. Т.е. при вычислении релевантности страницы наибольший вклад имеет количество и качество ссылок на страницы с других страниц.

На данный момент база данных Google насчитывает более миллиарда проиндексированных страниц.

Google – одна из немногих поисковых систем, которая глубоко индексирует ваш сайт. Google использует link popularity как наиболее весомый фактор в определении релевантности страницы. Поэтому большим и популярным сайтам проще попасть на высокие позиции в результатах поиска. Это также защищает Google от спама.

Google полагает, что следующие факторы будут наиболее весомыми при ранжировании страниц:

  • Link popularity (индекс цитирования);
  • Keyword proximity and density (плотность и частота ключевых слов);
  • Keywords in the link text (ключевые слова в ссылках);
  • Emphasized text (выделенный текст).

Отличительная особенность Yandex – интуитивный поиск во всех словоформах. Уникальная разработка под особенности русского языка.

В каталоге Яндекса используется такое понятие, как тематический индекс цитирования (тИЦ). Он определяется количеством и качеством внешних ссылок на ваш сайт. На качество ссылки влияет тИЦ ресурса, ссылающегося на вас. Немаловажную роль играет тематическая близость вашего сайта ссылающимися на вас ресурсам.

При подсчете индекса цитирования не берутся во внимание ссылки с форумов, веб-досок, конференций, сайтов, расположенных на бесплатных хостингах (если они не описаны в каталоге Яндекса). Естественно, не учитываются ссылки с тех сайтов, которые Яндекс не индексирует (например, зарубежные сайты).

Количество хостов зависит от посетителей (чем их больше, тем больше хостов), а индекс цитирования Яндекса – от авторов сайтов (чем больше авторов поставят ссылку на ваш ресурс, тем выше значение CY).

По значению индекса цитирования определяется релевантность ресурса в каталоге Яндекса и, соответственно, позиция вашего сайта в выбранном разделе.

Переиндексация документа происходит примерно раз в две недели, но под каждый сайт робот подстраивается в отдельности. Все зависит от частоты обновления. По словам Яндекса, тег никакой роли в работе робота не играет.

Яндекс индексирует российскую сеть, поэтому в поисковую машину вносятся сервера в доменах su, ru, am, az, by, ge, kg, kz, md, ua, uz. Остальные сервера вносятся, только если на них найден текст на русском языке.

Информация в заголовке (тег ) Яндекс отображает в результатах поиска. Слова, находящиеся в теге , имеют больший вес чем все остальные. Ключевые слова в теге также увеличивают вес слова в документе, но только если само слово находится на странице.

Помимо вышеперечисленных способов, на релевантность слова влияют частота его использования в заголовках ( , . ), в атрибуте alt, во всплывающих подсказках (тег ) и процент встречаемости этого слова в документе, т.е. как часто вы его используете. Но при этом необходимо сохранить смысл документа, иначе Яндекс может посчитать это слово спамом.

Rambler

Является лучшим рубрикатором на сегодняшний день. Удобен тем, что все ресурсы разбиты на разделы, подразделы и т.д. Многие из них участвуют в рейтинге Top100, что позволяет определить популярность того или иного ресурса.

Считается, что основополагающим фактором для продвижения сайта в Rambler является хороший контент и посещаемость, измеряемая с помощью установленного на сайте счетчика. Таким образом, высокие позиции в рейтинге может занимать сайт хорошо раскрученный, качественно и давно зарекомендовавший себя в интернете, с большой посещаемостью.

Наименее популярная из перечисленных поисковых систем. Основные критерии, которые данная система учитывает при сортировке сайтов:

  • количество искомых слов в тексте документа (в процентах), расстояние между поисковыми словами в тексте документа;
  • место в тексте, где встречаются поисковые слова (заголовок, описание, мета-тег и т.п.);
  • внешний вид шрифта, которым набраны в тексте искомые слова (размер, жирность, цвет);
  • количество ссылок из Интернета на данный документ;
  • использование искомого слова в тексте ссылок из Интернета на данный документ.

3. Зарубежные поисковые системы

Представленные ниже зарубежные поисковые системы широко известны и используются во всем мире. Для веб-мастеров эти поисковые системы – наиболее важные места для регистрации, так как потенциально они способны привести большое количество посетителей на сайт. Некоторые из перечисленных систем не являются полноценными поисковиками, а лишь используют ресурсы других известных поисковых систем.

Считается по количеству проиндексированных страниц одной из наиболее крупных поисковых систем. Большую популярность система получила благодаря возможности вести поиск по усложненным критериям отбора. AltaVista предлагает дополнительные услуги в виде поиска по каталогам из Open Directory, LookSmart, Ask Jeeves.

Google – это поисковая система, которая использует количество ссылок на веб-сайт, как основной параметр популярности сайта. Это особенно полезно при поиске хороших сайтов с помощью простых поисковых запросов. Google знаменит высокой релевантностью ссылок. Google имеет очень большую базу данных проиндексированных сайтов и предоставляет часть своих результатов Yahoo и Netscape Search.

Yahoo является наиболее популярным и старейшим поисковым средством. В Yahoo работает около 150 редакторов, которые составляют и редактируют содержимое своих каталогов. Yahoo имеет в базе данных более 1 миллиона проиндексированных сайтов. Также, в случае нехватки своей собственной базы данных, Yahoo использует базу данных Google, а ранее, надо сказать, использовал базу Inktomi.

Direct Hit измеряет количество кликов. Сайты, по которым больше кликают, получают лучший рейтинг. Известна под названием "поисковая система популярности".

Результаты Direct Hit также появляются в HotBot, а также, в виде опции, могут показываться в MSN Search.

Результаты системы берутся из LookSmart, Inktomi, RealNames и Direct Hit. Для пользователей MSN Search существует уникальная возможность сохранять результаты предыдущего поиска.

Ярким отличием системы является то, что позиции в выдаче продаются. GoTo считает такую выдачу более релевантной. Также можно купить более высокие места в различных рейтингах. Неоплаченные результаты предоставляет Inktomi.

В этой системе не реализована возможность ввода поискового слова напрямую, только через интерфейс других поисковых систем. А таких превеликое множество.

Характерной чертой можно назвать отличные результаты для каждого их партнеров этой базы. Варьирование результатов предоставляет возможность выдаче отдельного поисковика отличаться от других.

Наполнение данной системы осуществлялось с привлечением добровольцев. После достаточного формирования стало возможным свободно пользоваться ее результатами. В настоящее время Open Directory используют Lycos, AOL Search, AltaVista и HotBot.

Отличительная особенность этой системы заключается в том, что при наборе ключевого слова (например, бренда компании) можно попасть на официальный сайт этой компании.

4. Особенности продвижения

Какой бы ни была поисковая система, российской или зарубежной, какие бы она алгоритмы фильтрации не имела, все равно основным критерием оценки релевантности ресурса относительно конкретного запроса является наличие качественного текстового наполнения, что не может не радовать. Для добросовестных оптимизаторов первостепенной задачей при продвижении ресурса является, прежде всего, оптимизация контента сайта, его внутренней ссылочной навигации и удобства для непосредственного пользователя, а не прямая оптимизация под определенную поисковую систему.

Второй по значимости шаг при продвижении во многих поисковиках – это наличие максимального количества ссылок на ресурс. Хотя среди многих непосредственных пользователей бытует мнение, что этот критерий не может в полной мере предоставлять результат, на сегодняшний день он является необходимым.

5. Заключение

Мастер-класс позволяет оценить принципиальные различия поисковых гигантов и составить некоторое представление о том, каким же образом в интернете можно получить более или менее релевантную информацию. Наличие многочисленных поисковых систем создает значительную конкуренцию, а, как известно, конкуренция влечет за собой процессы, направленные на прогресс и развитие в нужном направлении. В данном случае главным приоритетом все же является качественный результат. Ура!

Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.

Поисковые системы


Многие пользователи поиска никогда не думали о принципах их работы, о способах обработки пользовательских запросов, о том, как построены и функционируют данные системы. Данный материал поможет людям, которые занимаются оптимизацией и продвижение своих сайтов, понять устройство и основные функции поисковых машин.

Функции и понятие ПС

Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.


В ходе ранжирования, поисковые системы должны точно угадать желание пользователя


Для того чтобы получить правильные ответы на подобные вопросы, разработчики поиска постоянно улучшают принципы ранжирования и его алгоритмы, добавляют им новые возможности и функции и любыми средствами пытаются сделать быстрее работу системы.

Основные характеристики поисковых систем

Полнота.

Точность.

Актуальность.

Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.

Скорость поиска.

Наглядность.

Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.

Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.

История развития поисковых систем

Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.

Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.

DMOZ

Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.

В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.

AltaVista долгое время была самой популярной поисковой системой

В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.

Сергей Брин и Ларри Пейдж

В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.

Офис Яндекса

Доля поисковых систем

  • Google — 70,83 %;
  • Bing — 12,61 %;
  • Baidu — 11,83 %;
  • Yahoo! — 2,30 %;
  • Яндекс — 1,41 %;
  • DuckDuckGo — 0,42 %;

Доля поисковый систем 2020

Доля поисковых систем по Яндекс.Радар

Принципы работы поисковой системы

Модуль индексирования.

Данный компонент состоит из трех программ-роботов:

Роботы поисковой системы Яндекс

Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.

Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.

Индексатор Яндекса

Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.

Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.

Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.

База данных

База данных (или индекс поисковика) - комплекс хранения данных, массив информации в котором сохраняются определенным образом переделанные параметры каждого обработанного модулем индексации и скачанного документа.

Поисковый сервер

Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ФИЛИАЛ В г. НОВЫЙ УРЕНГОЙ

Выполнил: студент гр. СА-162

Серов Геннадий Петрович

Преподаватель: Малышева С.И.

г. Новый Уренгой

Сегодня, почти каждый человек хотя бы раз пользовался поисковой системой. Неважно какой именно. Цифровые технологии и IT – технологии настолько плотно вошли в нашу жизнь, что некоторые уже не могут жить без них и интернета. Каждый день среднестатистический человек, у которого есть доступ в сеть Интернет, пользуется поисковой системой в среднем около 25-30 раз. Сейчас подробно рассмотрим тему поисковых систем.

Поисковая система

Поисковая система (поисковик) — это сайт, который осуществляет поиск ответа на запрос пользователя по всем известным данной системе сайтам.

Существует множество поисковых систем, каждая из которых использует собственные алгоритмы построения списка сайтов, содержащих по мнению поисковика ответ на запрос пользователя. Помимо алгоритмов поисковая система использует в работе роботов, которые индексируют сайты, изображения, проверяют доступность сайтов и пр.

Большинство поисковых систем учитывают региональность сайта, пользователя и его запроса, выдавая посетителю наиболее корректный по мнению поисковика ответ в виде списка сайтов.

Виды поисковых систем

Как не удивительно это не звучало, но даже поисковые системы делятся на несколько видов

Поисковые системы делятся на следующие виды:

Национальные поисковые системы
Поисковые системы разрабатываемые изначально для поиска сайтов внутри конкретной страны, т.е. для внутреннего рынка. Большинство из них постепенно вышли за рамки своего государства, но при этом не перешли в разряд транснациональных.

Транснациональные поисковые системы
Поисковые системы, осуществляющие поиск ответа на запрос пользователя по сайтам всех стран, независимо от их доменной зоны и страны нахождения.

Пример транснациональных поисковых систем: Google , Baidu, Yahoo!, Bing.

Самой популярной, крупной и часто используемой транснациональной поисковой системой конечно же является Google .

Google — американская транснациональная публичная корпорация, реорганизованная 2 октября 2015 года в международный конгломерат Alphabet Inc. , компания в составе холдинга Alphabet , инвестирующая в интернет-поиск , облачные вычисления и рекламные технологии. Google поддерживает и разрабатывает ряд интернет-сервисов и продуктов и получает прибыль в первую очередь от рекламы через свою программу AdWords .

Первая поисковая система

Wandex и другие первые сервисы имели весьма несовершенную систему поиска. При запросе слова они выдавали не наиболее релевантные ссылки, а все страницы, его содержащие, без анализа и ранжирования. Поэтому некоторое время реальными конкурентами поисковиков были каталоги страниц — сайты с вручную отсортированными коллекциями ссылок на веб-ресурсы.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Голубева Д.М., Бочкова А.А.

В век информационных технологий огромную роль играет интернет , а любое путешествие по просторам интернета невозможно без специальных поисковых систем, позволяющих комфортно просматривать любимые вебстраницы. Первоочередной задачей любой поисковой системы является доставление людям именно той информации, которую они ищут. В статье рассматриваются популярные среди пользователей поисковые система мира. Цель исследования состоит в анализе и сравнении поисковых систем, наиболее востребованных. В работе приведен алгоритм и расчеты нахождения лучшей поисковой системы , в зависимости от установленных критериев и весовых коэффициентов. Данный алгоритм поможет многим пользователям глобальной сети в правильном выборе поисковой системы , чтобы осуществлять быстрый поиск нужной информации в кратчайшие сроки.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Голубева Д.М., Бочкова А.А.

Проблемы использования сетевых информационных ресурсов в области сельского хозяйства: методические рекомендации

Comparative analysis of modern search systems

In the age of information technology, the Internet plays a huge role, and any journey through the Internet is impossible without special search engines that allow you to comfortably view your favourite web pages. The primary goal of any search engine is to deliver people exactly the information they are looking for. The article considers popular search engines of the world among users. The aim of the research is to analyze and compare the search engines most in demand. In this paper the algorithm and calculations of finding the best search system are presented, depending on the established criteria and weighting factors. This algorithm will help many users of the global network in the right choice of the search engine to perform a quick search of the necessary information in the shortest possible time.

Сравнительный анализ современных поисковых систем Comparative analysis of modern search systems

Студент 2 курса магистратуры, ф-т информационных технологий, Тверской государственный технический университет,

Студент 2 курса магистратуры, ф-т информационных технологий, Тверской государственный технический университет,

2rd year student of magistracy, faculty of information technology, Tver State Technical University, Russia, Tver e-mail: anna. bo4kowa@yandex. ru

В век информационных технологий огромную роль играет интернет, а любое путешествие по просторам интернета невозможно без специальных поисковых систем, позволяющих комфортно просматривать любимые вебстраницы. Первоочередной задачей любой поисковой системы является доставление людям именно той информации, которую они ищут. В статье рассматриваются популярные среди пользователей поисковые система мира. Цель исследования состоит в анализе и сравнении поисковых систем, наиболее востребованных. В работе приведен алгоритм и расчеты нахождения лучшей поисковой системы, в зависимости от установленных критериев и весовых коэффициентов. Данный алгоритм поможет многим пользователям глобальной сети в правильном выборе поисковой системы, чтобы осуществлять быстрый поиск нужной информации в кратчайшие сроки.

In the age of information technology, the Internet plays a huge role, and any journey through the Internet is impossible without special search engines that allow you to comfortably view your favourite web pages. The primary goal of any search engine is to deliver people exactly the information they are looking for. The article considers popular search engines of the world among users. The aim of the research is to analyze and compare the search engines most in demand. In this paper the algorithm and calculations of finding the best search system are presented, depending on the established criteria and weighting factors. This algorithm will help many users of the global network in the right choice of the search engine to perform a quick search of the necessary information in the shortest possible time.

Ключевые слова: поисковая система, рейтинг, интернет, точность поиска, полнота поиска.

Key words: search system, rating, the Internet, search accuracy, completeness of search

На сегодняшний день поисковые системы являются сложнейшими и громадными механизмами, представляющие собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса. Работа с помощью поисковых систем позволяет многим пользователям глобальной сети осуществлять быстрый поиск нужной информации в кратчайшие сроки. Данная работа является актуальной, т.к. поисковые системы уже долгое время являются обязательной частью интернета и жизни общества.

В рамках данной статьи будет произведен анализ популярных среди пользователей поисковых систем мира и их сравнение. Для осуществления поставленной цели осуществим подбор и анализ популярных поисковых систем мира. Рейтинг популярных систем мира по данным исследовательской компании NetMarketShare представлен на рисунке 1. [1]

Рисунок 1 Рейтинг поисковых систем мира по популярности на май 2016 года

Популярными поисковыми системами в России по данным российского онлайн - сервиса Liveinternet на ноябрь 2017 года являются следующие [2]:

Google - На сегодняшний день, система Google является общепризнанным лидером среди поисковых систем мира. Появление системы произошло в 1996 году, а корпорации Google - двумя годами позже. Google - это не только поиск, но и еще более 50 сервисов, включая самый популярный браузер Google Chrome. По мнению многих специалистов, Google Chrome самый быстрый браузер в мире, на сегодняшний день. Что касается оценки пользователей, то претензий к скорости работы не было выявлено, браузер открывает страницы практически мгновенно.

Yandex - Крупнейшая поисковая система. Появление системы произошло 23 сентября 1997 года. В последние годы Яндекс активно выходит на международный уровень. Сейчас он имеет версии сервиса в Беларуси, Украине, Казахстане и Турции. В последнее время Yandex активно продвигает свой собственный браузер.

Bing - Поисковик компании Microsoft, который быстро набирает популярность. Появление Bing произошло 1 июня 2009 года. На 2016-й год ее можно назвать быстроразвивающейся поисковой системой с достаточной долей рынка, и это позволяет назвать её конкурентом Google.

Rambler - Поисковая система, существовавшая с 1996 по 2011 года. На сегодняшний день это крупнейший российский интернет-портал. Поиск по Rambler осуществляется силами движка Яндекса, объективных причин падения его популярности нет.

Рассмотрим пятерку поисковых систем по двум главным характеристикам: по полноте и точности поиска. Качество поиска в информационно-поисковых системах можно определить двумя критериями -точностью и полнотой. Точность определяется соотношением между найденными релевантными и нерелевантными документами, а полнота поиска - общим количеством найденных документов. Релевантным будем считать документ, который удовлетворяет запросу пользователя. Нерелевантные документы, сравниваемые с релевантными, иногда могут называться шумом, по аналогии с теорией передачи информации. Релевантные документы в таком случае называют сигналом, а эффективность поиска оценивают по соотношению "сигнал - шум".[3]

Таблица 1 - Весовые коэффициенты

Критерий Весовой коэффициент

Точность поиска 0,8

Полнота поиска 0,2

Сформулируем тринадцать запросов на разные темы и выполним каждый запрос в каждой из пяти исследуемых поисковых системах. Из полученных списков результатов выберем следующую информацию:

1. Общее количество найденных документов (Д).

2. Количество релевантных документов различной ценности (РД)

Количество релевантных документов оценивается при просмотре текста первых 10 найденных документов. Также определяется ценность найденной информации (степень удовлетворения найденном документом информационных потребностей). Ценность информации оценивается по 3-х бальной шкале: 2 балла - информация имеет ценность, 1 балл - информация имеет частичную ценность, 0 баллов - информация не имеет ценности. [3] Результаты выполнения запросов сведем в таблицу 2.

Таблица 2 - Результаты выполнения запросов

Д РД Д РД Д РД Д РД Д РД

2 1 0 2 1 0 2 1 0 2 1 0 2 1 0

1 1 810 000 9 1 0 3 180 000 10 0 0 7 000 000 5 2 3 41 000 000 9 1 0 40 000 000 9 1 0

2 116 000 8 2 0 711 000 10 0 0 2 000 000 8 1 1 943 000 10 0 0 942 000 9 1 0

3 420 000 7 2 1 2 330 000 8 2 0 1 000 000 9 1 0 3 000 000 8 0 2 2 000 000 9 0 1

4 62 000 8 2 0 964 000 10 0 0 1 000 000 8 1 1 3 000 000 9 1 0 2 000 000 9 0 1

5 2 340 000 8 1 1 2 380 000 8 0 2 7 000 000 7 1 2 20 000 000 9 0 1 17 000 000 9 0 1

6 103 000 7 0 3 1 020 000 10 0 0 1 000 000 9 0 1 3 000 000 10 0 0 2 000 000 10 0 0

7 746 000 9 0 1 5 430 000 9 0 1 13 000 000 10 0 0 3 000 000 9 0 1 1 000 000 9 0 1

8 19 900 7 2 1 214 000 10 0 0 18 000 9 1 0 9 000 8 0 2 9 000 10 0 0

9 42 400 9 1 0 140 000 9 0 1 766 000 7 1 2 431 000 9 0 1 430 000 10 0 0

1 0 999 000 10 0 0 4 190 000 9 0 1 9 000 000 9 1 0 6 000 000 10 0 0 4 000 000 10 0 0

1 1 1 940 000 10 0 0 683 000 000 9 1 0 9 000 000 10 0 0 7 000 000 10 0 0 6 000 000 9 0 1

1 2 73 700 9 1 0 812 000 8 1 1 863 000 9 0 1 834 000 9 1 0 869 000 10 0 0

1 3 115 000 10 0 0 301 000 10 0 0 3 000 000 9 0 1 2 000 000 10 0 0 2 00 0 000 10 0 0

Выполним первичную обработку результатов. Для этого сведем их в таблицу 3.

Для нахождения лучшей поисковой системы для начала вычислим средние арифметические значения показателей для каждой поисковой системы Д, РД(0), РД(1) и РД(2).

Далее необходимо определить место каждой поисковой системы по критерию "Полнота поиска". Для его определения места будем использовать среднее количество найденных документов Д. Наилучшей считается та система, которая нашла больше документов. Ей присваивается первое место, самой худшей - место N ( где N - это количество всех исследуемых систем). Коэффициент точности поиска Р для каждой поисковой системы определим по формуле:

где а - число релевантных документов, которые выдала поисковая система в ответ на запрос,

Вопросы студенческой науки Выпуск №16, декабрь 2017

а = 0.5 * РД(1)+ РД(2) ; Ь - число документов, которые полностью не имеют ценность, Ь = РД(0). Далее необходимо определить место каждой поисковой системы по критерию "Точность поиска". Лучшей будет считаться система, которая имеет большее значение коэффициента точности поиска Р. Ей присваивается первое место, самой худшей - место N ( где N - это количество исследуемых систем).

Следующим шагом будет вычисление коэффициента поискового шума S по формуле: S=1 - Р

В заключении необходимо вычислить по следующей формуле рейтинг каждой исследуемой системы Я: 111

где 1 - номер критерия оценки поисковой системы, т - это количество критериев оценки, ■да - весовой коэффициент для критерия оценки 1, qi - это место ПС по критерию оценки 1. N - общее количество исследуемых

Таблица 3 - Результаты сравнительного анализа поисковых систем

Полнота поиска (Д) 675923,1 1719615,385 4203615,4 6939769,2 6019230,8

Место(полнота поиска) 6 5 4 1 3

Среднее количество пертинентных документов (РД2) 8,5 9,23 8,38 9,23 9,46

Среднее количество частично пертинентных документов (РД1) 0,92 0,31 0,69 0,23 0,15

Среднее количество непертинентных документов (РД0) 0,53 0,46 0,92 0,53 0,38

Коэффициент точности поиска (Р) 0,94 0,953 0,904 0,945 0,961

Место (точность поиска) 5 3 6 4 1

Коэффициент поискового шума 0,056 0,046 0,095 0,054 0,038

Рейтинг (Д) 2,8 4,6 2,4 4,4 5,8

По результатам расчетов лучшей поисковой системой Интернет из исследуемых - является Yandex. В

Список используемой литературы:

3. Мировые информационные ресурсы[Текст]:Учебное пособие/ В.К.Иванов; под. ред .В. К.Иванова. -Тверь:Изд-во ин-та ТвГТУ, 2012. - 37с.: беспл. для студентов ин-та

Код ОГЭ по информатике: 2.4.1. Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов

Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.

Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.

Информационно-поисковые системы позволяют добавлять, удалять и изменять хранимую информацию. Существуют информационно-поисковые системы двух видов:

  • документальные (в результате поиска выдаётся документ);
  • справочные (в результате поиска информация предъявляется или сообщается).

Справочные ИПС, в свою очередь, делятся на:

  • фактографические (в результате поиска предъявляется искомая информация, факт);
  • адресные (в результате поиска предъявляется адрес, где информация хранится).

Документальные и фактографические ИПС. Документальными ИПС являются книжные фонды, открытые для доступа в читальных залах библиотек или в магазинах. Однотипные информационные объекты (книги) стоят на стеллажах чаще всего в порядке отраслей знаний (философия, математика, физика и т. п.). Читатель (покупатель), проходя вдоль стеллажей, ищет сначала названия отраслей знаний, а затем книги в разделах.

В словарях однотипные информационные объекты (слова и связанные с ними описания) расположены в алфавитном порядке, что существенно ускоряет поиск нужного слова или словосочетания. В энциклопедиях в аналогичном порядке расположены другие однотипные информационные объекты — статьи с описанием понятий. По такому же принципу организованы алфавитные книжки для записи телефонов и адресов, а также список учеников класса в классном журнале.

В другом порядке — хронологическом — организованы фактографические ИПС, которые называются расписаниями. Имеются в виду расписания занятий, расписания движения поездов, самолётов и т. п.

Адресные ИПС в документах. Адресные ИПС распространены гораздо шире документальных и фактографических. Каждый бумажный документ, исключая словари и энциклопедии, имеет собственную адресную ИПС в виде оглавления (содержания). В оглавлении записаны названия разделов документа и указаны их адреса — номера страниц, на которых эти названия находятся.

Поиск информации в документе состоит из трёх этапов:

  • поиск в оглавлении подходящего названия раздела с адресом (номером страницы);
  • поиск в документе страницы по адресу (номеру);
  • поиск информации в разделе.

Адресные ИПС в хранилищах информационных объектов. В хранилищах бумажных документов (библиотеках, архивах) создаются адресные ИПС, которые называются каталогами.

Традиционные каталоги содержат бумажные карточки с описаниями документов и их адресов в хранилище (номер хранилища, номер стеллажа и т. д.). Адрес документа в хранилище называется шифром. Аналогичным образом организуется хранение и адресация звуко-, кино- и видеозаписей.

Поиск информации в хранилище информационных объектов состоит также из трёх этапов:

  • поиск в каталоге карточки подходящего информационного объекта с адресом (шифром);
  • поиск в хранилище информационного объекта по адресу (шифру);
  • поиск информации в информационном объекте.

Оценка результатов поиска информации. Поиск информации в информационных объектах или в хранилищах информационных объектов редко бывает однократным. Результат поиска всегда оценивается с точки зрения полноты требуемой информации. Если информации недостаточно, поиск других источников информации проводят снова и снова, пока результат не станет удовлетворительным.

Поиск внутри компьютера

Для запуска процесса поиска в поле поиска вводят символы из имени файла или его содержимого. В области просмотра появляется список файлов и папок, которые отвечают запросу. В строке каждого файла указан реальный путь к нему.

Список с результатами поиска анализируется пользователем самостоятельно. Одно можно сказать точно: если файл на самом деле находится в компьютере, то его имя непременно окажется в списке результатов поиска.

Чтобы просмотреть файл в содержащей его папке, по строке файла щёлкают левой, потом правой клавишей мыши, а затем в контекстном меню щёлкают по пункту Расположение файла. В области просмотра открывается папка, содержащая файл.

Поиск в Интернете

Существует несколько сайтов, которые представляют в Интернете поисковые системы (поисковые машины), в том числе русскоязычные:


Поисковые системы представляют собой адресные информационно-поисковые системы. Они обычно включают два компонента:

  • базу рефератов электронных документов, которые размещены на серверах Интернета, вместе с гиперссылками на эти документы;
  • поисковый механизм, который позволяет автоматически по запросу найти информацию в этой базе данных (базе рефератов).

Процедура поиска информации. Для проведения автоматического поиска вводят текстовый запрос в поле поиска поисковой системы.


По умолчанию поисковые системы настроены на поиск в Интернете веб-страниц, которые содержат ключевые слова. Иногда требуется сузить область поиска, чтобы, например, найти новостную страницу или страницу-словарь, либо изменить объект поиска, чтобы, например, найти картинку, музыку, видео.


Для выбора объекта и области поиска поисковые системы в Интернете предлагают меню. После ввода данных щёлкают по кнопке Найти (или аналогичной). Через некоторое время окно браузера обновляется и в нём появляются результаты поиска в виде списка гиперссылок на документы. Этот список может содержать тысячи гиперссылок. По первой двадцатке списка всегда видно, точным ли был запрос. Иногда запрос следует уточнить и запустить поисковую систему ещё раз. В любом случае для получения ответа достаточно просмотреть первую сотню документов, обращаясь к ним с помощью гиперссылок из списка.

Поисковые каталоги. Многие поисковые системы на своих веб-страницах имеют поисковые каталоги, которые построены в виде меню, пунктами которого являются разделы каталога. Принцип построения поисковых каталогов аналогичен принципу построения дерева папок в компьютере. Выбор пункта каталога открывает новое меню, в котором также делают выбор. И так до тех пор, пока на экран не будет выведен список ссылок, входящих в конечный пункт каталога. В процессе поиска следует только правильно определяться с выбором пунктов каталога.

Сохранение информации из Интернета. Просмотр веб-страниц может сопровождаться сохранением информации с этих страниц.

Именно так в Интернете можно собрать информацию для подготовки реферата практически на любую тему.

Читайте также: