Сообщение поисковый сервер aport

Обновлено: 30.06.2024

Апорт (Aport) — поисковая система, которая появилась одной из первых.

В ноябре 1998 года Aport был продан Джозефу Авчуку, жителю Израиля. В 1999 году Авчук переименовывает каталог в AtRus. Это привело к тому, что пользователям стали доступны более широкие возможности для поиска. Результаты поиска стало возможно систематизировать по рубрикам, представленным в каталоге, а значит, ускорялся сам процесс поиска.

Для поиска информации в данной системе можно воспользоваться специальными операторами:

" - кавычки позволяют находить словосочетание, указанное в них, или близкое к нему. Пример: по запросу "яблоки на снегу" будут найдены документы, содержащие следующие фрагменты: "яблоки на снегу", "яблоки и снег", "яблокам под снегом", "яблоко снег" и т.п.

сл2(. ) - Данный оператор позволяет ограничить расстояния в словах (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах 5 слов, то надо написать: сл5(университет студент зачет). При этом будут найдены документы, где между словами "университет", "студент" и "зачет" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5).

и - оператор И подразумевает, что его можно опускать: запрос поисковая система полностью эквивалентен запросу поисковая И система. И в первом и во втором случае будут найдены документы, содержащие оба слова.

или - данный оператор позволяет искать документы, содержащие хотя бы одно из заданных в поиске слов. По запросу поисковая ИЛИ система будут найдены документы, содержащие любое из указанных слов или оба слова одновременно.

не - оператор логическое НЕ ограничивает поиск документами, не содержащими слово, указанное после оператора. По запросу звери НЕ группа будут найдены документы, содержащие слово "звери", но не содержащие слово "группа".

()- с помощью этого оператора, по запросу быстрая ИЛИ качественная покраска будут выданы документы, содержащие либо слово "быстрая", либо одновременно слова "качественная" и "покраска". По запросу (быстрая ИЛИ качественная) покраска будут выданы документы, где встречаются одновременно слова "быстрая" "покраска", либо "качественная" и "покраска".

  • операторы осуществляющие поиск по определенным полям

title= - указанное после равенства слово или словосочетания в круглых скобках будут искаться в заголовках документов. По запросу title=(фрукты или овощи) будут найдены документы, содержащие в заголовке слово фрукты или слово овощи, или оба слова одновременно.

keywords= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в поле META KEYWORDS документов. По запросу keywords(фрукты и овощи) будут найдены документы, для которых автор в ключевых словах указал оба слова: фрукты и овощи.

alt= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в полях ALT (комментарии к картинкам). По запросу alt(Дмитрий Медведев) будут найдены документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Дмитрий и Медведев.

anchor= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в тексте ссылок. По запросу anchor(ненавижу эмо) будут найдены документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и эмо.

Апорт является русскоязычной поисковой системой по российскому Интернету. Апорт - полнотекстовая поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа , ключевые слова , описания страниц и подписи к картинкам . Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами. Ключевые слова не имеют определяющего значения при определении релевантности документа. Разумное использование этого тега рекомендуется и может поднять ваш сайт в результатах поиска по соответствующим словам, однако, не следует думать, что именно на него Апорт обращает внимание в первую очередь. Следует также отметить, что Апорт не индексирует документы, в Url которых встречается символ "?".

4. Социология в Сети

После краткого описания браузера и основных русских поисковых систем, видимо следует рассказать о непосредственном предмете моей контрольно–курсовой работы – сетевых ресурсах по социологии.

Собственно информации по социологии в Интернете очень много. Российскими социологами уже сделаны первые шаги по долгой дороге освоения всемирной Web-сети. В настоящее время более 100 российских социологических организаций имеют свои сайты и они постепенно начинают использовать их для представления результатов своих исследований. Условно всю информацию можно разделить на два типа: теоретический уровень и, так называемые, конкретные социологические исследования (КСИ).

Первый тип предназначен скорее для тех пользователей, кто связан непосредственно с наукой и, следовательно, часто пользуется теоретическим материалом. К таким людям можно отнести научных работников, преподавателей, студентов и школьников. Что касается КСИ, то данная информация может быть интересна не только специалистам, но и всем интересующимся социологическими исследованиями. На сайтах с результатами конкретных социологических исследований любой желающий может легко найти информацию обо всех опросах и социологических исследованиях, проведённых либо компаниями-владельцами сайтов, либо компаниями, предоставившими эту информацию. К сайтам, относящимся к последним, можно отнести интернет-странички самых разнообразных газет, журналов, телеканалов, различных интернет-изданий, которые, как известно, часто используют подобную информацию или, даже, сами заказывают проведение исследований.

Кроме того в отдельный ряд можно поставить сайты социологических журналов, на страницах которых профессиональные социологи обсуждают проблемы современной социологии, публикуются статьи по многим животрепещущим для социологии вопросам.

4.1 Сайты социологических организаций и проектов

Естественно, что наибольшее количество сайтов и к тому же наиболее информативных принадлежит столичным структурам (где-то около 70 московских сайтов). Поскольку все их интернетовские адреса опубликованы на сайте РСИО, я остановлюсь на описании наиболее содержательных сайтов.

В целом, именно эти пять указанных исследовательских организаций создают основной массив социологической информации о состоянии общественного сознания и некоторых элементах политического и экономического поведения, который расположен в российской части Интернета. Поскольку их же информация активно тиражируется основными телевизионными каналами и прессой, а также используется ведущими политологами и макроэкономистами, постольку можно утверждать, что Рунет уже сегодня стал достаточно репрезентативным источником указанного вида социальной информации.

Более десяти московских социологических сайтов принадлежат не организациям, а семинарам или проектам. Это перспективная форма научной коммуникации, по-видимому, уже в ближайшие годы получит достаточно широкое распространение. Вот несколько сайтов подобного типа.

Две другие образовательные структуры это Европейский университет в Санкт-Петербурге, в состав которого входит факультет политических наук и социологии

Вторая группа объединяет сайты пяти независимых организаций, специализирующихся в области прикладных социологических исследований. Направления деятельности четырех организаций - Gallup Ltd. Петербург:

Последняя группа объединяет три индивидуальных сайта. Первый - принадлежит Л. Семашко и вводит в суть развиваемой им тетрарной социологии


История поисковой машины Апорт

Для кого-то это рядовое событие, но ведь Aport был пионером в рунете и имел все шансы занять место Яндекса на небосклоне. Не сложилось, как и у Рамблера, но вот такой печальный финал выглядит для меня несколько неожиданным. Думаю, что многие начинали свой путь в большом интернете, используя в числе прочих поисковиков и этот, поэтому я и решил написать небольшой реквием по этому случаю.

Правда на текущий момент сайт Апорта успел благополучно вылететь из каталога Яндекса, а значит значение Тиц может быть существенно подкорректировано в ближайшем будущем:


Есть некоторые расхождения в дате рождения поисковой системы Aport, но судя по знакам копирайта (©Copyright) на ранних версиях сайта, можно сказать, что это 1996 год. Т.е. он является ровесником компании Яндекс и немного старше поисковика Гугл. В начале двухтысячных годов проект был полностью поглощен компанией Golden Telecom и в знаке копирайта дата изменилась на чуть более раннюю.

Пик инновационных внедрений пришелся на 2000 года, когда он и был куплен Golden Telecom. Однако после этого пузырь доткомов лопнул и новый владелец решил не вкладываться в дальнейшие разработки. Наверное, именно это и привело когда-то очень перспективную поисковую систему к забвению и полному краху всех надежд.

Как хорошо, что существует возможность посмотреть изменение внешнего вида сайта в динамике по мере его развития. Я говорю о такой штуке, как интернетовская машина времени, о возможностях которой писал в статье про Webarchive (архив сайтов в интернет).


Классный вид и, по-моему, стоило остановиться именно на нем. В самом верху есть даже такой фетиш, как переключение кодировки русского языка. Однако, в дальнейшем дизайн Апорта будет кардинально меняться практически ежегодно, что, наверное, не есть хорошо.

Кстати, именно в 1998 владельцем этой поисковой системы стал один израильский инвестор, который через пару лет смог ее продать в пятьсот раз дороже уплаченной им самим суммы (почему я так не умею). После этого она выглядела уже не так привлекательно:


Наверное, и сами разработчики это поняли, и спустя некоторое время выкатили дизайн нового тысячелетия (2000 года):


Именно летом 2000 компания Aport была приобретена холдингом Golden Telecom за довольно большие деньги (двадцать пять лямов зелени), что, в общем-то, было обусловлено тем, что в то время как раз был пик так называемого бума доткомов (необоснованного роста рыночной стоимости интернет-компаний).

Пузырь, кстати, лопнул именно в середине 2000 года, что, наверное, сильно подорвало активы Golden Telecom (и обрадовало израильского инвестора, который так вовремя избавился от собственности).

Лично я стал приобщаться ко всемирной паутине лишь в 2001 и тогда Апорт был одним из тех поисковиков, которыми я по-началу пользовался. Собственно, в рунете выбирать можно было лишь между Яндексом, поиском Рамблера и, собственно, героем сегодняшней статьи.

Гугл к тому времени еще не обращал особого внимания на русскоязычный сегмент сети. В итоге я прочно пришвартовался к зеркалу рунета, и даже текущая высокая популярность Google поиска не может серьезно поколебать сделанный мной тогда выбор. На самом деле, у них не там уж и много различий, что хорошо видно из моих статей про то, как я ищу в Яндексе и как пытаюсь гуглить.

Поисковая же система Апорт еще несколько раз за это время успела поменять дизайн главной страницы своего сайта:


Спустя всего год владельцы решили кардинально сменить цветовую гамму. Бедные пользователи — каждый раз привыкать к новым рюшечкам:


В 2003 разработчики опять решили вернуться к синей гамме:


А в 2004 ее немножко развить:


Однако, такая чехарда с изменением внешнего вида не очень-то пагубно отразилась на популярности данного поисковика в интернете. Даже, наоборот. Только подумайте, в свой лучший год (2005) Апорт достиг суточной посещаемости в десятки миллионов человек. Огромное количество и огромные деньги, которые владельцы зарабатывали на рекламе (помните я писал про то, как заработать деньги в сети интернет без вложений).

После этого дизайн главной страницы у них менялся лишь дважды. В 2007 году:



Несмотря на довольно удачный последний вариант, популярность этой поисковой системы продолжала падать и, как я уже упоминал, в 2011 году Апорт перешел на движок Яндекса, а к текущему времени остался доступен лишь на поддомене.


Если бы можно было аппроксимировать линию слева до 2005 года, то глубина падения была бы, конечно же, еще более впечатляющей.

Очень жаль, что приходится говорить в прошедшем времени про еще одну поисковую систему, которая когда-то могла бы стать конкурентом даже Яндексу (стартовали-то они с Апортом вместе), но не стала.

Однако, это дало мне еще один повод поностальгировать по ушедшим временам диал-ап соединений с интернетом (когда он появился в моей жизни и занял там прочное место), сидению по ночам, с целью экономии бюджета, и из-за этого гораздо более ярким впечатлениям от путешествий по сети. Сейчас паутина WWW уже стала обыденностью и нет былой романтики.

Комментарии и отзывы (13)

Настольгическая тема. А почему бы и нет? Да Дмитрий вы пишите быстрей чем кто-либо в вашей отрасли бумаготворческого хозяйства блоговедов. Вы ваще крутой!

Приятная статейка. Были времена. Ночные посиделки в инете, постоянные перезвоны, чат Бизар.

Нужно было в те времена начинать что-то грандиозное в инете.

С Рамблером произойдет то же, возможно

Спасибо за статью! Действительно, грустновато за Апорт. Интересно, что именно послужило причиной краха — недальновидное, неопытное руководство? Нехватка средств.

Дуже шкода. Чим більше якісних пошукових систем — тим краще. Було б.

Дмитрий, исправьте очепятку — понастольгировать (ностальгия), режет глаз.

Cairns: спасибо, исправил.

Жалко. 10 лет назад я его отмечал для себя как самый точный, интеллегентный и интеллектуальный поисковик. Не было у него тогда той беспардонной всеядности, которой отличаются современные.

Жаль, очень жаль(

Печальная статейка. Настроение передано очень верно. Эх.

Да хорошие были времена 2000—2004. зря они это сделали, поисковиком и почтой всегда там пользовался. komputers-best

Оглавление
Файлы: 1 файл

поисковая система Апорт.doc

Государственное Образовательное Учреждение Высшего Профессионального Образования

Кафедра ВЫСШЕЙ МАТЕМАТИКИ И ИНФОРМАТИКИ

Шифр специальности

ВЭУзе - 2010д – 006

Контрольная работа

на тему: Поисковая система Апорт

Студент(ка) 1 курса

Факультета Экономика и управление на предприятии (торговли)

Меркулова Лариса Владимировна

Старший преподаватель ВМИ

Журавлев Дмитрий Владимирович

Волгоград 2011
Содержание

Word-Wide Web - это самый популярный сервис Сети и удобный способ работы с информацией.

Поисковые cистемы обычно состоят из трех компонент:

  • агент (паук или кроулер), который перемещается по Сети и собирает информацию;
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы.

  • Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.
  • Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.
  • Кроулеры просматривают заголовки и возращают только первую ссылку.
  • Роботы могут быть запрограммированы так, чтобы переходить по различным cсылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети. Однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

Агенты извлекают и индексируют различные виды информации. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована.

Агенты могут также перемещаться по Интернет и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных.

Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.

База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие:

  1. Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).
  2. Тэги, в которых эти слова располагаются.
  3. Местоположение искомых слов в документе.
  4. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде AltaVista, HotBot).

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой.

Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

Создателем поисковой системы Апорт является компания "Агама" - разработчик программного обеспечения для платформ Windows. Надо отметить, что Апорт создавался и продолжает работать под управлением ОС Windows (в отличие от большинства поисковых систем). Лингвистические разработки "Агамы" использовались при создании поисковой машины Апорт, в которой на момент ее создания, учитывалась морфология слов и по желанию клиента выполнялась проверка орфографии запроса.

К моменту официальной презентации, 11 ноября 1997 года, в поисковой системе Апорт был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов. К важным свойствам первой версии поисковой системы Апорт можно отнести перевод запроса и ответа на английский язык и обратно и реконструкция проиндексированных страниц из собственной базы, которое дает возможность просмотра уже несуществующих страниц.

В ноябре 1998 года Aport был продан гражданину Израиля Джозефу Авчуку (сумма сделки составила 55 тысяч долларов). В 1999 году Авчук окончательно покупает каталог и переименовывает его в AtRus.

В октябре 1999 года на компьютерных выставках по обе стороны океана была представлена принципиально новая поисковая система "Апорт 2000", полностью интегрированная с AtRus (ныне "Каталог-Апорт").

31 июля 2000 года Golden Telecom купил несколько интернет-проектов “Агама”, включающее Апорт и AtRus, для включения в “Россию-он-лайн”. В мае 2001 года окончательно завершилась сделка по смене хозяина "Апорт" самого "Golden Telecom", новым владельцем стал "Альфа-Банк". NASDAQ к тому времени переживал бурный спад и шансов перепродать Интернет проекты за приемлемую сумму не было. Это обусловило решение новых хозяев "Golden Telecom" минимизировать расходы на поддержку дорогостоящих Интернет проектов.

Еще одна особенность - приоритет сайтам, вошедшим в высшую и элитную лиги Апорт – Каталог. В поисковой системе Aport впервые была реализована возможность поиска по новостным лентам, также он первым стал использовать платную нулевую строку в выдаче. Масштабируемость в Aport 2000 построена так, что его поисковую базу можно дробить на несколько отдельных фрагментов, каждый из которых будет работать на своем компьютере. После поиска по фрагментам для пользователя рассчитывается общий ответ.

Читайте также: