Информационные ресурсы интернет сравнительная характеристика по поиску информации кратко

Обновлено: 17.06.2024

Часто сталкиваюсь с тем, что дети не верят в то, что могут учиться и научиться, считают, что учиться очень трудно.

Лекция 07. Информационные ресурсы сети Интернет

В настоящее время интенсивно развивается Интернет - компьютерная сеть, охватывающая весь мир. В архивах свободного доступа сети Интернет можно найти информацию по всем сферам человеческой деятельности, начиная с новых научных открытий до прогноза погоды на завтра. Кроме того, Интернет предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру.

Пользователи Internet получают информацию в виде гипертекста, являющегося основным способом представления данных. Термин Гипертекст, применяемый в последнее время в сочетании с прилагательным мультимедийный, означает документ, содержащий текстовые, звуковые и изобразительные фрагменты. Особенностью такого документа является наличие выделенных ключевых слов, всякого рода кнопочек и иконок, щелчки по которым воспроизводят соответствующие фрагменты, которые могут и не входить в состав данного документа, а находиться в памяти другого компьютера. Выделенные поля, активизация которых вызывает отображение следующих кадров, представлены в гипертекстовом документе ссылками на соответствующий фрагмент в пределах файловой системы данного компьютера или адресами URL для вызова недостающих компонентов из сети. Идеи гипертекста в том или ином виде присутствуют в различных справочных системах, в частности в системе помощи Windows всех версий (Help-система). Для описания гипертекстовых документов в Internet используется специальный язык HTML - HyperText Markup Language. Таким образом, можно сказать, что гипертекст - это многостраничная информация различного вида, связанная в различных страницах многочисленными ссылками.

В настоящее время Internet не является отдельной сетью – на самом деле это сообщество сетей (именно поэтому Internet называют "сетью сетей"), в которое сейчас входит более 2 миллионов компьютеров во всем мире. И если вы подключены к сети, являющейся частью Internet, то вы имеете доступ к ресурсам любого из них.

Все программное обеспечение, которым можно пользоваться для работы в сети Интернет, можно поделить на две части. Это телекоммуникационные пакеты и абонентское программное обеспечение для работы в сети Интернет.

Телекоммуникационные пакеты используют для подключения к хосту сети, пользуясь обычными телефонными линиями. При этом пользователю предоставляется возможность работы на одном из хостов сети в режиме online, т.е. он может пользоваться всеми ресурсами узла сети так, как если бы он работал на его терминале.

Абонентское программное обеспечение обеспечивает обслуживание процессов получения и просмотра информации абонентом сети Интернет. Среди огромного количества программ этого назначения наиболее широко известны web-обозреватели Internet Explorer, Opera и Mozilla, пакеты обслуживания почты и новостей Eudora, службы Microsoft Outlook, Outlook Express и др.

Информационный ресурс — это данные в любом виде, которые можно многократно использовать для решения проблем пользователей. Например, это может быть файл, документ, веб-сайт, фотография, видеофрагмент. Для информационных ресурсов в Интернете характерно определённое время жизни и доступность более чем одному пользователю.

Также информационным ресурсом можно назвать отдельно взятый сайт, портал или несколько интернет-проектов. Информационный ресурс в Интернете может быть узкой (специализированной) направленности (например онлайновый словарь или сайт биржевых новостей), или общетематический.

Поиск информации в Интернете

Если ваш компьютер имеет подключение к Интернету и на нем установлена программа просмотра web-страниц – браузер (например, в операционной системе Windows стандартное приложение Интернет Explorer), то у вас есть возможность поиска информации в Интернете из любого места на компьютере. Такая возможность обеспечивается наличием в Интернете поисковых серверов.

Поисковыми серверами называют выделенные компьютеры, которые автоматически просматривают все ресурсы Интернета и индексируют их содержание.

3. Знак + между словами равносилен операции логического умножения: И (AND). Указав в запросе ключ , получим все документы, в которых имеются эти два слова одновременно, но они могут быть расположены в любом порядке и в разброс.

Нахождение информационных ресурсов в каталогах. В каталогах Интернета хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, а их администраторами. Занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге - работа по поиску и систематизации ссылок уже сделана за него.

Как правило, хорошие каталоги сети Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях.

Существуют также специализированные поисковые серверы:

1. Поиск E-mail, адресов и людей/компаний: Fourl I Directory, Lookup, Nynex Inreactive Yellov Pages for business, Phone Directory.

2. Поиск программного обеспечения: FTP Search, Snoopie, Jumbo.

3. Поиск в телеконференциях: DejaNews.

4. МЕТАПОИСК-универсальный метод поиска: SavvySearch, All-in-One Search Page, Metasearch, Searchers, Starting Pointmetasearch, W3 Search Engines.

На многих информационных серверах имеются ссылки на такие поисковые серверы.

Поиск информации на отдельном web-узле. Каждому пользователю Интернета часто приходится решать задачу поиска информации на отдельном web-узле. Если вы связываетесь с Интернетом через модем, то, очевидно, что чем больше вы тратите времени на поиски, тем дороже стоит получаемая информация. Следовательно, умение быстро разобраться в структуре узла и способах навигации (т.е. путей перемещения с одной web-страницы узла на другую) становится полезным навыком.

Для быстрого поиска информации на web-узле можно предложить следующие варианты:

а) путем начального задания адреса вручную в строке URL(Адрес) или выбора документа из списка истории браузера (программы просмотра web-страниц), если таковая уже накоплена;

б) по гипертекстовым ссылкам;

в) по каталогам узла с помощью обрезания строки ранее введенного адреса (URL), последовательно поднимаясь от каталога к каталогу вверх к корню сервера.

Один из самых эффективных способов ускорения работы с web-страницей - это активное использование средств автоматического поиска. Такой подход особенно практичен для многоэкранных страниц с информационных узлов, когда визуальное ознакомление с материалом становится слишком трудоемким. Поиск на странице можно произвести по терминам, введенным в специальный поисковый шаблон, который активизируется в браузерах клавишами Ctrl+F или через меню Правка-Поиск на этой странице или нечто подобное.

1. Поиск на web-странице всякий раз проводится вверх или вниз по странице в зависимости от указания направления в шаблоне, начиная с начала (если вниз) или с конца документа (если вверх), независимо от того, какая часть страницы отображается на экране на момент начала поиска.

2. Допустимо введение в шаблон не только единичного термина, но и фразы, что делается одной строкой без использования специального синтаксиса. Специальная пометка в шаблоне позволяет искать с учетом регистра символов.

3. Найденное слово или фраза выделяются в тексте, и происходит автоматическое перемещение к их местоположению, однако выделенное поле не всегда можно наблюдать.

4. Если при старте поиска уже есть выделенная область текста, то поиск начинается именно с нее в заданном в шаблоне направлении, само содержимое выделенного поля участия в поиске уже не принимает, так же как и оставшаяся часть страницы. Отметим, что всякий раз, когда поисковая процедура закончена, на странице остается выделенная область текста, соответствующая последнему совпадению. Если необходимо выполнить поиск с новыми терминами, то следует сначала снять уже существующее выделение кликом мыши в любой точке текста, иначе в новом поиске будет участвовать только часть страницы вверх или вниз от выделенной области в зависимости от направления, заданного в шаблоне.

5. Надписи, выполненные в графике, не откликаются на поисковые запросы.

Еще одно замечание сделаем относительно возможности еще до нажатия на гиперссылку отследить адрес (URL), по которому она осуществит переход. Когда указатель мыши встает на ссылку (без нажатия), то в строке состояния браузера появляется соответствующий адрес. Эту информацию можно использовать для предварительной оценки целесообразности такого перехода, она также полезна и в случае применения разработчиком специальной графической карты гипертекстовых ссылок (UsemapClientSide), когда отдельные фрагменты сомкнутой воедино картинки могут являться ссылками на различные ресурсы.

Глобальная сеть – очень подвижная система, которая постоянно меняется и по структуре, и по содержанию. Там, где сегодня Вы нашли массу интересной информации, завтра Вы ее можете не увидеть. Адреса сайтов могут со временем изменяться.

Путеводитель по интернет ресурсам (примеры информационных ресурсов сети Интернет):

Всегда не было ценности большей, чем информация. На каждом этапе развития накапливающийся опыт деятельности человека, фиксируется в виде информации. Настоящее время - это период, характеризующийся небывалым ростом объема информационных потоков. На дворе эра Интернета, скорость, с которой в нем распространяется информация, практически равна скорости света. Информация – является решающим фактором, определяющим развитие технологии и ресурсов в целом. Рыночные отношения предъявляют повышенные требования к своевременности, достоверности, полноте информации, без которой немыслима эффективная маркетинговая, финансово-кредитная, инвестиционная деятельность. Люди получают информацию через книги, средства массовой информации, но наиболее популярным информационным ресурсом на сегодняшний день является глобальная сеть Интернет.

Целью работы является изучение информационных ресурсов, их видов, характеристик, а также инструментов поиска.

Для достижения цели необходимо решить следующие задачи:

1. изучить понятие информационных ресурсов;

2. рассмотреть виды и характеристику информационных ресурсов;

3. ознакомиться с инструментами поиска.

В практической части курсовой работы будет решена задача по расчету доходов от сдачи помещений в аренду. Решение задачи будет производиться с использованием табличного процессора MS Excel 2010.

1. ИНФОРМАЦИОННЫЕ РЕСУРСЫ. вИДЫ, ХАРАКТЕРИСТИКА И ИНСТРУМЕНТЫ ПОИСКА

1.1. Понятие информационных ресурсов

В информационном обществе основой развития становится информационный ресурс, а также средства его обработки и доставки потребителю. В Федеральном законе "Об информации, информатизации и защите информации" предлагается определение информационных ресурсов следующего содержания: информационные ресурсы – это отдельные документы и отдельные массивы документов, документы и массивы в информационных системах (библиотеках, архивах, фондах, банках данных и других системах), созданные, приобретенные за счет средств федерального бюджета, бюджетов субъектов РФ. Иными словами информационные ресурсы общества – это сведения различного характера, материализованные в виде документов, баз данных и баз знаний.

Сегодня известны следующие государственные информационные ресурсы.

Контрольные функции по отношению ко всем государственным ресурсам осуществляют соответствующие министерства и ведомства. Информационные ресурсы служат исходным сырьем для создания информационных продуктов, под которыми понимается результат обработки информационного ресурса с помощью информационных технологий, используемый для целей управления (формирования решений). Он также фиксируется на материальных носителях (документах, базах данных и т.д.).

Формами существования информационных ресурсов могут быть: бумажные документы, электронные документы, базы данных, базы знаний, web-сайты, файлы различной природы (аудио, видео) и т.д. В сущности, информационные ресурсы – это общий объем данных и знаний, материализованных на каком-либо носителе.

Большинство населения получает информацию в традиционном виде - печатные издания, радио, телевидение. Но сегодня наиболее распространенным средством доступа к информационным ресурсам являются компьютерные сети, а самым прогрессивным способом получения информации выступает режим онлайн (online - интерактивный, диалоговый режим). Он предоставляет возможность пользователю, войдя в компьютерную сеть, получить доступ к "большому компьютеру" (Host - компьютеру, хосту) и к его информационным ресурсам в режиме прямого диалога, реализуемого в реальном времени.

1.2. Виды и характеристика информационных ресурсов

Все информационные ресурсы можно разделить на внутримашинные и внемашинные (рисунок 1).

Под внутримашинными информационными ресурсами понимаются информационные ресурсы, представленные в электронном виде и располагающиеся на рабочих станциях (компьютерах). К внемашинным, соответственно относится противоположная группа информационных ресурсов, т.е. это информационные ресурсы, которые представлены в бумажном или ином виде. Из рисунка 1 следует, что к внемашинным информационным ресурсам можно отнести различного рода бумажные документы, книги, а также средства массовой информации (телевидение, радио, журналы, газеты и т.д.).

Рассмотрим внутримашинные информационные ресурсы.

Все внутримашинные информационные ресурсы могут быть представлены как в структурированном виде, так и не в структурированном. Структурированные информационные ресурсы – упорядоченные информационные ресурсы, выстроенные в соответствии с какой-либо структурой. В структурированных информационных ресурсах облегчен поиск необходимой информации, что является большим достоинством данного вида информационных ресурсов.

Рисунок 1 – Структура информационных ресурсов

К структурированным информационным ресурсам относятся базы данных, хранилища данных и базы знаний.

База данных – это ориентированное на пользователя-непрограммиста множество взаимосвязанных данных, структурированных таким образом, что достигается их минимальная избыточность и максимальная независимость от прикладных программ. Минимальная избыточность означает, что данные в базе данных не должны дублироваться и противоречить друг другу. Максимальная независимость от прикладных программ предусматривает использование минимального количества дополнительного программного обеспечения при формировании и использовании базы данных.

Данные в базе находятся в памяти в соответствии с некоторой моделью. Наиболее распространенной моделью баз данных в настоящее время является реляционная модель.

Реляционная модель основывается на понятии “отношение”, и представляется совокупностью таблиц. Используя таблицы базы данных можно структурировать различные запросы на получение выборки данных, соответствующих заданным требованиям. На основании запросов и таблиц строятся отчеты.

Широкое применение баз данных не профессионалами-программистами стало возможным благодаря специально созданному программному комплексу – системам управления базами данных (СУБД). Появление СУБД избавило пользователей от знания значительного объема тонкостей, связанных с решением экономических задач. Наиболее популярной системой управления реляционными базами данных является программный продукт Microsoft Access.

Дальнейшее развитие баз данных привело к появлению хранилищ данных, назначение которых отлично от баз данных. Если последние предназначены для оперативного отражения ежедневных производственно-хозяйственных, финансовых и других операций предприятия, то хранилища данных необходимы для долговременного хранения данных в специально создаваемых многомерных информационных кубах. Информационные кубы предназначены исключительно для аналитической обработки данных и формирования решений. Сегодня хранилища данных становятся неотъемлемой частью средств, необходимых для принятия корпоративных и других решений. В хранилищах данных применяется технология аналитической обработки данных в режиме реального времени – OLAP.

Знания также как и данные являются информационным ресурсом и хранятся в компьютере в соответствии с разработанной моделью. В результате получают базу знаний. Работа с базами знаний – это одно из направлений искусственного интеллекта, целью которого является разработка инструментальных средств, позволяющих решать задачи, традиционно считающиеся интеллектуальными.

Так как любая модель, и в том числе модель представления знаний, формальна, поэтому могут создаваться программные средства для их обработки. Знания, как и прочие формы представления информации, устаревают или становятся ненужными, поэтому должна быть система управления ими. Система управления знаниями (СУЗ) это совокупность программных средств, обеспечивающих поиск, ввод, обработку, использование и корректировку знаний.

К неструктурированным внутримашинным ресурсам относятся web-сайты. Сайты – Интернет ресурс, посвященный какой-то фирме, организации, предприятию или др. Как правило, он знакомит пользователя с фирмой, направлениями и видом ее деятельности. Отражает различные справочные материалы, прайс-листы, условия поставки и т.д. Наряду с корпоративными сайтами, выделяют персональный и любительский, домашнюю страничку. Также существуют различные сервисы – группа сайтов, на которых можно воспользоваться разнообразными сервисными услугами: электронным почтовым ящиком, блогом, поиском, различными каталогами, словарями, справочниками, прогнозом погоды, курсами валют, телепрограммой. Примером такого сервиса являются: Яндекс, Рамблер и т.п.

Не смотря на то, что СМИ были включены во внемашинные информационные ресурсы, их также можно отнести к неструктурированным внутримашинным информационным ресурсам, а именно различного рода новостные и семантические сайты (или электронные версии СМИ). Их отличительной чертой является высокий уровень посещаемости (например, сайт НТВ, "Вести" и т.п.), быстрая смена информации, наличие видеоряда на сайте и т.д.

1.3 Инструменты поиска

Поиск информации или информационный поиск представляет один из основных информационных процессов. Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

По оценке специалистов в Интернете работает 30 и более миллионов пользователей.

Поиск необходимой информации в Интернете можно осуществлять различными способами:

· Поиск с помощью поисковых машин по ключевому слову;

· Поиск с помощью классификаторов поисковых машин;

· Каталоги и коллекции ссылок (более общие понятия);

· Рейтинги (самые популярные ресурсы);

· Несетевые способы (советы друзей, знакомых; реклама в печатных изданиях).

В начале поиска информации необходимо определить ее тип. Условно можно выделить 4 типа информации.

1 тип — общая (например: история Российской империи),

2 тип — менее общая (например: император Александр II),

3 тип — конкретная (например: реформы Александра II),

4 тип — более конкретная (например: отмена крепостного права).

В зависимости от типа информации определяются и пути поиска.

Информация 2 типа ищется подобно поиску для 1 типа, но с преимуществом поиска по каталогам и страницам ссылок.

Информация 3 типа — по ключевым словам, которые вводятся в строку поиска поисковых машин, каталогам, страницам ссылок

Информация 4 типа — по подробным данным, которые вводятся в строку поиска. Данные находятся согласно способам поиска изложенных для 2 и 3 типов.

Заходим в Яндекс — Наука и образование / Общественные науки / История. По описанию темы находим необходимый сайт.

Настоящими носителями информации о ресурсах, которыми располагает Интернет, являются поисковые машины и каталоги. Информационно-поисковые системы Интернета различаются, но принципу отбора информации, который в той или иной степени присутствует и в сканирующей программе поисковой машины, и в деятельности специалистов, производящих каталогизацию. Как правило, различают два основных показателя: пространственный масштаб системы и ее специализация.

Построение региональных и специализированных поисковых сервисов предполагает активную фильтрацию информации. Специализация поисковой системы на базе какого-либо профиля или тематики, будь то правовая направленность, поиск персоналий или файлов мультимедиа в формате МРЗ, может происходить как в глобальном, так и на локальном масштабе. Разумеется, систему проще построить и сопровождать на ограниченном пространстве обновляемых сайтов, что обычно и реализуется на практике.

Региональными поисковыми службами информация фильтруется в основном по имени домена верхнего уровня сервера, например by для Беларуси. ru - для России. Серьезный недостаток таких систем отсутствует учет большого количества ресурсов, размещаемых региональными авторами ресурсов непосредственно в домене com.

Учет региональных особенностей зачастую присутствует и в глобальных поисковых сервисах. Система Lycos, например, ранжирует ответы по региону запроса.

Интернету, исходя из его природы, сопутствует информационный хаос. И только современные средства автоматического индексирования документов способны, учитывая применяемые алгоритмы и возможности технических средств, найти в этом хаосе рациональное зерно. Применение же при поиске ресурсов без поиска по ключевым словам напоминает серфинг, а не серьезную работу с информацией.

2. ПРАКТИЧЕСКАЯ ЧАСТЬ

2.1. Постановка задачи

2.1.1. Цель решения задачи

Цель решения данной задачи состоит в отслеживании дохода от сдачи помещений в аренду для предотвращения появления убытков. На основании полученной информации, руководство организации может принимать решение по изменению, например, местоположения или площади некоторых помещений, которые приносят наименьший доход.

2.1.2. Условие задачи

Прайс-лист услуг

Стоимость услуги за 1м 2 , руб

Латинские буквы в таблице указывают на элементы соответствующих расчетных формул.

Условно-постоянной информацией (справочной) служат следующие реквизиты: наименование организации, общая площадь арендуемых помещений.

Наименование организации

Общая площадь арендуемых помещений, кв. м

В результате следует получить ведомость со следующими реквизитами: номер п/п, наименование организации, стоимость аренды помещений, оплата охраны объекта, уборка помещений, общая стоимость аренду и услуг. Информация выдается в следующем документе:

№ п/п

Наименование организации

Стоимость аренды помещений, руб.

Оплата охраны объекта, руб.

Уборка помещений, руб.

Общая стоимость аренды и услуг, руб.

Итого, стоимость аренды и услуг, руб

Кроме того, информацию, находящуюся в таблицах для анализа, необходимо представить в виде диаграмм.

В технологии необходимо использовать межтабличные связи для организации ввода и контроля исходных данных, а также для организации процесса расчета функции ВПР, ПРОСМОТР и др.

2.2. Компьютерная модель решения задачи - смотрите в файле!

ЗАКЛЮЧЕНИЕ

Таким образом, в курсовой работе было изучено понятие информационных ресурсов, рассмотрены их виды, представлена характеристика информационных ресурсов, а также исследованы инструменты поиска.

Согласно представленной выше информации можно сделать вывод, что информационные ресурсы являются основной становления и развития информационного общества. Информационные ресурсы могут существовать в различных формах: в виде бумажных документом, электронных документов, баз данных, баз знаний, web-сайтов, файлов различной природы (аудио, видео) и т.д. В сущности, информационные ресурсы – это общий объем данных и знаний, материализованных на каком-либо носителе.

Все информационные ресурсы можно разделить на внемашинные и внутримашинные. К внемашинным относятся средства массовой информации, бумажные документы, книги и т.д. К внутримашинным относятся информационные ресурсы, представленные в электронном виде и располагающиеся в памяти компьютера или компьютерной сети. Все внутримашинные информационные ресурсы в свою очередь подразделяются на структурированные и неструктурированные. Структурированные (базы данных, хранилища данных, базы знаний) являются наиболее удобными для поиска необходимой информации. К несруктурированным информационным ресурсам относятся различные web-сайты, в том числе официальные сайты средств массовой информации.

В практической части была решена задача расчета доходов от сдачи помещений в аренду.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы

Програмирование с использованием OpenGL

Краткая характеристика ресурсов интернета

Информационныересурсы Интернета - это вся совокупность информационных технологий и баз данных, которые доступны при помощи этих технологий. К их числу относятся, например:

• система телеконференций Usenet;

• система файловых архивов FTP (File Transfer Protocol);

• информационная сеть WWW;

• информационная система Gopher;

• информационная система WAIS (Wide Area Information Service);

• информационные ресурсы LISTSER V;

• справочные книги Х.500;

• справочная служба WHOIS;

• информационные ресурсыMailbase и TRICKLE;

• удаленный доступ к ресурсам Telnet.

Главный режим доступа к информационным ресурсам Интернета - on-line. Даже серверы электронной почты обмениваются информацией друг с другом в интерактивном режиме по протоколу SMTP (Simple Mail Transfer Protocol).

В отечественных условиях, несмотря на бурное развитие телекоммуникаций, основным средством доступа к Интернету является электронная почта.

Приведем краткую характеристику перечисленных выше ресурсов сети.

Электронная почта во многом похожа на обычную почтовую службу. Корреспонденция подготавливается пользователем на своем рабочем месте либо программой подготовки почты, либо просто обычным текстовым редактором. Программа подготовки почты вызывает текстовый редактор, который пользователь предпочитает всем остальным программам этого типа. Затем пользователь должен вызвать программу отправки почты (программа подготовки почты вызывает программу отправки автоматически). Стандартной программой отправки является sendmail, работающая как почтовый курьер, который доставляет обычную почту в отделение связи для дальнейшей рассылки. В Unix-системах sendmail сама является отделением связи. Она сортирует почту и рассылает ее адресатам. От пользователей персональных компьютеров, имеющих почтовые ящики на своих машинах и работающих с почтовыми серверами через коммутируемые телефонные линии, могут потребоваться дополнительные действия. Так, например, пользователи почтовой службы Relcom должны запускать программу UUCP (Unix-to-Unix Copy Protocol), которая осуществляет доставку почты на почтовый сервер.

Система файловых архивов FTP. Это огромное распределенное хранилище всевозможной информации, накопленной за последние 10-15 лет в сети. Любой пользователь может воспользоваться услугами анонимного доступа к этому хранилищу и скопировать интересующие его материалы. Объем программного обеспечения в архивах FTP составляет терабайты информации, и ни один пользователь или администратор сети просто физически не может обозреть эту информацию. Кроме программ в FTP-ap-хивах можно найти стандарты Интернета RFC, пресс-релизы, книги по различным отраслям знаний, главным образом по компьютерной проблематике, и многое другое. Практически любой архив строится как иерархия каталогов. Многие архивы дублируют информацию из других архивов (так называемые зеркала - mirrors). Для того чтобы получить нужную информацию, вовсе не обязательно ждать, пока информация будет передана из Авст ралии или Южной Африки, можно поискать "зеркало" где-нибудь ближе, например в Финляндии или Швеции. Для этой цели существует специальная программа Archive, которая позволяет просканировать FTP-архивы и найти тот, который устраивает пользователя по составу программного обеспечения и коммуникационным условиям.

Gopher. Это еще одна распределенная информационная система Интернета. В основу ее интерфейсов положена идея иерархических каталогов. Внешне Gopher выглядит как огромная файловая система, которая расположена на машинах сети. Первоначально Gopher задумывался как информационная система университета с информационными ресурсами факультетов, кафедр, общежитий и т.п. До сих пор основные информационные ресурсы системы сосредоточены в университетах. Gopher считается простой системой, легкой в установке и администрировании, достаточно надежной и защищенной. Количество серверов Gopher на 1994 г. превышало число серверов WWW в 1,5 раза, и до 1995 г. темпы роста установок серверов Gopher опережали все остальные ресурсы сети. В России Gopher-серверы не так распространены, как во всем мире; профессионалам больше нравится World Wide Web.

WAIS. Это распределенная информационно-поисковая система Интернета. WAIS разработана четырьмя ведущими американ скими компаниями, и первое время она была коммерческим продуктом, пока не появилась свободно распространяемая версия - free WAIS. В основу системы положен принцип поиска информации с использованием логических запросов, основанных на применении ключевых слов. Клиент "обшаривает" все серверы WAIS на предмет наличия на них документов, удовлетворяющих запросу. Система широко применяется как поисковая машина в других информационных сервисах Интернета, например в WWW и Gopher. Наиболее известным проектом, где была применена WAIS, является электронная версия энциклопедии "Бри-таника".

LISTSER V. Это, строго говоря, не сервис Интернета, а система почтовых списков BITNET. Однако это очень популярный ресурс в глобальных компьютерных сетях, и в Интернете существуют шлюзы для доступа к нему. LISTSER V специально ориентирован на применение в качестве транспорта электронной почты. Доступ к нему в интерактивном режиме затруднен. В мире насчитывается много сотен списков LISTSER V, которые организованы по группам интересов, например существуют группы разработчиков программ ядерно-физических расчетов EGS-4 или группы любителей научной фантастики. LISTSER V во многом пересекается с Usenet, однако это не мешает существованию как одной, так и другой системы.

Х.500. Это европейский стандарт для компьютерных справочных служб. Базы данных Х.500 содержат информацию о пользователях сети, их электронные и обычные адреса, идентификаторы и реальные имена, должности и места службы. Кроме того, хранится информация не только о физических лицах, но и об организациях. В последнем случае дается краткое описание основных направлений их деятельности.

WHOIS. Это служба, аналогичная по назначению системе Х.500, но являющаяся детищем Интернета. Работа с системой WHOIS несколько отличается от работы с Х.500 в силу ее организации. WHOIS - распределенная система, поэтому запросы отправляются по всему множеству серверов WHOIS в Интернет, если только не указан адрес конкретного сервера.

Mailbase. Это система, во многом повторяющая описанный выше ресурс LISTSER V.

TRICKLE. Это доступ по почте к архивам RTF, который организован через специальный шлюз. Этот шлюз имеет навигацион ные средства для поиска нужной информации в сети, пользователь может вести с ним своеобразный диалог по почте, выбирая нужную информацию путем ввода специальных команд TRICKLE.

Существуют и другие ресурсы, к которым можно получить доступ по почте.

Telnet - одна из самых старых информационных технологий Интернета. Она входит в число стандартов, которых насчитывается три десятка на полторы тысячи рекомендуемых официальных материалов сети, называемых RFC (Request For Comments).

Под telnet понимают триаду, состоящую из telnet-интерфейса пользователя, telnet-процесса и telnet-протокола. Эта триада обеспечивает описание и реализацию сетевого терминала для доступа к ресурсам удаленного компьютера.

В настоящее время существует достаточно большое количество программ - от Kermit до различного рода BBS (Bulletin Board System), которые позволяют работать в режиме удаленного терминала, но ни одна из них не может сравниться с telnet по степени проработанности деталей и концепции реализации.

Telnet как протокол описан в стандарте RFC-854 (май, 1983 г.). Его авторы Дж. Постел (J.Postel) и Дж. Рейнолдс (J. Reynolds) во введении к документу определили назначение telnet так: "Назначение telnet-протокола дать общее описание, насколько это только возможно, двунаправленного, восьмибитового взаимодействия, главной целью которого является обеспечение стандартного метода взаимодействия терминального устройства и терминал-ориентированного процесса. При этом протокол может быть использован и для организации взаимодействия "терминал-терминал" (связь) и “процесс-процесс” (распределенные вычисления)".

Telnet строится как протокол приложения над транспортным протоколом TCP. В основу telnet положены три фундаментальные идеи:

• концепция сетевого виртуального терминала NVT (Network Virtual Terminal);

• принцип договорных опций (согласование параметров взаимодействия);

• симметрия связи "терминал-процесс".

При установке telnet-соединения программа, работающая с реальным терминальным устройством, и процесс обслуживания этой программы используют для обмена информацией спецификацию представления правил функционирования терминального устройства КУТ. Спецификация N¥7 - это стандартное описание наиболее широко используемых возможностей реальных физических терминальных устройств, позволяющее преобразовать в стандартную форму способы отображения и ввода информации.

Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.

Многие пользователи поиска никогда не думали о принципах их работы, о способах обработки пользовательских запросов, о том, как построены и функционируют данные системы. Данный материал поможет людям, которые занимаются оптимизацией и продвижение своих сайтов, понять устройство и основные функции поисковых машин.

Функции и понятие ПС

Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.

Для того чтобы получить правильные ответы на подобные вопросы, разработчики поиска постоянно улучшают принципы ранжирования и его алгоритмы, добавляют им новые возможности и функции и любыми средствами пытаются сделать быстрее работу системы.

Основные характеристики поисковых систем

Полнота.

Точность.

Актуальность.

Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.

Скорость поиска.

Наглядность.

Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.

Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.

История развития поисковых систем

Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.

Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.

Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.

В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.

В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.

В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.

Доля поисковых систем

Google — 70,83 %;
Bing — 12,61 %;
Baidu — 11,83 %;
Yahoo! — 2,30 %;
Яндекс — 1,41 %;
DuckDuckGo — 0,42 %;

Принципы работы поисковой системы

Модуль индексирования.

Данный компонент состоит из трех программ-роботов:

Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.

Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.

Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.

Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.

Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.

База данных

База данных (или индекс поисковика) - комплекс хранения данных, массив информации в котором сохраняются определенным образом переделанные параметры каждого обработанного модулем индексации и скачанного документа.

Поисковый сервер

Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.

Читайте также: