Что такое информационный поиск кратко

Обновлено: 01.07.2024

Информационный поиск (ИП) (английский термин Information retrieval) — наука о информации. В частности это относится к поиску информации в документах, поиск самих документов, извлечению метаданных из документов, гипертекстовых базах данных таких, как Интернет и локальные когнитивной психологии, информатики, лингвистики, библиотечного дела.


Говоря о системах ИП, употребляют термины запрос и объект запроса.

Сначала системы автоматизированного ИП, или информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются Яндекс, Рамблер.

В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является Министерством обороны США совместно с Институтом Стандартов и Технологий ( Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

Оценки эффективности

Существует много способов оценить насколько хорошо документы, найденные ИПС, соответствуют запросу. К сожалению, понятие степени соответствия запроса, или другими словами релевантности, является субъективным понятием, а степень соответствия зависит от конкретного человека, оценивающего результаты выполнения запроса.

Точность (precision)

Отношение числа релевантных документов, найденных ИПС, к общему числу документов найденных ИПС:

<\displaystyle <\mbox<Precision></p>
<p>>=\cap \ D_|><|D_|>>>
,

<\displaystyle D_<rel></p>
<p>где >
— это множество релевантных документов в базе, а >" width="" height="" />
— множество документов, найденных системой.

Полнота (recall)

Отношение числа найденных релевантных документов, к общему числу релевантных документов в базе:

<\displaystyle <\mbox<Recall></p>
<p>>=\cap \ D_|><|D_<rel>|>>>
,

<\displaystyle D_<rel></p>
<p>где >
— это множество релевантных документов в базе, а >" width="" height="" />
— множество документов, найденных системой.

Выпадение (fall-out)

Выпадение характеризует вероятность нахождения нерелевантного ресурса и определяется, как отношение числа найденных нерелевантных документов к общему числу нерелевантных документов в базе:

<\displaystyle <\mbox<Fall-out></p>
<p>>=\cap \ D_|><|D_<nrel>|>>>
,

<\displaystyle D_<nrel></p>
<p>где >
— это множество нерелевантных документов в базе, а >" width="" height="" />
— множество документов, найденных системой.

F-мера (F-measure)

Традиционно F-мера определяется, как гармоническое среднее точности и полноты:

<\displaystyle F=2\times \mathrm </p>
<p> \times \mathrm /(\mathrm +\mathrm ).\,>

<\displaystyle F_<1></p>
<p>Часто ее также называют >
мерой, потому что точность и полнота присутствуют в этой формуле с одинаковым весом.

Более общая формула для положительного вещественного α имеет вид:

<\displaystyle F_<\alpha ></p>
<p>=(1+\alpha )\times \mathrm \times \mathrm /(\alpha \times \mathrm +\mathrm ).\,>

Информационный поиск (ИП) (англ. Information retrieval) — наука о поиске неструктурированной документальной информации. Особенно это относится к поиску информации в документах, поиск самих документов, добывания метаданных из документов, поиска текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет. Информационный поиск — большая междисциплинарная область науки, которая стоит на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, библиотечного дела, и статистики.

Объектом информационного поиска является текстовая информация, изображения, аудио, видео информация.

С информационным поиском смыкаются проблемы:

  • рассылки информации (information routing)
  • сортировка информации (information filtering)
  • упорядочения (классификация) информации (information categorization)
  • отбор информации (information extraction).

Для информационного поиска разрабатывают:

  • алгоритмы информационного поиска (retrieval algorithms)
  • подходы информационного поиска (retrieval approaches)
  • стратегии информационного поиска (retrieval strategies).

Для его осуществления создают:

  • методы информационного поиска (retrieval utilities)
  • средства информационного поиска (information retrieval systems)
  • компьютерные поисковые программы (search engines).

К проблемам информационного поиска относятся вопросы:

  • представления данных, информации, знаний (data, information, knowledge)
  • представление информации в современных информационных хранилищах (representation of information)
  • многоязычный информационный поиск (cross-language information retrieval)
  • одновременный информационный поиск (parallel information retrieval)
  • распределенный информационный поиск (distributed information retrieval)
  • общественный информационный поиск (social information retrieval)

Направление информационный поиск относят к проблемам:

  • применимой (прикладной) лингвистики (applied linguistics)
  • обработки естественного языка (natural language processing)

Задачей информационного поиска является нахождение соответствующих (поисковому запросу) информационных объектов, или документов среди возможностью поиска материала. Задача для информационного поиска задается в виде информационного запроса (query), который может содержать слова, фразы или предложения или комбинацию их. Подавляющее большинство поисковых систем ориентирована на работу с поисковыми терминами — словами или словосочетаниями, которые поисковая система распознает как одно целое. Для осуществления информационного поиска нужно иметь сборник информационных объектов (библиотека, компьютерные файлы) и систему (алгоритм или программу), которая осуществляет поиск. Для осуществления информационного поиска пользователь (человек или информационная система) формирует информационный запрос (information query). Результатом поисковой работы есть список документов который заключается согласно определенному принципу. Такой список называют упорядоченным (ranked list, ranked results).

Поисковая система просматривает все доступные информационные единицы (документы) из сборника и отбирает документы соответствующие информационного запроса. Поскольку реальные поисковые системы находят не все соответствующие документы, говорят о точности поисковых систем (system accuracy). Результатом работы поисковой системы есть список отобранных документов (retrieved documents list), среди которых есть соответствующие запросу документы (relevant documents). Для идеальной поисковой системы список отобранных документов и соответствующих документов должны совпадать. В реальных поисковых системах в списках отобранных документов находятся и несоответствующие к запросу документы. Поэтому говорят об эффективности поисковых систем. Эффективность поисковых систем оценивается двумя параметрами: поисковая соответствие (precision) и поисковая качество (recall). Поисковая соответствие определяет долю соответствующих документов среди отобранных на запрос. Поисковая соответствие определяет качество полученного результата информационного поиска. Поисковая качество определяет долю полученных системой соответствующих запросу документов среди общего числа соответствующих запросу документов в сборнике. Общее число соответствующих запросу документов всегда неизвестен и может быть установлено только при полном просмотре сборки человеком. Кроме того работу поисковых систем оценивают быстродействием — время, за которое получают список соответствующих запросу документов.

Информационный поиск — большая междисциплинарная область науки, которая стоит на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, библиотечного дела, и статистики.

Стратегии информационного поиска

Стратегии информационного поиска разрабатываются не только для определения соответствия, но и для решения проблем, связанных с неоднозначностью языка — один и тот же срок может обозначать различные концепты (ключ в механике означает совсем не то, что в шифровании), один и тот же концепт может сказываться различными терминами (областной центр Львовской области называется Львов и Город Льва).

Стратегия информационного поиска алгоритм, который, просматривая набор документов (Д1, …, Дn), устанавливает их соответствие поискового запроса (ПО). Поскольку поисковый термин встречается в документах разное количество раз, можно говорить о разной степени соответствия поисковому запросу. Этот алгоритм вычисляет коэффициент соответствия (similarity coefficient) (КВ) для каждого документа КВ (ПО, Ди), где 1 ≤ i ≤ n.

Информационный поиск с помощью векторно-пространственного представления

Поисковый запрос и документы представляются в виде пространственных векторов Поисковая система отбирает документы, пространственные векторы которых подобные пространственного вектора поискового запроса. В основе векторно-пространственного представления документа лежит предположение, что содержание документа передается словами, в нем находятся. Пространственно-векторное представление строится для поискового запроса и для каждого документа. Пространственно-векторное представление документа — это вектор в n-мерном пространстве. N-мерное пространство это пространство, каждое измерение которого соответствует поисковому срока. Координаты конца вектора численно определяются тем, сколько раз поисковый термин встречается в документе. То есть каждый компонент вектора соответствует числу появления соответствующего срока в документе. Поисковая система вычисляет коэффициент соответствия (КВ) пространственно векторного представления документа в пространственно-векторного представления поискового запроса. Фактически поисковая система вычисляет угол между этими векторами. Наиболее подходящими являются документы, пространственно-векторное представление которых направлено туда же куда и в представления поискового запроса.

G. Salton, A. Wong, and CS Yang (1975), A vector space model for automatic indexing "Communications of the ACM", vol. 18 nr. 11 pages 613-620. "(The article in which the vector space model was first presented)"

Вероятностный поиск

Коэффициент соответствия документа поисковому запросу определяется на основе вероятности того, что документ соответствующим поисковому запросу. Присутствие или отсутствие поискового термина в документе используется для определения вероятности того, что документ соответствует информационном запросу. Определение вероятности базируется на предыдущих статистических данных о том, насколько вероятно, что документ, который содержит поисковый термин A, отвечать поисковому запросу, содержащему срок A. Предполагая, что условия поиска в поисковом запросе независимые, можно вычислять такую ​​вероятность для каждого поискового срока с поискового запроса. Общая вероятность соответствия документа вычисляется как произведение вероятностей соответствия каждого срока. Независимость поисковых терминов в поисковом запросе редко наблюдается в действительности, поэтому вычисления суммарной соответствии значительно усложняется, что увеличивает время информационного поиска. Кроме того, необходимо иметь предварительные данные о вхождении сроков в соответствующие запросу документы а также и в неподходящие к запросу документы.

Maron, ME, & Kuhns, JL (1960). On relevance, probabilistic indexing and information retrieval. Journal of the ACM, 7 (3), 216-244.

Поиск с использованием языковых моделей

Языковые модели используются для предсказания появления того или иного слова в тексте. В информационном поиске используются статистические языковые модели для предсказания появится нужное слово (поисковый термин) в документе. Для каждого документа из сборника исчисляется вероятность появления в документе поисковых терминов. Согласно этому документу упорядочиваются в поисковом списке. Еще один подход предлагает построение вероятностной модели пошуковго запроса. То есть строится вероятностная модель появления тех или иных поисковых терминов в запросе Далее строится вероятностная модель запроса как совокупности независимых событий, где каждое событие — это появление того или иного срока в поисковом запросе. В этой модели мы можем учесть даже вероятности неявки определенных сроков.

Ponte, Jay M., and Croft, W. Bruce. A language modeling approach to information retrieval. In Proc. SIGIR, 1998.- pp. 275-281. ACM Press.

Алгоритмы принятия решений

Алгоритмы принятия решений используются для определения вероятности того, что документ будет соответствующим поискового запроса. Алгоритмы принятия решений применяются как дополнение к вероятностного поиска, для получения дополнительных доказательств того, что документ может соответствовать поисковому запросу. Метод основан на виокристанни известных зависимостей для построения неизвестных. Это позволяет кардинально снизить объем вычислений, которые необходимы для определения вероятности того или иного события.

Greiff Warren R., Croft B., Turtle H. PIC matrices: a computationally tractable class of probabilistic query operators. ACM Transactions on Information Systems (TOIS) Volume 17 Issue 4 (October 1999) p. 367 — 405

Расширенный Булев поиск

Обычный Булев поиск не имеет ничего общего с степенью соответствия документа поисковому запросу, и, соответственно, с составлением документов согласно этой соответствием. Документы или удовлетворяют информационный запрос, или нет. Те документы, которые удовлетворяют логический запрос попадают в список по очереди. Идея расширенного Булевого поиска заключается в создании возможностей для определения степени соответствия документов поисковому запросу. Это достигается за счет присвоения веса поисковым терминам. Вес сроков учитывается при построении списка соответствия документов к информационному запросу.

Fox Edward A., Salton G., Wu H. Extended Boolean information retrieval. Commun. of the ACM, Volume 26 Issue 11 (November 1983) г. 1 022 — 1036

Поиск по скрытым семантическим индексированием

Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman. Indexing by latent semantic analysis. Journal of the American Society for Information Science (1990)

Поиск с использованием нейро-сетей

Kwok KL A neural network for probabilistic information retrieval. ACM SIGIR Forum, Volume 23 (June 1989)

Поиск с использованием алгоритмов развития

Путем эволюции можно изменить начальный поисковый запрос. Первоначальный запрос используется с равноправными сроками, или со сроками, имеющих разный вес. Сгенерированный поисковый запрос остается, если он охватывает известные видпоивдни к исходному запросу документы, если нет — отвергается.

Hsinchun Chen Machine learning for information retrieval: Neural networks, symbolic learning, and genetic algorithms. Journal of the American Society for Information Science. Volume 46 Issue 3, Pages 194 — 216

Поиск с использованием нечетких множеств

Документ превращается в нечеткое множество (это множество, содержащее не только сам элемент но и число, показывающее степень принадлежности элемента множеству). Далее для каждого документа проведенного предварительно Булевого поиска добавляется информация получена из операций объединения, пересечения, комплементарности нечетких множеств, которая говорит о степени соответствия каждого документа поисковому запросу. Степень соответствия используется как коэффициент соответствия.

Основные понятия информационного поиска. Релевантность, пертинентность и их отличие.

Информационный поиск (ИП) (англ. Information retrieval) — процесс поиска неструктурированной документальной информации и наука об этом поиске.

История

Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Google, Яндекс и Рамблер.

Информационный поиск как процесс

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.

В общем случае поиск информации состоит из четырех этапов:

  • определение (уточнение) информационной потребности и формулировка информационного запроса;
  • определение совокупности возможных держателей информационных массивов (источников);
  • извлечение информации из выявленных информационных массивов;
  • ознакомление с полученной информацией и оценка результатов поиска.

Виды поиска

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

  • Xcavator
  • Retrievr
  • PolarRose
  • Picollator Online by Recogmission

Методы поиска

Адресный поиск

Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:

  1. Наличие у документа точного адреса
  2. Обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы.

Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.

Семантический поиск

Процесс поиска документов по их содержанию.
Условия:

  • Перевод содержания документов и запросов с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса.
  • Составление поискового описания, в котором указывается дополнительное условие поиска.

Принципиальная разница между адресным и семантическим поисками состоит в том, что при адресном поиске документ рассматривается как объект с точки зрения формы, а при семантическом поиске - с точки зрения содержания.
При семантическом поиске находится множество документов без указания адресов.
В этом принципиальное отличие каталогов и картотек.
Библиотека - собрание библиографических записей без указания адресов.

Документальный поиск

Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.

Два вида документального поиска:

  1. Библиотечный, направленный на нахождение первичных документов.
  2. Библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей.

Фактографический поиск

Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.

Различают два вида:

  1. Документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты.
  2. Фактологический (описание фактов), предпологающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации.

Информационный поиск как наука

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.

ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.

Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.

В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является TREC, организованной в 1992 Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.

Запрос и объект запроса

Говоря о системах ИП, употребляют термины запрос и объект запроса.

Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.

Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.

Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;
  • Классификация документов;
  • Фильтрация документов;
  • Кластеризация документов;
  • Проектирование архитектур поисковых систем и пользовательских интерфейсов
  • Извлечение информации, в частности аннотирования и реферирования документов;
  • Языки запросов и др.

Пертине́нтность (англ. pertinent ) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent ) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя

Изначально автоматизированный информационный поиск (имеются в виду информационно-поисковые системы) применялся с целью поиска научных данных и соответствующей литературы, и использовался он университетами и публичными библиотеками. Однако с появлением и развитием сети Интернет информационный поиск получил широкое распространение.

По сути, поиск информации является процессом выявления в определённом массиве текстовых документов тех данных, которые касаются конкретной темы и удовлетворяют указанным условиям, и в которых имеются необходимые сведения и факты (к примеру, вся необходимая информация по теме самообразования).

Состоит процесс поиска информации из нескольких последовательных этапов, посредством которых обеспечивается сбор данных, их обработка и предоставление. Как правило, поиск осуществляется следующим образом:

  • Определяется информационная потребность и формулируется запрос
  • Определяется комплекс источников, в которых может находиться нужная информация
  • Информация извлекается из выявленных источников
  • Происходит ознакомление с данными, и оцениваются результаты поиска

Но, несмотря на то, что на первом этапе нужно как можно правильнее определиться с тем, какую конкретно информацию вы собираетесь искать (а это может показаться первостепенным), наибольшую важность представляет именно второй этап, ведь определиться с тем, где искать информацию, на порядок сложнее.

Где искать информацию?

Вопрос о том, где искать информацию, действительно очень важен. И в первую очередь, по той причине, что XXI век – это век информационный. А это, в свою очередь, значит, что информационный поиск на настоящее время имеет свою специфику.

Давайте вспомним: в конце прошлого века и даже начале настоящего столетия с целью поиска информации люди обращались в специализированные заведения. К таким можно отнести библиотеки, архивы, картотеки и другие подобные органы информации. Но если в то время, чтобы отыскать информацию о том, что интересует, человеку нужно было собраться, выйти из дома, добраться до нужного места, заполнить заявку, отстоять очередь, чтобы её отдать, некоторое время подождать, пока нужная литература будет найдена, а затем провести несколько часов в поиске конкретной информации и её записи на бумагу, то сегодня все эти пункты можно обойти стороной, т.к. практически у каждого дома имеется компьютер и доступ в Интернет. Исходя из этого, актуальные ещё в не таком далёком прошлом информационные базы (архивы, библиотеки и прочее) сегодня если и не потеряли своей актуальности, то, во всяком случае, имеют гораздо меньшее количество клиентов.

Говоря о подборе источников для поиска информации, нельзя не затронуть вопрос о достоверности, что говорит о необходимости уметь анализировать источники данных и определять те, которым можно доверять.

Принципы отбора информации

Можно выделить несколько принципов отбора информации:

Принцип наглядности

Исследуемая информация, которая соответствует этому принципу, обладает следующими признаками:

  • Информация доступна для восприятия и понимания
  • Формируемые информацией образы достоверны, т.к. их можно смоделировать и установить их источники
  • Основные понятия, объекты и явления могут быть продемонстрированы
  • Информация соответствует запрашиваемым критериям

Принцип научности

Принцип научности подразумевает, что исследуемая информация соответствует современным научным данным. Если такое соответствие соблюдается, то появляется возможность обнаруживать неточности и ошибки, воспринимать другие точки зрения, руководствоваться собственной аргументацией и преобразовывать информацию, сопоставляя её с другой.

Вкратце критерии принципа научности можно выразить так:

  • Данные соответствуют научным представлениям современности
  • Если в массиве данных имеются ошибки и неточности, они не способны повлечь за собой искажения объективной картины, касающейся рассматриваемого вопроса
  • Информация может иметь вид исторического документа, который показывает путь развития конкретного научного знания

Принцип актуальности

Согласно этому принципу, информация должна быть практичной, злободневной, соответствующей современным запросам, важной на текущий момент времени. Такая информация способна вызвать наибольший интерес, в отличие от неактуальной. Здесь нужно руководствоваться следующими соображениями:

  • Желательно, чтобы информация была близка по времени и волновала исследователя
  • Информация может представлять собой документ, который расширяет представление об исследуемом объекте
  • Информация должна обладать исторической ценностью или быть важной по иным причинам
  • Информация может являться классическим примером чего-либо, что знают все

Принцип систематичности

Если информация соответствует принципу систематичности, можно наблюдать её многократное повторение в той или иной интерпретации в рамках одного источника или в той же или другой подобной интерпретации в других источниках.

Таким образом, информация достойна внимания и может быть применена, если:

  • Аналогичные данные можно найти в различных базах данных
  • Различные интерпретации не разрушают целостность представлений об одной и той же проблеме

Принцип доступности

Нередко затруднения в поиске и обработке информации могут быть вызваны, во-первых, самим её содержанием, а, во-вторых, стилем, в котором она излагается. По этой причине, работая с информацией, необходимо учитывать, что:

  • Информация должна быть не только доступной для понимания с точки зрения терминологии, но и расширять тезаурус исследователя, по причине чего она будет восприниматься интересной, но не банальной
  • Информация должна соответствовать той терминологии, которой обладает исследователь, но освещать конкретную тему она должна с разных сторон
  • Информация должна предполагать и дидактическую обработку, которая снимает терминологический барьер, другими словами, информацию можно адаптировать под себя, при этом сохранив её смысл

Принцип избыточности

Исследуемая информация должна позволять исследователю выделять основную мысль, находить скрытый смысл, если таковой имеется, приходить к пониманию авторской позиции, определять цели изложения и развивать умение соотносить содержание с назначением.

Принципы поиска информации, о которых мы поговорили, могут быть применены в работе с любыми источниками данных: книгами, документами, архивными материалами, газетами и журналами, а также интернет-сайтами. По сути, эти принципы универсальны, но здесь следует чётко понимать для себя, что для поиска информации в традиционных источниках их может быть вполне достаточно, но при поиске информации в сети Интернет во избежание ошибок необходимо соблюдать ещё один ряд правил.

Дополнительная информация

Каждый пользователь должен иметь в виду, что:

Этих правил будет достаточно для поиска информации в Интернете. Освоить его в состоянии любой человек, причём потребуется на это совсем немного времени – обычно хватает буквально 2-3 практических подходов.

Но что делать с найденной информацией, ведь весь её массив не обязателен для изучения? Неважно, как вы предпочитаете искать данные на интересующую тему – ходить в библиотеку или кликать по сайтам, одновременно попивая кофе – помимо того, что вы должны обладать навыками поиска, вы также должны уметь обрабатывать тот материал, который изучаете. И для этого как нельзя лучше подходит конспектирование и некоторые другие техники.

Что такое конспект?

Как все мы знаем, конспект представляет собой письменный текст, где последовательно и кратко излагаются основные моменты какого-либо источника информации. Конспектирование подразумевает приведение к определённой структуре сведений, взятых из оригинала. Основой этого процесса является систематизация данных. Заметки могут быть либо точными выдержками и цитатами, либо иметь форму свободного письма – главное, чтобы оставался смысл. Стиль, в котором выдерживается конспект, в большинстве случаев близок к первоисточнику.

При правильном составлении конспекта отражается логическая и смысловая связь записываемого. Конспект можно взять через некоторое время или же дать другом человеку, и чтение и понимание материала не вызовут затруднений. Грамотный конспект способствует восприятию даже самой сложной информации, ведь выражена она в понятной форме.

Конспекты также различаются по видам, и чтобы можно было правильно применять тот вид конспекта, который в большей степени подходит выполняемой работе, эти виды нужно уметь различать.

Виды конспектов

Выделяют плановые конспекты, схематические плановые конспекты, текстуальные, тематические и свободные конспекты. Вкратце о каждом из них.

Плановый конспект

Основой планового конспекта является предварительно подготовленный материал, а сам конспект включает в себя заголовки и подзаголовки (пункты и подпункты). Каждый из заголовков сопровождается небольшим текстом, по причине чего имеет понятную структуру.

Плановый конспект в наибольшей мере соответствует подготовке к семинарам и публичным выступлениям. Чем чётче будет структура, тем более логично и полноценно можно будет донести информацию до адресата. По мнению специалистов, плановый конспект должен дополняться пометками, указывающими на использовавшиеся источники, ведь запомнить их все довольно сложно.

Схематический плановый конспект

Схематический плановый конспект состоит из пунктов плана, представленных в форме предложений-вопросов, на которые нужно ответить. При работе с информацией нужно вносить по несколько пометок под каждое из-предложений-вопросов. В таком конспекте будет отражена структура и внутренняя связь данных. Кроме того, этот вид конспектов помогает хорошо усвоить изучаемый материал.

Текстуальный конспект

Текстуальный конспект отличается от всех остальных максимальной насыщенностью, т.к. для его составления используются отрывки и цитаты из первоисточника. Его легко можно дополнить планом, терминами, понятиями и тезисами. Текстуальный конспект рекомендуется составлять тем, кто занят изучением литературы или науки, ведь здесь цитаты представляют особую важность.

Но и составляется этот вид конспектов непросто, т.к. необходимо уметь определять самые важные отрывки текста и цитаты так, чтобы, в конечном счете, они могли дать целостное представление об изученном материале.

Тематический конспект

Тематический конспект отличен от других более всего. Его смысл заключается в том, что освещается какая-либо конкретная тема, вопрос или проблема, а для его составления обычно используют целый ряд источников информации.

Посредством тематического конспекта лучше всего можно провести анализ исследуемой темы, раскрыть главные моменты и изучить их с разных ракурсов. Но нужно понимать, что для составления такого конспекта потребуется исследовать массу источников, чтобы суметь создать целостную картину – это является непременным условием действительно качественного материала.

Свободный конспект

Свободный конспект является лучшим выбором для людей, способных применять разные способы работы с информацией. В свободный конспект можно включить всё: тезисы, цитаты, отрывки текста, план, пометки, выписки и т.д. Необходимо только уметь быстро и грамотно излагать мысли и работать с материалом. Многие считают, что использование конспекта такой формы является самым полноценным и целостным.

Как только вы определились с тем, какой конспект вы будете составлять, можно приступать к самому процессу. Чтобы выполнить работу качественно, нужно руководствоваться определёнными правилами.

Ментальные карты

Ментальные карты или, как их ещё принято называть, диаграммы связей, интеллект-карты, карты мыслей или ассоциативные карты являются таким методом структурирования информации, в котором используются графические записи, имеющие форму диаграмм.

Ментальные карты изображаются в виде древовидных схем, на которых присутствуют задачи, термины, факты и/или какие-либо иные данные, которые связаны ветвями. Ветви, как правило, отходят от главного (центрального) понятия.

Эффективность данного метода обусловлена тем, что его можно использовать в качестве удобного и простого инструмента управления информацией, для которого необходимо лишь наличие бумаги и карандаша (также можно использовать маркерную доску и маркеры).

Рекомендуем вам ознакомиться с подробным описанием метода ментальных карт.

Опорные схемы

Опорные схемы наглядно отображают интеллектуальную психологическую структуру человека, которая управляет его мышлением и поведением. Они позволяют изложить информацию при помощи логико-графического языка посредством значимых опор.

При составлении опорной схемы указывается её название, отмечаются ключевые понятия и схематически изображаются показатели и критерии, на основе которых производится группировка материала.

Этот вид структурирования информации очень удобен при подготовке к зачётам, экзаменам, семинарам. Его можно сопровождать конспектами и дополнительными пометками.

Блок-схемы

Блок-схемы – это ещё один действенный метод, помогающий структурировать информацию. Он представляет собой графические модели, которые описывают последовательность мыслительных операций.

Суть блок-схемы заключается в изображении отдельных шагов в форме блоков, имеющих различную форму. Все блоки соединяются друг с другом линиями-стрелками, которые указывают нужную последовательность мышления.

Чаще всего блок-схемы используются для работы с чётко структурированной информацией, когда все шаги являются конкретными. Каждый блок, имея свою форму, указывает на тот или иной мыслительный процесс, и ориентироваться по блок-схеме можно даже с минимальным количеством текстовых данных на ней. Удобно применять в качестве дополнительного инструмента.

В заключение

Как можно заключить, поиск информации и её обработка – это не только интересная, но и увлекательная деятельность. Если научиться применять этот навык с учётом всех особенностей, о которых мы сегодня поговорили, найти нужную информацию и использовать её в своих целях не будет составлять никакого труда, в особенности, если выполнить приемлемый для себя алгоритм действий несколько раз подряд.

В следующем уроке вы узнаете о том, почему в процессе самостоятельного обучения рекомендуется следовать конкретному плану, о том, как его составить, и на что нужно обратить внимание, чтобы обучение было максимально эффективным.

Проверьте свои знания

Что такое информационный поиск?

Изначально автоматизированный информационный поиск (имеются в виду информационно-поисковые системы) применялся с целью поиска научных данных и соответствующей литературы, и использовался он университетами и публичными библиотеками. Однако с появлением и развитием сети Интернет информационный поиск получил широкое распространение.

По сути, поиск информации является процессом выявления в определённом массиве текстовых документов тех данных, которые касаются конкретной темы и удовлетворяют указанным условиям, и в которых имеются необходимые сведения и факты (к примеру, вся необходимая информация по теме самообразования).

Состоит процесс поиска информации из нескольких последовательных этапов, посредством которых обеспечивается сбор данных, их обработка и предоставление. Как правило, поиск осуществляется следующим образом:

  • Определяется информационная потребность и формулируется запрос
  • Определяется комплекс источников, в которых может находиться нужная информация
  • Информация извлекается из выявленных источников
  • Происходит ознакомление с данными, и оцениваются результаты поиска

Но, несмотря на то, что на первом этапе нужно как можно правильнее определиться с тем, какую конкретно информацию вы собираетесь искать (а это может показаться первостепенным), наибольшую важность представляет именно второй этап, ведь определиться с тем, где искать информацию, на порядок сложнее.

Где искать информацию?

Вопрос о том, где искать информацию, действительно очень важен. И в первую очередь, по той причине, что XXI век – это век информационный. А это, в свою очередь, значит, что информационный поиск на настоящее время имеет свою специфику.

Давайте вспомним: в конце прошлого века и даже начале настоящего столетия с целью поиска информации люди обращались в специализированные заведения. К таким можно отнести библиотеки, архивы, картотеки и другие подобные органы информации. Но если в то время, чтобы отыскать информацию о том, что интересует, человеку нужно было собраться, выйти из дома, добраться до нужного места, заполнить заявку, отстоять очередь, чтобы её отдать, некоторое время подождать, пока нужная литература будет найдена, а затем провести несколько часов в поиске конкретной информации и её записи на бумагу, то сегодня все эти пункты можно обойти стороной, т.к. практически у каждого дома имеется компьютер и доступ в Интернет. Исходя из этого, актуальные ещё в не таком далёком прошлом информационные базы (архивы, библиотеки и прочее) сегодня если и не потеряли своей актуальности, то, во всяком случае, имеют гораздо меньшее количество клиентов.

Говоря о подборе источников для поиска информации, нельзя не затронуть вопрос о достоверности, что говорит о необходимости уметь анализировать источники данных и определять те, которым можно доверять.

Читайте также: