Поиск информации в базах данных сообщение

Обновлено: 27.04.2024

Поиск информации является одной из основных задач баз данных. В MS Access возможны следующие способы поиска:

- использование команд Поиск/Замена;

Ускорение поиска достигается при задании индекса. Индекс представляет собой конструкцию, определяющую порядок сортировки по одному полю (простой индекс) или по нескольким полям (составной индекс). Для его создания в окне Конструктора таблицы надо нажать кнопку Индекс. В появившемся окне в столбце Индекс указывается имя индекса (любое), в столбце Имя поля перечисляются поля (выбираются из всплывающего списка), в столбце Порядок сортировки указывается ее тип (возрастание/убывание). Составной индекс необходим, если сортировка по одному полю не позволяет однозначно упорядочить записи в таблице.

Аналогичного результата сортировки можно достичь путем выделения нужных полей в режиме таблицы и запуске процедуры сортировки через кнопку панели инструментов, но запоминания этой процедуры в дальнейшем не произойдет.

Команда Поиск/Замена. Этот метод является простейшим. Необходимо нажать кнопку Найти на панели инструментов или выбрать команду основного меню Правка/Найти.В диалоговом окне (см. рисунок 12) надо задать параметры поиска и образец.

Рисунок 12 – Окно задания условий поиска

Возможно использование специальных символов для задания условий неточного совпадения образца и данных в БД:

* – любое количество любых символов;

? – любой текстовый символ;

[ ] – любой один символ из заключенных в скобки;

! – любой один символ, кроме заключенных в скобки;

– – любой символ из диапазона;

Дополнительными возможностями обладает функция поиска и замены. Ее можно запустить командой меню Правка/Заменить. Появившееся окно очень похоже на окно поиска.

Практическое задание

Разработайте информационную подсистему "Зарплата" для автоматизации начисления почасовой заработной платы в бухгалтерии. База данных состоит из трех таблиц, содержащих сведения о работниках, ставки почасовой оплаты и табель отработанных часов. Создайте формы для ввода данных, запрос и отчет для начисленной зарплаты.

На каждого работника хранятся следующие данные:

- личный номер (ключевое поле);

- фамилия, имя, отчество;

Тарифная сетка для почасовой оплаты:

- должность (ключевое поле вместе с разрядом);

- разряд (от 7 до 15);

- количество часов, отработанных за месяц.

После создания таблиц осуществите их связывание и заполнение произвольными данными для 15 работников.

В разработанной ранее подсистеме "Зарплата" осуществите поиск сотрудников с 5 разрядом и реализуйте замену на 6 разряд.

2 Белозубов, А. В. Основы работы в Windows 7 : учеб. пособие /
А. В. Белозубов, С. А. Билевич, Д. Г. Николаев. – СПб. : СПбГУ ИТМО, 2011. – 120 с.

3 Гуриков, С. Р.Методическое пособие по программированию для Microsoft Excel на Visual Basic for Applications (VBA) / С. Р. Гуриков. – Красногорск : Красногорский оптико-электронный колледж, 2002. – 126 с.

5 Пташинский, В. С.Знакомьтесь : Windows 7 / В. С. Пташинский. – М. : Эксмо, 2009. – 280 с.

7 Сергеев, А. П.Microsoft Office 2007. Самоучитель / А. П. Сергеев. – М. : Вильямс, 2007. – 432 с.

8 Стоцкий, Ю. Office 2007. Самоучитель / Ю. Стоцкий, А. Васильев, И. Телина. – СПб.: Питер, 2007. – 524 с.

9 Microsoft Office 2007. Все программы пакета : Word, Excel, Access, PowerPoint, Publisher, Outlook, OneNote, InfoPath, Groove. Самоучитель / А. Н. Тихомиров [и др.]. – СПб. : Наука и техника, 2008. – 608 с.

© 2014-2022 — Студопедия.Нет — Информационный студенческий ресурс. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав (0.004)

Компьютерная лингвистика

Задачи компьютерной лингвистики

Парадигматические отношения между словами

Задача контроля текстов

Автоматическое индексирование документов

Поиск информации

Формальная логика

Грамматика

Алгоритмы

Соединения алгоритмов

Метод аналогии

Система словообразования русского языка

Синтаксический анализ текстов

Концептуальный анализ текстов

Фразеологический машинный перевод

Поиск информации в базах данных

Поиск по формализованным запросам

Искусственный интеллект

Нейронные сети

Экспертные системы

Интенсивное развитие информационно-коммуникационных технологий повлекло за собой лавинообразный рост объемов накапливаемой информации. Рост документальной информации подчиняется закону Мура с небольшой корректировкой, т.е. объем документальной информации удваивается каждые три года.

Большие массивы информации ведут к увеличению затрат на получение доступа к информационным ресурсам и времени работы с ними. Эффективность работы с информационными ресурсами во многом зависит от методов структуризации информации в базах данных, программного обеспечения для работы с большим массивом информации и, конечно, от квалификации специалистов, где большое значение приобретают знания и умения поиска информации.

Одним из преимуществ профессиональных баз данных перед ресурсами Интернет является обработка поступающей информации, включающая разнесение ее по рубрикам, выделение в документах сегментов, таких как автор, заголовок, дата и т.д.

Для повышения эффективности поиска и сокращения затрачиваемого времени разрабатываются различные поисковые инструменты и формы представления информации. Все информационные ресурсы в системе иерархически структурированы, что обеспечивает пользователю дополнительные возможности поиска.

Информация, как правило, расположена в различных библиотеках. Каждая библиотека представляет собой коллекцию источников информации, относящихся к определенной тематике. Каждая библиотека содержит файлы. Файл содержит документы, поступающие от одного или нескольких источников информации. Каждый документ в файле состоит из нескольких частей, которые называются сегментами. Общими сегментами для всех документов являются: название, автор, дата, текст документа. В зависимости от типа документа будет меняться и набор сегментов, из которых состоит сегмент и названия сегментов.

Файлы могут быть либо фактографические или документальные. Выполнение информационного писка возможно либо по тексту, либо при помощи каталога. При полнотекстовом поиске информационная система отыскивает слова в тексте документа, либо в его сегменте, например в заголовках статей и рефератах, перебирая все варианты написания и синонимы. В некоторых системах поисковая программа позволяет вводить набор слов и учитывает некоторые формы слова, например множественное число.

Каталог в информационной системе – это оглавление файлов, составленное по тематическому или региональному признаку, имеющее иерархическую структуру. Полнотекстовый поиск и поиск при помощи каталога не является взаимоисключающими, напротив, наиболее эффективные стратегии поиска получаются при их комбинации.

Несмотря на разнообразие поисковых инструментов, процесс поиска информации можно разбить на четыре этапа.

Формулировка задачи. Цель этого этапа состоит в четком определении информационной потребности. Информационной потребностью может быть определенный документ, например закон или публикация, конкретная информация, или информация, посвященная определенному кругу вопросов. Исходя из формулировки потребностей, выбираются наиболее подходящие методы поиска, а также ключевые слова.

Выбор информационного ресурса. После формулировки информационной задачи необходимо выбрать информационный ресурс, который может содержать неполную информацию. Выбор информационного ресурса ограничивается возможностями получения доступа.

Построение запроса. После того как информационная задача строго сформулирована и выбран информационный ресурс, необходимо составить информационный запрос.

Для документальной информационной системы может быть предложена следующая последовательность действий:

выбрать соответствующую тематическую рубрику;

разбить вопрос на слова, которые следует искать отдельно, а затем объединить их соответствующими логическими операторами (and, or, not), если в системе предусмотрены булевы операции.

Практически во всех информационных системах существует соответствующий язык построения поисковых запросов для проведения поиска слов и выражений по тексту документа. Общими элементами этих языков является булева логика. Она используется тогда, когда поисковый запрос содержит более одного понятия. AND-требует наличия всех терминов, в результате уменьшает число найденных документов, OR-требует наличия в документе хотя бы одного понятия, в результате увеличивает число документов, NOT-требует отсутствия термина, в результате уменьшает число найденных документов.

учесть все варианты написания слов и синонимы при поиске произвольного текста, для чего необходимо использовать соответствующие классификаторы, словари и тезаурусы, что может значительно повысить эффективность запроса.

Оценка результатов поиска является важным этапом информационного поиска. Ее результаты зависят от того, для каких целей будут использованы результаты поиска.

Критерии оценки поиска:

количество найденных документов;

найденные источники информации;

оперативность предоставления информации.

По результатам поиска запрос корректируется. Для достижения наилучшего результата поиска составляется несколько запросов на поиск информации. При поиске информации большое значение имеют знание специалиста инструментов поиска и умение их применять.

Таким образом, информационный поиск представляет собой упорядоченную последовательность действий, для того чтобы отыскать необходимую информацию. Особое внимание стоит уделить вопросам минимизации стоимости получаемой информации от источников. В ряде случаев поиск информации проводится в рамках выделенной для этого суммы. Работая с метаинформацией, возможно предварительно оценить стоимость необходимой информации.

Несмотря на разнообразие поисковых инструментов, процесс поиска информации можно разбить на четыре этапа.

Для документальной информационной системы может быть предложена следующая последовательность действий:

выбрать соответствующую тематическую рубрику;

Критерии оценки поиска:

количество найденных документов;

найденные источники информации;

оперативность предоставления информации.

Содержание

Причины ускорения поиска

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Структура реляционной таблицы

Под структурой реляционной таблицы понимают описание образующих её полей: наименование, тип хранимых данных, размер поля в байтах.

Для дальнейших рассуждений условимся, что у нас есть таблица с 10 полями по 10 символов. В сумме на одну запись получится 100 символов или 100 байтов хранимой на диске информации.

Что же это даёт?

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Индексация

Индексация или индексирование — создание специального файла, содержащего: 1) упорядоченные значения (текст по алфавиту, числа/даты в порядке возрастания или убывания и т.д.) с 2) номерами их записей.

Зачем создавать индексы? Ведь они будут занимать дополнительное место на диске (число для номера записи, разделитель, полное содержимое поля или суммы нескольких полей), причем настолько немаленькое, что могут оказаться больше самой базы данных!

Для того, чтобы это понять, давайте порассуждаем, как происходит поиск информации в файле.

Однако, если представить себе таблицу с миллионами или миллиардами строк, да ещё учесть довольно большое время перехода от строки к строке, то подобный перебор может занять минуты, а то и часы.

В случае наличия индекса (упорядоченного перечня), появляется возможность воспользоваться так называемым двоичным поиском .

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Можно сказать, что современные компьютеры выполняют миллионы операций за секунду и всё перечисленное не имеет значения. Но, на практике, перебор записей в таблице из 1 млн строк на весьма быстром компьютере занимает несколько десятков секунд. Подобные задержки не позволили бы пользоваться большими массивами данных для поиска и анализа. Двоичный же поиск полностью снимает остроту проблемы. Издержки — расходование места для хранения индексных файлов и их же загрузка в дефицитную память.

Первая колонка в приведенной ниже таблице описывает число необходимых сравнений (n), а вторая — 2 n или количество сравниваемых объектов.

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Синим в таблице показано число вариантов, кодируемое 2, 3, 4, 5 и 6-ю байтами. Красным — примерное число, соответствующее населению Земли. Таким образом, двоичным поиском можно найти любого человека не более, чем за 33 операции сравнения в базе данных.

Вывод упорядоченных данных, то есть расположенных в порядке возрастания или убывания значений. Данный смысл условно можно считать спорным.
Необходимость быстрого поиска.

Недостатки индексирования

Не стоит безоглядно хвалить что бы то ни было, так как у всего есть отрицательные качества. Каковы же они у индексов?

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Обязательное создание индексов

При реальной разработке БД, также, как и при выполнении учебных заданий, неизбежно встают вопросы: для каких полей создавать индекс надо, для каких стоит подумать, а когда их создание будет ошибкой?

Помимо уже описанного значительного увеличения объема хранимой информации, происходит замедление работы при добавлении записей и при редактировании полей, включаемых в индексы.

Обязательна индексация ключевых полей (primary key, первичный ключ), полей, служащих для связи таблиц (хотя, чаще всего, ими являются ключевые), реже — полей, очень часто выводимых на экран в упорядоченном виде.

Сразу отмечу для студентов: указывать индексы для первичных полей (кодов) можно, но не обязательно. Это вытекает из совсем первичной сути и не может рассматриваться ни в качестве работы, ни в качестве ошибки.

При реальной разработке эксперименты осложняются тем, что таблицы не заполнены значительным количеством записей и всё происходит быстро. Оценить эффект не представляется возможным.

Немного спекуляции, основанной на правде жизни и использованием БД на сайте. Если индекса(ов) нет, то выполнение запроса отнимет много ограниченного процессорного времени сервера. Если он есть, то расходуется ограниченная той же услугой память. Это есть та сущность, которую нам подарила услуга хостинга и её реализация, гм, не совсем грамотными специалистами, оценивающими грамотность разработчиков БД и интерфейсов. Проблема в том, что мы дальше должны играть в шараду, никак не формализуемую, так как все прогнозы могут относиться лишь к сфере ожидаемого.

Способы поиска информации в БД

В какой-то степени можно говорить, что данный вопрос выдуман лично мной. Сложилось ли это случайно или было вполне закономерным результатом педагогического процесса — сказать сложно, да и не так уж и интересно. Важно другое: разбор этой темы позволяет задуматься над обратной стороной БД — их реальным использованием. А, с учетом нехватки времени на практическую реализацию, да и невозможностью сделать это в нужном объеме, умозрительное восприятие приобретает дополнительную значимость.

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Попробуем ещё разобрать вопрос по косвенным сущностям. Итак, опять способы, но уже представления данных пользователю.

Доступ к этим материалам предоставляется только зарегистрированным пользователям!

Наиболее существенным для реализации всего перечисленного является правильная разработка структуры БД и, основанное на этом создание постоянных индексов. Любые нестыковки приведут к задержкам в выполнении запросов, прямо пропорционально размерам таблиц.

Далее следует обратиться к теме отчетов.

Читайте также: