Связанные данные и базовые информационные объекты модели предметной области реферат

Обновлено: 30.06.2024

Название работы: ФОРМИРОВАНИЕ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ

Предметная область: Информатика, кибернетика и программирование

Описание: Таким образом для современного состояния информационных технологий необходим переход от информационного описания предметной области к представлению на уровне данных осуществляемый на основе декомпозиции абстракции агрегирования. При анализе предметной области принято выделять три этапа: анализ требований и информационных потребностей; определение информационных объектов и связей между ними; конструирование концептуальной модели предметной области. Этап анализа требований и информационных потребностей включает следующие задачи.

Дата добавления: 2013-11-17

Размер файла: 4.08 MB

Работу скачали: 64 чел.

ФОРМИРОВАНИЕ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ

Современный уровень инструментальных средств позволяет работать на компьютере на определенном уровне, например, при использовании редакторов, многим пользователям. Однако при углубленной работе с информацией, связанной с ее сбором, созданием базы данных, обработкой информации, представлением для дальнейшего использования возникают значительные трудности. Это связано с невозможностью работы в компьютерной среде на естественном языке. Вся информация, описывающая конкретную предметную область должна быть определенным образом абстрагирована и формализована.

Основными направлениями формализации информации о предметной области являются:

  • теория классификации, базирующаяся на таксономическом и мерономическом описании информации. Таксономическое описание основано на идеологии множеств, а мерономическое осуществляется через строго формализованное определение классов;
  • теория измерений, предлагающая базу для качественных и количественных измерений через классификационные и порядковые шкалы;
  • семиотика, изучающая знаковые системы с точки зрения синтактики, семантики и прагматики.

Прежде чем перейти непосредственно к вопросам формализации и абстрагированного описания кратко коснемся вопросов терминологии.

Понятие информации в общем плане должно быть связано с определенной предметной областью, свойства которой она отражает. В более узком плане понятие информации связано с определенным объектом. При этом наблюдается относительная независимость информации от носителя, поскольку возможны ее преобразование и передача по различным физическим средам с помощью разнообразных физических сигналов безотносительно к ее содержанию, т.е. к семантике, что и явилось центральным вопросом многих исследований, в том числе и в философской науке. Информация о любом материальном объекте может быть получена путем наблюдения, натурного либо вычислительного эксперимента, а также на основе логического вывода. Поэтому говорят о доопыт-ной, или априорной информации и послеопытной, т.е. апостериорной, полученной в итоге эксперимента.

Предметная область — реальный мир, который должен быть отражен в информационной базе.

Факты — результат наблюдения за состоянием предметной области.

Данные — вид информации, отличающийся высокой степенью форматированности в отличие от более свободных структур, характерных для речевой, текстовой и визуальной информации

Информационная база (база данных) — совокупность данных, предназначенных для совместного применения.

Знания — итог теоретической и практической деятельности человека, отражающий накопление предыдущего опыта и отличающийся высокой степенью структуризации.

В знаниях можно выделить три основные составные части:

  • декларативные (факторальные знания), представляющие общее описание объекта, что не позволяет их использовать без предварительной структуризации в конкретной предметной области;
  • понятийные (системные) знания, содержащие помимо первой части, взаимосвязи между понятиями и свойства понятий;
  • процедурные (алгоритмические) знания, позволяющие получить алгоритм решения.

Предмет — всякая материальная вещь, объект познания. В логике предметом называется все то, на что направлена наша мысль; все то, что может быть как-то воспринято, названо и т.д. В этом смысле предметом считаются также суждение, понятие, умозаключение. В математической логике предметы обозначаются символами — предметными константами и предметными переменными.

Свойство — то, что присуще предметам, что отличает их от других предметов или делает их похожими на другие предметы. Каждый предмет обладает бесчисленным множеством свойств. Свойства проявляются в процессе взаимодействия предметов.

Признак — все то, в чем предметы, явления сходны друг с другом или в чем они отличаются друг от друга; показатель, сторона предмета или явления, по которой можно узнать, определить или описать предмет или явление.

Атрибут (лат. attributum — предназначенное, наделенное, присовокупленное) — неотъемлемое, существенное, необходимое свойство, признак предмета или явления, без которого они не могут существовать, быть самими собой, в отличие от случайных, преходящих, несущественных свойств, или акциденций.

Таким образом, для современного состояния информационных технологий необходим переход от информационного описания предметной области к представлению на уровне данных, осуществляемый на основе декомпозиции, абстракции, агрегирования.

Декомпозиция — это разбиение системы (программы, задачи) на компоненты, объединение которых позволяет решить данную задачу.

Абстракция позволяет правильно выбрать нужные компоненты для декомпозиции.

Абстракция представляет собой эффективный способ декомпозиции, осуществляемый посредством изменения списка декомпозиции.

Абстракция предполагает продуманный выбор компонент. Процесс абстракции может быть рассмотрен как некоторое обобщение. Он позволяет забыть о различиях и рассматривать предметы и явления так, как если бы они были эквивалентны.

Выделение общего у процессов и явлений есть основа классификации. Иерархия абстракций представляет собой фактически схему классификации.

Агрегирование — процесс объединения предметов в некоторую группу не обязательно в целях классификации. Агрегирование выполняется с некоторой целью.

  • абстракция через параметризацию;
  • абстракция через спецификацию.

Абстракция через параметризацию — выделение формальных параметров с возможностью их замены на фактические в различных контекстах.

Выделение формальных параметров позволяет абстрагироваться от конкретного приложения и базируется на общности определенных свойств конкретных приложений.

Абстракция через спецификацию позволяет абстрагироваться от внутренней структуры до знания свойств внешних проявлений (результата).

Модель данных — модель, используемая при абстрагировании. Концептуальная модель — абстрагированное описание предметной области.

После знакомства с вопросами терминологии Вы получили возможность разговаривать на профессиональном языке и можно перейти к проблемам конструирования информационного обеспечения. Первой в этом ряду стоит проблема анализа предметной области. При анализе предметной области принято выделять три этапа:

  • анализ требований и информационных потребностей;
  • определение информационных объектов и связей между ними;
  • конструирование концептуальной модели предметной области.

Этап анализа требований и информационных потребностей

включает следующие задачи:

  • определение перечня задач по извлечению, обработке, хранению, транспортировке и представлению (в том числе документированию) информации;
  • определение требований к составу, структуре, формам представления информации;
  • прогнозирование возможных изменений информационных ресурсов как в количественном, так и в содержательном плане.

Каждый из участников действия имеет свое представление об информации данной предметной области. Нашей задачей является обобщение этих представлений, получаемых путем опроса участников информационных процессов и анализа документов. Все действия желательно фиксировать в виде определенных документов на бумаге или в памяти компьютера. Форма фиксации может быть любая: структурная схема, блок-схема, таблица и т.д. Например, в качестве таковых можно использовать следующие виды документов: схему внешних информационных связей (рис. 7.5), схему детализации действия (рис. 7.6), схему потоков данных (рис. 7.7) и др.




Используем предложенные типы документов.

1. Схема внешних информационных связей. Действие — Рабо-та_с_расписанием.

2. Схема детализации действия. Действие — Работа_с_расписанием.

3. Схема потоков данных. Действие — Работа_с_расписанием.

4. Схемы классификации: объект — пользователи расписания (рис. 7.8, а); объект — помещение (рис. 7.8, б); данные — запросы к расписанию (рис. 7.8, в).


5. Схема детализации. Данные — справки по расписанию (рис.9).

6. Схема классификации. Данные — справки по расписанию (рис. 7.10).

Тщательность проведения этапа анализа определяет в дальнейшем эффективность работы информационной системы, возможность дальнейшего наращивания информационных ресурсов, адаптируемость к изменению требований к системе.

После анализа требований и информационных потребностей можно перейти к следующей фазе — определению информационных объектов и связей между ними.

Основной задачей данного этапа является разбиение предметной области на составные части путем декомпозиции, осуществляемой по определенным правилам.

На данный момент существуют два основных подхода к этому процессу, отличающихся критериями декомпозиции: функционально — модульный (структурный) и объектно-ориентированный.

Функционально-модульный подход основан на принципе алгоритмической декомпозиции с выделением функциональных элементов и установлением строгого порядка выполняемых действий, т.е. в основе лежит иерархический подход с выделением вначале функциональных действий, затем независимых компонентов с дальнейшей их детализацией.

Объектно-ориентированный подход основан на объектной декомпозиции с описанием поведения системы в терминах взаимодействия объектов.

Главным недостатком функционально-модульного подхода является однонаправленность информационных потоков и недостаточная обратная связь. В случае изменения требований к системе это приводит к полному перепроектированию, поэтому ошибки, наложенные на ранних этапах, сильно сказываются на продолжительности и стоимости разработки. Другой важной проблемой является неоднородность информационных ресурсов, используемых в большинстве информационных систем. В силу этих причин в настоящее время наибольшее распространение получил объектно-ориентированный подход. Основные понятия, используемые при декомпозиции предметной области на основе объектно-ориентированного подхода — объект, класс, экземпляр, атрибут, связь между объектами, связь между атрибутами.



Атрибут — информационное отображение свойств объекта.

Экземпляр объекта — это конкретный, определенный элемент множества. Например объектом может являться государственный номер автомобиля, а экземпляром этого объекта — номер К 173 ПА.

Класс — это множество предметов реального мира, связанных общностью структуры и поведением.

Элемент класса — это конкретный элемент данного множества. Например, класс регистрационных номеров автомобиля.

При выделении информационных объектов можно проследить следующую последовательность действий:

  • формирование классов, на которые можно разбить данные, подлежащие хранению;
  • присвоение уникального имени каждому классу объектов;
  • выделение информационных объектов путем анализа информационных потоков, документальных источников и интервьюирования участников информационного взаимодействия;
  • присвоение уникального имени каждому объекту данных и проверка их синтактики и семантики;
  • определение набора характеристик каждого объекта и формирование на этой основе состава атрибутов;
  • присвоение уникальных имен выбранным атрибутам;
  • задание ограничений на объекты и их атрибуты (количественные ограничения — диапазон изменения: максимальное (минимальное) значение и др., ограничение целостности (неизменности состояния объекта в рассматриваемом интервале времени).

В процессе отражения между состояниями взаимодействующих объектов возникает определенная связь. Информация как результат отражения одного объекта другим выявляет степень соответствия их состояний.

Примеры этих связей:



Выделение этих связей является крайне важным, так как связи 1:М и M : N имеют внутреннюю неопределенность, что сказывается при операциях поиска и модификации (изменения) данных. Для преодоления неопределенности на этапе реализации логической модели требуется вводить избыточную информацию.

Заключительной фазой анализа предметной области является проектирование определенной информационной структуры в виде концептуальной модели. Для построения концептуальной модели используются операции агрегации и обобщения.

Базовыми структурами в ER -модели являются типы сущностей и типы связей (рис. 7.12). Отличие типа связи от типа сущности — в установлении зависимости реализации одного типа от реализации другого.

Пример: ЛИЧНОСТЬ-тип сущности, тип СОСТОИТ В БРАКЕ — нет, так как реализация последнего типа не существует, если не существует двух личностей. Поэтому, тип связи можно рассматривать как агрегат двух или более типов сущностей.

Реляционная модель является наиболее распространенной на практике в современных ИС, поэтому целесообразно рассмотреть




ее возможности. Большинство СУБД, представленных на рынке, являются реляционными или объектно-реляционными. Семантическая диаграмма реляционной модели представлена на рис. 7.13, а пример реляционной модели — на рис. 7.14.

Современная жизнь немыслима без эффективного управления. Важной категорией являются системы обработки информации, от которых во многом зависит эффективность работы любого предприятия ли учреждения. Такая система должна:

  • обеспечивать получение общих и/или детализированных отчетов по итогам работы;
  • позволять легко определять тенденции изменения важнейших показателей;
  • обеспечивать получение информации, критической по времени, без существенных задержек;
  • выполнять точный и полный анализ данных.

Современные системы управления базами данных (СУБД) в основном являются приложениями Windows, так как данная среда позволяет более полно использовать возможности персональной ЭВМ, нежели среда DOS. Снижение стоимости высокопроизводительных ПК обусловил не только широкий переход к среде Windows, где разработчик программного обеспечения может в меньше степени заботиться о распределении ресурсов, но также сделал программное обеспечение ПК в целом и СУБД в частности менее критичными к аппаратным ресурсам ЭВМ.

Таким образом, на сегодняшний день разработчик не связан рамками какого-либо конкретного пакета, а в зависимости от поставленной задачи может использовать самые разные приложения. Поэтому, более важным представляется общее направление развития СУБД и других средств разработки приложений в настоящее время.

2. БАЗЫ ДАННЫХ И СИСТЕМЫ УПРАВЛЕНИЯ ИМИ

2.1. Базы данных

Цель любой информационной системы – обработка данных об объектах реального мира. Основные идеи современной информационной технологии базируются на концепции баз данных (БД).

База данных (БД) - это поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Согласно данной концепции основой информационной технологии являются данные, организованные в БД, адекватно отражающие реалии действительности в той или иной предметной области и обеспечивающие поль зователя актуальной информацией в соответствующей предметной области. Под предметной областью принято понимать часть реального мира, подлежащего изучению для организации управления и в конечном счёте автоматизации, например, предприятие, ВУЗ и т.д.

Первые БД появились уже на заре 1-го поколен ия ЭВМ представляя собой отдельные файлы данных или их простые coвокупности.

Создавая базу данных, пользователь стремится упорядочить информацию по различ­ным признакам и быстро извлекать выборку с произвольным сочетанием признаков. Сде­лать это возможно, только если данные структурированы.

Структурирование - это введение соглашений о способах представления данных.

Неструктурированными называют данные, записанные, например, в текстовом файле.

Пользователями базы данных могут быть различные прикладные программы, про­граммные комплексы, а также специалисты предметной области, выступающие в роли по­требителей или источников данных, называемые конечными пользователями.

2.1. Структурные элементы базы данных

Понятие базы данных тесно связано с такими понятиями структурных элементов, как поле, запись, файл (таблица).

Поле - элементарная единица логической организации данных, которая соответст­вует неделимой единице информации - реквизиту. Для описания поля используются сле­дующие характеристики:

  • имя, например. Фамилия, Имя, Отчество, Дата рождения;
  • тип, например, символьный, числовой, календарный;
  • длина, например, 15 байт, причем будет определяться максимально возможным ко­личеством символов;
  • точность для числовых данных, например два десятичных знака для отображения дробной части числа.

Запись - совокупность логически связанных полей. Экземпляр записи — отдельная реализация записи, содержащая конкретные значения ее полей.

Файл (таблица) - совокупность экземпляров записей одной структуры.

В структуре записи файла указываются поля, значения которых являются ключами первичными (ПК), которые идентифицируют экземпляр записи, и вторичными (ВК), которые выполняют роль поисковых или группировочных признаков (по значению вторичного ключа можно найти несколько записей).

2.2. Системы управления базами данных

По мере увеличения объемов и структурной сложно сти хранимой информации, а также расширения круга потребите лей информации, определилась необходимость создания удобны х и эффективных систем интеграции хранимых данных и управления ими. Теперь создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляются централизованно с помощью специального программного инструментария - системы управления базами данных (СУБД).

Система управления базами данных (СУБД) - это комплекс программ­ных и языковых средств, необходимых для создания баз данных, поддержа­ния их в актуальном состоянии и организации поиска в них необходимой информации.

Первые СУБД, поддерживающие opганизацию и ведение БД, появились в конце 60-х годов.

Использование СУБД обеспечивает лучшее управление данными, более совершенную организацию файлов и более простое обращение к ним по сравнению с обычными способами хранения информации.

3. МОДЕЛИ ДАННЫХ И ИХ ВИДЫ

Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования дан­ными. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.

Модель данных - совокупность структур данных и операций их обра­ботки.

По способу установления связей между данными СУБД основывается на использовании трёх основных видов модели: иерархической, сетевой или реляционной; на комбинации этих моделей или на некотором их подмножестве.

Однако различия между этими моделями постепенно стираются, что обусловлено п режде всего интенсивными работами в области баз знаний (БЗ) и объектно-ориентированной инфотехнологией, о которой будет идти речь ниже.

Каждая из указанных моделей обладает характеристиками, делающими ее наиболее удобной для конкретных приложений. Одно из основных различий этих моделей состоит в том, что для иерархических и сетевых СУБД их структура часто не может быть изменена после ввода данных, тогда как для реляционных СУБД структура может изменяться в любое время. С другой стороны, для больших БД, структура которых остается длительное время неизменной, и постоянно работающих с ними приложений с интенсивными потоками запросов на БД-обслуживание именно иерархические и сетевые СУБД могут оказаться наиболее эффективными решениями, ибо они могут обеспечивать более быстрый доступ к информации БД, чем реляционные СУБД.

4. ИЕРАРХИЧЕСКАЯ МОДЕЛЬ ДАННЫХ

Иерархическая структура представляет совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево).

К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.

Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную ника­кой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в базе данных определяется числом корневых записей.

К каждой записи базы данных существует только один (иерархический) путь от корневой записи.

Аннотация: В настоящей лекции вводится понятие предметной области базы данных, описываются основные приемы построения моделей предметной области. Рассматриваемые модели являются входными данными для процесса проектирования базы данных.

Понятие предметной области

Основным назначением информационных систем является оперативное обеспечение пользователя информацией о внешнем мире путем реализации вопросно-ответного отношения. Вопросно-ответные отношения, получая интерпретацию во внешнем мире (мире вне информационной системы), позволяют выделить для информационной системы определенный его фрагмент - предметную область, - который будет воплощен в автоматизированной информационной системе . Информация о внешнем мире представляется в информационной системе (ИС) в форме данных. Это ограничивает возможности смысловой интерпретации информации и конкретизирует семантику ее представления в ИС. Совокупность этих выделенных для ИС данных, связей между ними и операций над ними образует информационную и функциональную модели предметной области , описывающие ее состояние с определенной точностью.

Важно понимать, что информационная и функциональная модели предметной области создаются на этапе анализа требований к базе данных и не содержат предположений о технологии реализации базы данных . Они строятся независимо от выбираемой модели данных (сетевой, иерархической, реляционной, объектно-ориентированной, многомерной и т.д.), поддерживаемой СУБД , модели вычислений , программно-аппаратной платформы для базы данных . Информационная и функциональная модели предметной области являются входными данными для процесса проектирования базы данных . Поэтому проектировщик должен уметь правильно интерпретировать их в ходе решения своих проектных задач.

Понятие предметной области базы данных является одним из базовых понятий информатики и не имеет точного определения. Его использование в контексте ИС предполагает существование устойчивой во времени соотнесенности между именами, понятиями и определенными реалиями внешнего мира, не зависящей от самой ИС и ее круга пользователей. Таким образом, введение в рассмотрение понятия предметной области базы данных ограничивает и делает обозримым пространство информационного поиска в ИС и позволяет выполнять запросы за конечное время.

Совокупность реалий (объектов) внешнего мира - объектов, о которых можно задавать вопросы, - образует объектное ядро предметной области , которое имеет онтологический статус. Нельзя получить в ИС ответ на вопрос о том, что ей неизвестно. Термин объект является первичным, неопределяемым понятием. Синонимами термина " объект " являются "реалия, сущность, вещь". Однако термин сущность понимается нами несколько уже, как компонент модели предметной области , т.е. как уже выделенный на концептуальном уровне объект для базы данных . Таким образом, выделяемые в предметной области объекты превращаются аналитиками (а не проектировщиками базы данных ) в сущности. Сущность предметной области является результатом абстрагирования реального объекта путем выделения и фиксации набора его свойств. Сущность является результатом абстрагирования реального объекта, т.е. в нашем контексте имеет гносеологический статус. Хотя далее в контексте сущность нередко отождествляется с объектом.

На рис. 2.1 представлен один из подходов к классификации объектов предметной области .

Примерами сущностей (с точки зрения ИС) или объектов (с точки зрения внешнего мира) являются отдельный студент, группа студентов, аудитория, время занятий, слова, числа, символы. Обычно считается, что быть объектом - это значит быть дискретным и различимым. Примеры "не-объектов" - это мир, время, смысл, хотя и такие категории могут сохраняться в базе данных.

С объектами связано две проблемы: идентификация и адекватное описание. Для идентификации используют имя. При этом предполагается, что происходит отказ от его смысла, который присущ естественному языку. Используется только указательная функция имени. Имя - это прямой способ идентификации объекта. К косвенным способам идентификации объекта относят определение объекта через его свойства (характеристики или признаки).

Объекты взаимодействуют между собой через свои свойства, что порождает ситуации. Ситуации - это взаимосвязи, выражающие взаимоотношения между объектами. Ситуации в предметной области описываются посредством высказываний о предметной области с использованием исчисления высказываний и исчисления предикатов , т.е. формальной, математической логики. Например, высказывание "Программист и менеджер есть служащие компании" описывает отношение включения. Таким образом, вся информация об объектах и сущностях предметной области описывается с помощью утверждений на естественном языке.

Методы математической логики позволяют формализовать эти утверждения и представить их в виде, пригодном для анализа.

Пример. Рассмотрим высказывание: Студент Иванов А.А, родился в 1982 году. Оно выражает следующие свойства объекта "Иванов А.А.":

  • в явном виде - год рождения;
  • в неявном - принадлежность к студентам.

Первое свойство устанавливает связь между объектами "Иванов А.А." и "Год рождения", а второе - между объектами "Иванов А.А." и "Множество студентов". Формализация этого высказывания представляется как результат присваивания значений переменным, входящим в предикаты:

ЯВЛЯЕТСЯ СТУДЕНТОМ (Иванов А.А.)

Отметим, что в семантике естественных языков ситуация и взаимосвязь считаются почти синонимами. Ситуация содержит высказывание об объектах предметной области , которому можно приписать некоторую оценку истинности и представить в виде предиката после введения переменных. Таким образом, совокупность высказываний о предметной области можно трактовать как определение информационного пространства для базы данных .

На рис. 2.2 представлен один из подходов к классификации ситуаций в рамках предметной области .

Различают статические и динамические ситуации. Примерами статических ситуаций являются такие ситуации, как иметь цвет, иметь возраст. Примерами динамических ситуаций являются такие ситуации, как создать утюг, выпечь хлеб.

Обратите внимание на то, что ситуация также может представлять собой объект (см. рис. 2.1) и обладать свойствами. С другой стороны, приведенная классификация рассматривает свойства как специальный случай ситуаций. Подобная коллизия порождает неоднозначность при моделировании предметной области базы данных . Поставим вопрос - что есть цвет автомобиля? Объект , свойство, ситуация? К обсуждению этого вопроса мы вернемся специально в следующей лекции.

Приведенная классификация вводит в предметную область два важных аспекта - пространство и время, причем время и как момент, и как интервал . Предметная область существует в пространстве и во времени, т.е. ей присущи, как и реальному миру, временные и пространственные отношения и связи. Следует отличать реальное время внешнего мира и его отражение в базе данных и в источниках информации. В базе данных взаимосвязи, зависящие от времени, фиксируются только после их регистрации в базе данных. Таким образом, предметная область в каждый конкретный момент времени представляет собой выделенную совокупность определенных объектов и ситуаций, называемую состоянием предметной области (или снимком).

Введем определение предметной области .

Определение. Предметная область - это целенаправленная первичная трансформация картины внешнего мира в некоторую умозрительную картину, определенная часть которой фиксируется в ИС в качестве алгоритмической модели фрагмента действительности.

Понятие предметной области было введено в начале 80-х годов прошлого века, когда учеными в области ИС была осознана необходимость использовать семантические модели для представления информации в компьютерных системах. Так же как требования к компьютерной системе формируются средствами естественного языка, так и информация в компьютерных системах представляется средствами особого языка с определенной семантикой. Такой подход впервые был представлен П. Ченом в 1976 году.

Выше уже отмечалось, что для решения задач с использованием данных (как набора конкретных значений атрибутов), определяющих содержимое базы данных, сами данные должны быть полностью осмыслены и истолкованы, то есть отображать требуемую информацию о предметной области, что возможно только в случае определения связей между отдельными фактами (данными).

Таким образом, модель предметной области представляет собой структурную модель, причем необходимо, чтобы в этой модели информационной системы были определены способы отображения сущностей, атрибутов и связей на структуры данных,

Однако, выделение объектов, их свойств и ассоциаций являются необходимым, но не достаточным условием существования модели предметной области. Для пользователей информационной системы важно, чтобы отображение объектов реального мира было однозначным и непротиворечивым. В этом случае говорят, что база данных должна удовлетворять условию целостности. Для того, чтобы гарантировать корректность и взаимную непротиворечивость данных, на базу данных накладываются некоторые ограничения, которые называют ограничениями целостности,то есть указывают условия, которым должны отвечать значения элементов данных, характеризующие объекты и связи (например, год рождения служащего не должен начинаться с 17..). В дальнейшем будут рассмотрены различные виды ограничения целостности.

Итак, модель предметной области – это описание структуры предметной области вместе с совокупностью связанных с ней ограничений целостности (статическая модель).Динамическая модель включает, кроме того, описание поведения сущностей и связей каждого типа.

Учитывая сформулированные ранее определения БД и понятие модели, можно сказать, что:

Определение 4.БД – это созданная и поддерживаемая в вычислительной среде статическая или динамическая модель предметной области, представленная управляемой совокупностью именованных данных, отображающей состояния объектов и их отношений во внешнюю память ЭВМ.

Замечание. Как и всякая модель, БД отображает определенный взгляд на предметную область.

Однако, выделенных компонент БД как модели предметной области недостаточно для разрешения проблемных ситуаций и достижения поставленных целей. Решение задач возможно только при наличии набора операций, которые могут обрабатывать содержимое БД (ее элементы).

Таким образом, мы приходим к общему понятию модели данных, которая должна включать следующие компоненты:

· допустимую организацию данных,

· семантические ограничения целостности,

· множество допустимых операций.

Очевидно, что множество допустимых операций зависит от инструментария конкретной СУБД, в рамках которой реализуется модель предметной области.

Итак, модель данныхможно определить как совокупность правил структурирования данных в базах данных, допустимых операций над ними и ограничений целостности, которым они должны удовлетворять.

Замечание. В модели данных могут учитываться не все виды ограничений целостности, например, в ней нельзя учесть результаты некорректного выполнения коллективных запросов к информационному хранилищу.

Обратим внимание на то, что понятие модели данных можно рассматривать в двух аспектах:

· как инструментарий СУБД (средства описания данных и манипулирования ими),

· как результат моделирования.

Результирующую модель обычно называют моделью базы данных. Заметим при этом, что функции моделей в этих аспектах существенно различаются. В настоящее время термин модель базы данных считается устаревшим (хотя он в литературе и встречается), под моделью данных принято понимать инструментарий СУБД, а конечным результатом моделирования в рамках выбранной СУБД являются схемы базы данных разных уровней (см. п.3.3).

КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ВТОРОМУ РАЗДЕЛУ

1. Дайте определение следующим базовым понятиям: данные, элемент данных, атрибут, объект, предметная область.

2. Что определяет семантику объекта.

3. Сформулируйте определение базы данных, исходя из понятия предметной области.

4. Дайте определения понятиям: проблема, проблемная ситуация, цель, проблемная среда.

5. Дайте общее определение понятию системы. Приведите основные свойства системы как объекта исследования.

6. Дайте общее определение понятию модели. В чем отличительная особенность модели от других видов систем. Перечислите системные свойства модели.

7. Сформулируйте определение базы данных как модели предметной области.

8. Сформулируйте понятие модели данных. Какие составляющие должны быть определены в модели, чтобы ее можно было рассматривать как модель данных.

9. В чем отличие модели предметной области и поддерживаемой инструментарием СУБД определенной модели данных.

ПОНЯТИЕ О БАНКЕ ДАННЫХ

Структура банка данных

Термин “Банк данных” в литературе трактуется по-разному. В нашем рассмотрении под банком данных (БнД) будет подразумеваться информационная система, в которой база данных выступает как информационное ядро. В этой трактовке БнД можно определить как систему языковых, алгоритмических, программных, организационных и технических средств, обеспечивающих централизованное создание и поддержку совокупности коллективно используемых данных, а также сами данные, существующие в форме одной или нескольких баз данных. Структуру такого БнД можно представить следующей схемой (рис.5.).

Конечным пользователем(или просто пользователем, потребителеминформации) является лицо (или коллектив), в интересах которого в БнД накапливается и хранится информация, необходимая для принятия решений (управленческого, научного, конструктивного характера и т.п.). Конечный пользователь рассматривается как непрограммирующий пользователь, который для решения своих задач может использовать БнД либо непосредственно через терминал ЭВМ, либо с помощью специалистов.

Коллектив специалистов включает категории разработчиков, ответственных за создание и ведение (поддержку, эксплуатацию) БнД.

СУБД (система управления базой данных)– сложная программная система накопления данных в БД и последующего манипулирования ими в интересах конечных пользователей. Каждой прикладной программе (ПП) или конечному пользователю СУБД возвращает только те данные из БД, которые необходимы для удовлетворения пришедшего запроса, причем в требуемой форме.

Рис. 5. Общая структура банка данных

ПП (прикладные программы) – комплекс прикладных программ (приложений), определяемых проблемной средой. Каждая из прикладных программ предназначена для решения определенной задачи (или класса задач), возникшей в ходе профессиональной деятельности конечных пользователей.

СС (словари-справочники) – вспомогательные информационные структуры, используемые СУБД для работы с БД. Управление содержимым БД осуществляется СУБД на основании точной и полной информации о данных, хранящихся в БД. Эта информация, часто называемая метаданными, включает описание:

· смысла (семантики) элементов данных,

· способових использования,

· правил и ограничений.

Заметим, что термин метаданные рассматривается с точки зрения функционирования СУБД: применительно к предметной области и проблемной среде (прикладным программам) эта информация рассматривается как соответствующие виды знаний. Метаданные позволяют проводить анализ требований конечных пользователей по новым данным, проектирование и программирование новых прикладных систем, сопровождение существующих приложений и документирование всех этапов развития БД. К основным функциям словарей-справочников можно отнести:

· хранение описателей сущностей, их атрибутов, связей, и т.д.,

· осуществление простого и эффективного управления элементами данных при вводе в систему как новых элементов, так и при изменении описания существующих,

· уменьшение избыточности,

· устранение противоречивости данных,

· централизация управления элементами данных с целью упрощения проектирования БД и ее расширения.

· установление связи между пользователями БД.

Важную роль в решении перечисленных проблем играет стандартизация имен, форматов, описаний элементов и структур данных. При автоматизированном ведении словаря-справочника решение этих проблем упрощается.

Словари-справочники обычно организуются в виде нескольких физических баз данных с логическими связями между ними.

Организационный аспект

Коллектив специалистов, обеспечивающий разработку и функционирование БнД, включает администратораБД, аналитиков, системныхи прикладных программистов.На рис.6. показано их взаимодействие между собой и конечными пользователями.

КП– задача конечного пользователя.

Администратор базы данных.Как и каждый общезначимый ресурс, БД требует отдельного управления, причем:

· БД требует управления для обеспечения ее повседневной эксплуатации,

· БД развивается, отвечая изменениям в потребностях предприятия, и требуется управление ее развитием,

· БД и технология ее разработки и развития являются объектами высокой сложности, требующими специальных знаний, высокого уровня квалификации и строгой дисциплины разработки и эксплуатации.

Функция управления БД получила название "администрирование базы данных", а лицо, ответственное за администрирование БД,получило название"Администратор базы данных",илиАБД.

АБД – это специалист, имеющий представление об информационных потребностях конечных пользователей, работающий в тесном контакте с ними и отвечающий за анализ потребностей пользователей.

Классический набор функций, выполняемых АБД, включает:

· организационное и техническое планирование БД,

· проектирование БД,

· обеспечение поддержки разработок прикладных программ,

· управление эксплуатацией БД.

При этом от непосредственного управления данными отстраняются программисты, выполняющие конкретные прикладные разработки, пользователи, которые не должны изменять или даже видеть не принадлежащие им данные, и другие сотрудники.

Очевидно, что необходимость концепции администратора была осознана в период перехода от файловых структур к системам баз данных. Более подробно роль АБД на этапах планирования и проектирования рассматриваются в разделе 4.

Системные программисты занимаются созданием базового программного обеспечения. Генерируют операционную систему, в рамках которой предполагается функционирование СУБД, саму СУБД, необходимые компиляторы и обслуживающие утилиты.

Аналитики, используя знания закономерностей определенной проблемной среды, строят ее математическую модель, привлекая необходимый математический инструментарий. Основная функция аналитика – представить задачу КП в форме некоторой формальной модели (“погрузить” задачу пользователя в математическую модель его проблемной области). Конечная цель аналитика – исходное представление задачи для прикладного программиста.

Прикладной программистпреобразует продукт деятельности аналитика в форму прикладной программы, предназначенной для реализации на ЭВМ.

Читайте также: