Каковы основные инфологические модели баз данных охарактеризуйте их кратко

Обновлено: 02.07.2024

Инфологическая модель (информационно-логи­ческая модель) — ориентированная на человека и не зависимая от типа СУБД модель предметной области , определяющая совокупности информационных объектов, их атрибутов и отношений между объектами, динамику изменений предметной области, а также харак­тер информационных потребностей пользователей . Инфологическая модель предметной области может быть описана моделью "сущность — связь" (моделью Чена ), в основе которой лежит деление реального мира на отдель­ные различимые сущности, находящиеся в определенных связях друг с другом, причем обе категории — сущность и связь полагаются первичными, неопределенными по­нятиями. Модель представляется в виде схемы (Е — К .- схемы ), на которой прямоугольниками отображаются имена типов сущностей, ромбами — имена типов соотно­шений между сущностями, овалами — имена атрибутов [178].

Даталогические модели — модели данных, ориентированные на выбранный тип СУБД: внутренняя, концептуальная, внешняя .

Внутренняя модель — модель данных низшего (физического) уровня в архитектуре СУБД, отражающая представление данных во внешней памяти и методы до­ступа к ним .

Внешняя модель — модель данных внешнего уровня в архитектуре СУБД, отражающая представление пользователя о базе данных (подсхема базы данных и ее описание) .

Концептуальная модель — информационная модель предметной области в терминах конкретной СУБД, содержащая полный набор данных и связей между ними. В архитектуре СУБД представляет промежуточный между внешним и внутренним уровень .

Схема базы данных — описание даталогических моделей в терминах СУБД (часто используется как си­ноним модели данных).

Основные этапы, на которые разбивается процесс проектирования базы данных информационной системы:

Концептуальное проектирование - сбор, анализ и редактирование требований к данным. Для этого осуществляются следующие мероприятия:

- обследование предметной области, изучен ие ее и нформационной структуры

- выявление всех фрагментов, каждый из которых харакетризуется пользовательским представлением, информационными объектами и связями между ними, процессами над информационными объектами

- моделирование и интеграция всех представлений

По окончании данного этапа получаем концептуальную модель, инвариантную к структуре базы данных. Часто она представляется в виде модели "сущность-связь". Представление аналитика (сущности, атрибуты, связи).

Логическое проектирование - преобразование требований к данным в структуры данных. На выходе получаем СУБД-ориентированную структуру базы данных и спецификации прикладных программ. На этом этапе часто моделируют базы данных применительно к различным СУБД и проводят сравнительный анализ моделей.

Представление программиста (записи, элементы данных, связи между записями).

Физическое проектирование - определение особенностей хранения данных, методов доступа и т.д.

Представление администратора (группирование данных, индексы, методы доступа).

Инфологическая модель (информационно-логическая модель) — ориентированная на человека и не зависимая от типа СУБД модель предметной области, определяющая совокупности информационных объектов, их атрибутов и отношений между объектами, динамику изменений предметной области, а также характер информационных потребностей пользователей. Инфологическая модель предметной области может быть описана моделью "сущность—связь" (моделью Чена), в основе которой лежит деление реального мира на отдельные различимые сущности, находящиеся в определенных связях друг с другом, причем обе категории — сущность и связь полагаются первичными, неопределенными понятиями.

Содержание

Цель инфологического моделирования

  • обеспечение наиболее естественных для человека способов сбора и представления той информации, которую предполагается хранить в создаваемой базе данных. Поэтому инфологическую модель данных пытаются строить по аналогии с естественным языком (последний не может быть использован в чистом виде из-за сложности компьютерной обработки текстов и неоднозначности любого естественного языка). Основными конструктивными элементами инфологических моделей являются сущности, связи между ними и их свойства (атрибуты).

Основные понятия

  • Сущность – любой различимый объект (объект, который мы можем отличить от другого), информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, самолеты, рейсы, вкус, цвет и т.д. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородных личностей, предметов, событий или идей, выступающих как целое. Экземпляр сущности относится к конкретной вещи в наборе. Например, типом сущности может быть ГОРОД, а экземпляром – Москва, Киев и т.д.
  • Атрибут – поименованная характеристика сущности. Его наименование должно быть уникальным для конкретного типа сущности, но может быть одинаковым для различного типа сущностей (например, ЦВЕТ может быть определен для многих сущностей: СОБАКА, АВТОМОБИЛЬ, ДЫМ и т.д.). Атрибуты используются для определения того, какая информация должна быть собрана о сущности. Примерами атрибутов для сущности АВТОМОБИЛЬ являются ТИП, МАРКА, НОМЕРНОЙ ЗНАК, ЦВЕТ и т.д. Здесь также существует различие между типом и экземпляром. Тип атрибута ЦВЕТ имеет много экземпляров или значений: Красный, Синий, Банановый, Белая ночь и т.д., однако каждому экземпляру сущности присваивается только одно значение атрибута.

Абсолютное различие между типами сущностей и атрибутами отсутствует. Атрибут является таковым только в связи с типом сущности. В другом контексте атрибут может выступать как самостоятельная сущность. Например, для автомобильного завода цвет – это только атрибут продукта производства, а для лакокрасочной фабрики цвет – тип сущности.

  • Ключ – минимальный набор атрибутов, по значениям которых можно однозначно найти требуемый экземпляр сущности. Минимальность означает, что исключение из набора любого атрибута не позволяет идентифицировать сущность по оставшимся. Для сущности Расписание ключом является атрибут Номер_рейса или набор: Пункт_отправления, Время_вылета и Пункт_назначения (при условии, что из пункта в пункт вылетает в каждый момент времени один самолет).
  • Связь – ассоциирование двух или более сущностей. Если бы назначением базы данных было только хранение отдельных, не связанных между собой данных, то ее структура могла бы быть очень простой. Однако одно из основных требований к организации базы данных – это обеспечение возможности отыскания одних сущностей по значениям других, для чего необходимо установить между ними определенные связи. А так как в реальных базах данных нередко содержатся сотни или даже тысячи сущностей, то теоретически между ними может быть установлено более миллиона связей. Наличие такого множества связей и определяет сложность инфологических моделей.

Требования, предъявляемые к инфологической модели

  • Адекватное, отображение предметной области
  • Недопущение неоднозначной трактовки модели
  • Четкое определение моделируемой предметной области (конечность модели)
  • Легкая расширяемость, обеспечивающая ввод новых данных без изменения ранее определенных, то же относят и к удалению данных
  • Возможность композиции и декомпозиции модели в связи с большой размерностью реальных инфологических моделей
  • Легкое восприятие различными категориями пользователей; желательно, чтобы инфологическую модель строил (или хотя бы участвовал в ее создании) специалист, работающий в данной предметной области, а не только проектировщик систем машинной обработки данных
  • Применимость языка спецификаций модели как при ручном, так и при автоматизированном проектировании информационных систем

Компоненты инфологической модели

  • Описание объектов и связей между ними, называемой ER-моделью (расшифровывается как модель "Сущность-связь")
  • Описание информационных потребностей пользователей
  • Алгоритмические связи атрибутов
  • Лингвистические отношения, обусловленные особенностями обображения предметной области в языковой среде
  • Ограничения целостности


Построение модели "Объект - свойтво - отношение"

Классы объектов

В предметной области в процессе ее обследования и анализа выделяют классы объектов. Классом объектов называют совокупность объектов, обладающих одинаковым набором свойств. Например, если в качестве предметной области рассмотреть вуз, то в ней можно выделить следующие классы объектов: учащиеся, преподаватели, аудитории и т. д. Объекты могут быть реальными, как названные выше, а могут быть и абстрактными, как, например, предметы, которые изучают студенты.

При описании предметной области надо изобразить каждый из существующих классов объектов и набор свойств, фиксируемый для объектов данного класса.

Будем использовать для отображения объектов и их свойств следующие обозначения.


При построении инфологической модели желательно дать словесную интерпретацию каждой сущности, особенно если возможно неоднозначное толкование понятия.

Связи между объектом и его свойствами

При описании предметной области надо отразить связи между объектом и характеризующими его свойствами. Это изображается просто в виде линии, соединяющей обозначение объекта и его свойств.

Кроме того, некоторые свойства являются постоянными, их значение не может измениться с течением времени. Назовем такие свойства статическими, а те свойства, значение которых может изменяться со временем, будем называть динамическими.


При изображении связи условного свойства с объектом будем использовать пунктирную линию, а для обозначения динамических и статических свойств будем использовать буквы D и S над соответствующей линией.

Связи между объектами

Кроме связи между объектом и его свойствами, в инфологической модели фиксируются связи между объектами разных классов. Различают связи типа:



Предположим, что предметной областью является завод, некоторые сотрудники которого знают иностранный язык, но ни один из них не владеет более чем одним языком. Естественно, что имеется много языков, которыми не владеет ни один из сотрудников, а также что некоторые из сотрудников владеют одним и тем же иностранным языком.





Пусть предметная область будет та же, что и в предыдущем случае, но имеют место ситуации, что некоторые абитуриенты знают несколько иностранных языков. В этом случае связь между объектами будет иметь тип М: М.



Предположим, что предметной областью является некоторый лингвистический институт, в котором каждый из сотрудников обязательно знает несколько иностранных языков, и по каждому из известных науке языков в этом институте имеется хотя бы один специалист, владеющий им.



Простые и сложные объекты

Выделяют несколько разновидностей сложных объектов: составные объекты, обобщенные объекты и агрегированные объекты.

Сравнение методик построения ER-моделей

ER-модели очень широко используются в практике проектирования баз данных. Причем они используются как при ручном, так и при автоматизированном проектировании. Методики графического представления ER-моделей несколько различаются в разных системах автоматизации проектирования и в разных литературных источниках.

Далее мы рассмотрим особенности представления ER-моделей в трех наиболее известных системах автоматизации проектирования (CASE-системах): Prokit*WORKBENCH, Desing/IDEF и CASE ORACLE, а также в некоторых литературных источниках.

Можно выделить несколько категорий различий в изображении ER-моделей.

1. Несущественные различия, связанные с использованием разных условных обозначений для отображения одних и тех же сущностей. Так, для обозначения объекта могут использоваться прямоугольники, блоки с закругленными углами, овалы и т. д.

Следующая совокупность различий связана со способом изображения связей между объектами и заданием имен связей. Так, в некоторых методиках для изображения связи в разъеме линии, отображающей эту связь, предлагается изображать ромб и внутри него или рядом с ним писать название связи (модель Чена). Так как связи являются двусторонними, то наименование связи будет меняться в зависимости от того, с какой стороны ее рассматривать. Поэтому часто в ИЛМ предлагается указывать оба этих названия (например, в системах CASE ORACLE, Prokit). Причем для того, чтобы было понятно, к какому из направлений связи какое название относится, принимают определенные соглашения о том, как располагать эти названия на схемах. Например, сверху линии помещать названия, относящиеся к левой стороне связи, а под линией — к правой. Наличие такого большого числа обозначений и подписей загромождает модель. Кроме того, само присвоение названий часто представляет некоторую трудность, что увеличивает трудоемкость инфологического моделирования. Поэтому в тех случаях, когда это не приводит к двусмысленностям и неясностям, если это позволяет система, можно рекомендовать не использовать особые обозначения и имена для связей.

Разные условные обозначения используются и для изображения типа связи (1:1, 1 : М, М:М). Некоторые системы автоматизации проектирования, например Prokit, предоставляют пользователю возможность выбрать из множества возможных обозначений те, которые ему больше нравятся или более привычны. В этой системе для обозначения вида связей между объектами могут использоваться следующие условные обозначения .



Используемые в CASE ORACLE обозначения более удобны, так как если объект участвует в большом количестве связей, то дополнительные прямоугольники с точками становится неудобно располагать на рисунке.

В Desing IDEF характер членства в связи изображается, как показано на рисунке.


Как следует из сравнения рисунков, изображение обобщенных объектов в сравниваемых методиках различается не только по форме представления. Так, если объект классифицируется по разным признакам, то при использовании первого из рассмотренных способов изображения обобщенных объектов наглядно видно, по какому признаку осуществляется классификация. Второй же способ изображения не обеспечивает этого. Другими словами, предложенный в начале главы способ изображения обобщенных объектов является семантически более содержательным, информативным.



3. Кроме различия в изображении тех или иных сущностей, в теории инфологического моделирования наблюдается расхождение в используемой терминологии. Например, в CASE ORACLE родовой объект называется супертип (syper-type), а видовой — подтип (sub-type). Таких различий в терминологии можно привести много, но это не является сейчас нашей целью.

4. Следующий круг различий связан с пространственным изображением тех или иных компонентов ИЛМ. Например, свойства объекта иногда не отображаются на той же схеме, что объекты и связи между ними, а их описания выполняются отдельно. Часто «писание свойств представляют в табличной или иной аналитической форме, а не в графическом виде.

ИЛМ даже для небольшой и несложной предметной области включает в себя описание значительного числа компонентов и связей между ними. При этом встает проблема наглядности общей схемы. Эта проблема по-разному решается при ручном и автоматизированном построении инфологической модели. В автоматизированных системах чаще всего строится единое изображение ER-модели и используется прием масштабирования, когда, уменьшая или увеличивая масштаб изображения, на экране можно посмотреть как всю схему, так и отдельный ее фрагмент.

Различные приемы используются и для того, чтобы уменьшить число пересечений линий на схеме. Так, в системе Prokit для этих целей допускается дублирование изображения объекта и размещение этого дубля рядом с тем объектом, с которым его надо связать. Для того чтобы показать, что это не новый объект, используется какое-либо условное обозначение, например, у соответствующих блоков отчеркивается уголок.

При ручном проектировании изобразить всю ER-модель в виде единой схемы обычно не представляется возможным. В этом случае можно порекомендовать следующий прием: изобразить и описать каждый объект самостоятельно, присвоить каждому объекту короткий код. Используя эти кодовые обозначения, для каждого объекта указать его связи с другими объектами.

5. Некоторые возможности, имеющиеся в одних системах или методиках, отсутствуют в других. В этих случаях возможны различные варианты: а) для изображения ситуации используются возможности, предоставляемые моделью, но это требует применения определенных приемов, часто несколько искусственных, для их представления; б) ситуация просто не отображается в модели.

Например, во многих системах инфологического моделирования предполагается, что свойства у объекта могут быть только единичными. В этом случае каждое множественное свойство следует представлять как самостоятельный объект и изображать связь между этим вновь введенным объектом и исходным объектом.

В IDEF свойства объекта могут быть только единичные и всегда определенные (не условные). Если свойство может отсутствовать у каких-либо объектов, то надо выделять отдельные сущности, например, ШТАТНЫЙ СЛУЖАЩИЙ с атрибутом ОКЛАД и ПОЧАСОВИК, не имеющий такого атрибута. Это приведет к необходимости выделения большого числа объектов и связей в ИЛМ, к снижению наглядности модели. Например, отдельные экземпляры объекта ЛИЧНОСТЬ могут иметь или не иметь ученое звание, ученую степень, год окончания вуза и многих других признаков. По каждому из этих признаков придется выделять подклассы.

Некоторые методики не вводят агрегированный объект как самостоятельную категорию. В этом случае агрегированный объект изображается как простой, при этом пользователь должен предварительно определить его идентификатор и свойства. Если модель допускает изображение только двоичных связей, то проектировщик должен преобразовать n-арную связь в совокупность бинарных.

Кроме указанных сложностей при определении идентификатор ра агрегированной сущности, могут возникнуть и проблемы при переходе от ИЛМ к даталогической модели.

Вариант, когда ситуация не может быть отражена в ИЛМ, может быть проиллюстрирован на следующем: если методика построения модели не предполагает фиксацию класса членства в связи, то эта информация будет просто потеряна.

В предметной области могут быть сущности, идентификаторы которых являются зависимыми от идентификатора какого-то другого объекта. Например, если участки на предприятии нумеруются в пределах цеха, то идентификатор участка будет составным, включающим в себя код цеха и код участка. В инфологической модели можно ограничиться указанием этого составного идентификатора. Некоторые методики построения ER-моделей (например, методология IDEFIX, Prokit) предусматривают введение особых видов сущностей и особых видов отношений для отображения подобных ситуаций. Так, в IDEF сущность, для идентификации которой надо рассматривать ее отношение с другими сущностями; называется зависимой от идентификатора сущностью, и для ее изображения используется блок с закругленными углами. Для изображения же не зависимой от идентификации сущности используется прямоугольник. Для связи объектов, один из которых нужен для полной идентификации другого, вводится понятие идентифицирующего отношения. Для него также вводится свое условное обозначение. В IDEF для идентифицирующего отношения используется сплошная линия, а для неидентифицирующего пунктирная.

И тот, и другой подход имеет право на существование. Принципиальной разницы, влекущей за собой какие-то существенные последствия, в сравниваемых подходах нет.

Основой базы данных является модель данных. Информационно-логическая (инфологическая) модель предметной области отражает предметную область в виде совокупности информационных объектов и их структурных связей.

Информационный объект – это описание некоторой сущности (явления, реального объекта, процесса) в виде совокупности логически связанных реквизитов. Например, информационный объект Студент описывает некоторую сущность – студент. Реквизитный состав этого информационного объекта, т.е. его структура, следующий: № группы. ФИО, № зачетной книжки, Дата рождения. Информационный объект имеет множество реализаций – экземпляров.

Пример инфологической модели:


В инфологической модели объекты могут быть связаны друг с другом. Существуют следующие типы информационных связей:

многие ко многим.

Связь один к одному предполагает, что одному экземпляру первого информационного объекта соответствует только один экземпляр второго информационного объекта и наоборот. Графически такая связь изображается следующим образом:


Связь один ко многим предполагает, что одному экземпляру первого информационного объекта соответствует несколько экземпляров второго объекта. Графически эта связь отображается так:


Связь многие ко многим предполагает, что одному экземпляру первого информационного объекта соответствует несколько экземпляров второго объекта и наоборот. Графическое изображение этой связи:


Различают модели данных трех типов:

Иерархическая (древовидная) модель данных представляет собой иерархию элементов, называемых узлами. Узел – это совокупность атрибутов данных, описывающих информационный объект. На самом верхнем уровне имеется только один узел – корень. Каждый узел кроме корня связан только с одним узлом на более высоком уровне, называемым исходным узлом для данного узла. Каждый узел может быть связан с одним или несколькими узлами более низкого уровня, называемыми порожденными (подчиненными). Узлы, не имеющие порожденных, называются листьями. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи базы данных существует только один путь.

Сетевая модель также основывается на понятиях узел, уровень, связь. Сетевая модель данных – это модель, в которой порожденный узел может иметь более одного исходного узла. В сетевой структуре любой элемент любого уровня может быть связан с любым другим элементом.

Реляционная модель данных - это множество взаимосвязанных двумерных таблиц. Каждая таблица содержит сведения об однородных объектах базы данных и обладает следующими свойствами:

каждый элемент таблицы представляет собой один элемент данных;

элементы одного столбца однородны;

каждый столбец имеет уникальное имя;

таблица не содержит двух и более одинаковых строк;

порядок следования строк и столбцов произвольный.

Такие таблицы называются реляционными. Данные могут извлекаться одновременно из нескольких таблиц. Это оказывается возможным, если установить между таблицами связи. Таблицы связываются между собой для того, чтобы, в конечном счете, уменьшить объем БД. Связь каждой пары таблиц обеспечивается при наличии в них одинаковых столбцов.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

На первом этапе проектирования базы данных, без привязки к конкретной модели данных, программным и лингвистическим средствам реализации, создается концептуальная модель, которая описывает круг информационных сущностей и связей между ними, а также требований к их допустимым значениям.

Предметная область — множество всех предметов, свойства и взаимоотношения которых рассматривает научная теория; часть реального мира, рассматриваемая в пределах оговоренного контекста; в логике — подразумеваемая область возможных значений предметных переменных логического языка.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Система хранения данных обычно может оперировать лишь данными определенных простых типов, поскольку не имеет представления о смысле хранящейся информации. Любая интерпретация возлагается на пользователя. Для хранения данных со множеством параметров, например, для системы учета личных данных сотрудников, для оцифровки книг учета библиотечных или музейных фондов, необходимы более сложные методы.

Чем важнее хранящаяся в базе данных информация, тем важнее профилактика и своевременное исправление ошибок, связанных с неспособностью системы быстро и точно выдать исчерпывающий список данных, соответствующих указанным пользователем атрибутам.

В концептуальных моделях баз данных сама система способна представлять семантику предметной области на высоком уровне абстракции — для этого выделяются ключевые сущности и описываются возможные связи между ними.

Концептуальная схема — семантическая сеть понятий и концепций, связанных друг с другом по определенным правилам.

Основные составляющие модели:

  • сущности, они же объекты;
  • атрибуты сущностей;
  • связи между ними.

Сущность в инфологической модели данных — объект, имеющий определенные атрибуты.

Характеристика связей и язык моделирования

Связи между ними обозначаются линиями и характеризуются классом принадлежности. Если каждый экземпляр сущности принимает участие в связи, то ее класс называется обязательным: \(\rightarrow\) .
Если не каждый — то необязательным: \(\dashrightarrow\) .

Кроме параметра обязательности и необязательности, связи можно разделить на:

  • направленные ( \(\rightarrow\) ) и ненаправленные (—);
  • односторонние ( \(\rightarrow\) ) и двусторонние ( \(\leftrightarrow\) );
  • равноправные ( \(\rightarrow\) ) и неравноправные ( \(\twoheadrightarrow\) ).

Для более объемных моделей с большим количеством элементов применяется язык инфологического моделирования, описывающий модель в текстовом виде.

Пример

СУЩНОСТЬ (атрибут 1, атрибут 2, …, атрибут n)
АССОЦИАЦИЯ [СУЩНОСТЬ S1, СУЩНОСТЬ S2, …]
(атрибут 1, атрибут 2, …, атрибут n)

Сколько видов связей возможно, описание

Связь между сущностями делится на четыре типа:

  1. 1:1 — в каждый момент времени одному экземпляру сущности А соответствует один или ноль экземпляров сущности Б.
  2. 1: М, один ко многим — одному экземпляру сущности А может соответствовать сколько угодно экземпляров сущности Б.
  3. М:1, многие к одному — многим экземплярам сущности А может соответствовать один или ноль экземпляров сущности Б.
  4. М: N, многие ко многим — многим экземплярам сущности А может соответствовать сколько угодно экземпляров сущности Б.
  1. Составляющую структуры — описание набора отношений между данными.
  2. Составляющую целостности — описание конкретных условий целостности отношений на уровне типов данных, на уровне отношений и на уровне всей базы.
  3. Составляющую манипулирования отношениями.

Реляционные модели всегда отвечают информационному принципу — это значит, что всю информацию в них представляют исключительно заданием значений атрибутов в кортежах отношений. Указатели или адреса, которые связывали бы значения друг с другом, отсутствуют.

Читайте также: