Базы данных и базы знаний реферат

Обновлено: 02.07.2024

Введение …….…………………………………………………….. 5
1 База Данных 6
1.1. Базы данных и системы управления базами данных. …. ….. 6
1.2. Классификация БД и СУБД. …………………….…………..… 8
1.3. Состав СУБД и работа БД….……………………………………..
1.4. Свойства полей базы данных……….………………………
1.5. Типы данных……………………………………………………….
1.6. Безопасность баз данных…………………………………………..
2. База знаний
2.1. Основные понятия ………………. ………………..……..…….
2.2. Классификация баз знаний………………………………………
2.3. Система управления базами данных…. …..……….….…..….
2.4. Модели представления знаний…..……….………………..…….
2.5. Применение баз знаний…..………………………………..……
ЗАКЛЮЧЕНИЕ .
БИБЛИОГРАФИЧЕСКИЙ СПИСОК .

Работа состоит из 1 файл

курсовая.docx

1.4. Свойства полей базы данных ……….………………………

1.6. Безопасность баз данных…………………………………………..

2.2. Классификация баз знаний………………………………………

2.3. Система управления базами данных…. …..……….….…..….

2.4 . Модели представления знаний…..……….………………..…….

В силу все более широкого распространения персональных компьютеров важность организации информации в виде баз данных и баз знаний непрерывно возрастает.

Наше время трудно представить жизнь и работы средних и крупных предприятий без информационных систем, а в основу информационных систем входит базы данных и конечно система управления ими. Основным принципом организации базы данных является совместное хранение данных и их описаний.

Цель курсовой работы – выявление сущности понятий базы данных и базы знаний.

В первой главе данной курсовой работы рассматривается база данных, основные ее понятия, классификация, система управления базами данных – представлены функции, структура и основные характеристики СУБД, также описывается типы данных, их безопасность, и для каких целей предназначены база данных.

Вторая глава посвящена базам знаний, их сущности, даны основные понятия, классификация, система управления базами знаний и для каких целей они предназначены. Показано, чем базы данных отличается от базы знаний. Так же приведены модели представления знаний, при помощи которых строятся экспертные системы.

  1. БАЗА ДАННЫХ
    1. Базы данных и системы управления базами данных

    Организованная человеком совокупность данных во внешней памяти компьютера, предназначенная для длительного хранения и постоянного использования, называется базой данных. База данных представляет собой совокупность наборов данных. Объединение информации в базу данных это уже информационная модель некоторого объекта. Она используется при обработке информации об этом объекте.

    Предшественниками компьютерных баз данных являются таблицы, каталоги, телефонные книги, календари, карты, атласы и многие другие виды справочных изданий и документов.

    База данных (от греческого – основание) - именованная совокупность данных, отображающих состояние объектов и их отношений в рассматриваемой предметной области.

    Организуется так, что данные собираются однажды и централизованно хранятся (и модифицируются) в виде, доступном всем специалистам или системам программирования, которые могут их использовать. Особенности организации данных в Базе данных обеспечивают использование одних и тех же данных в различных приложениях, позволяют решать различные задачи планирования, исследования и управления.

    Базы данных сводят к минимуму дублирование данных, прибегая к дублированию только для ускорения доступа к данным или для обеспечения восстановления базы данных при ее разрушении.

    Одна из важных черт Базы данных – независимость данных от особенностей программ прикладных, которые ее используют, а также возможность создания этих программ в такой форме, что изменение особенностей хранения, логической структуры или значений данных не требует изменения программ их обработки.

    Другой важной чертой Базы данных является возможность изменения физических особенностей хранения данных без изменения их логической структуры. Функционирование Базы данных обеспечивается совокупностью языковых и программных средств, называемых системой управления базами данных (СУБД).

    Системы управления базами данных обеспечивают:

    • Определение данных, подлежащих хранению в Базе данных (определение логических свойств данных, соответствующих представлениям пользователя и называемых структурами данных в Базе данных, а так же физическая организация хранения данных, называемая структурами хранения Базы данных);
    • Первоначальную загрузку данных в Базу данных - так называемое создание Базы данных;
    • Обновление данных;
    • Доступ к данным по различным запросам пользователя, отбор и извлечение некоторой части Базы данных, редактирование извлеченных данных и выдачу их пользователю.

    Перечисленные действия принято называть процессом получения справок из Базы данных. Специальные средства СУБД обеспечивают секретность данных, то есть защиту данных от неправомочного воздействия, и целостность данных – защиту от непредсказуемого взаимодействия конкурентных процессов, приводящих к случайному или преднамеренному разрушению данных, а также от отказов оборудования.

    Важным аспектом Базы данных, обусловливающим спектр возможных использований, является допустимый в ней класс структур данных, задаваемых определением типов используемых структур и способами композиции структур. Для большинства современных СУБД можно выделить ряд базовых или порождающих типов структур, из которых по определенным правилам композиции могут конструироваться остальные используемые в базе данных структуры.

    Определение структуры данных называется схемой Базы данных. Схема составляется на языке определения данных и обычно соотносит данным имена и свойства, устанавливает отношения между ними и другими.

    Обработка данных, извлекаемых по запросам пользователей, обычно производится с помощью языков программирования. Чаще всего это КОБОЛ, Fox, SQL и так далее. Взаимодействие языка программирования с Базой данных осуществляется с помощью специально включаемых в него средств, называемых языками манипулирования данными, позволяющих обращаться к Базе данных в терминах используемого языка. Многие Базы данных допускают взаимодействие с прикладными программами, написанными на одном из множества допустимых языков программирования. Причем, каждая область использования Базы данных устанавливает так называемую подсхему данных – определение используемой части Базы данных с точки зрения использующего её приложения.

    Современные идеи в построении Базы данных сконцентрированы в трех наиболее известных моделях данных – модели данных иерархической, модели данных реляционной и модели данных сетевой.

    Классификация – разделение множества на подмножества по неформально предложенному признаку. В силу многогранности баз данных и СУБД (комплекса технических и программных средств для хранения, поиска, защиты и использования данных) имеется множество классификационных признаков. Классификация БД по основным из них приведена на рис. 1.2. Отдельно следует классифицировать системы управления базами данных (рис. 1.3). Базы данных могут классифицироваться и с точки зрения экономической:

    • по условиям предоставления услуг – бесплатные и платные (бесприбыльные, коммерческие);
    • по форме собственности – государственные, негосударственные;
    • по степени доступности – общедоступные, с ограниченным кругом пользователей.

    1.3 Состав СУБД и работа БД

    Следует отметить, что исторически для системы управления базой данных сложились три языка:

    2) язык манипулирования данными (ЯМД) – для заполнения БД данными и операций обновления (запись, удаление, модификация);

    3) язык запросов – язык поиска наборов величин в файле в соответствии с заданной совокупностью критериев поиска и выдачи затребованных данных без изменения содержимого файлов и БД (язык преобразования критериев в систему команд).

    В настоящее время функции всех трех языков выполняет язык SQL, относящийся к классу языков, базирующихся на исчислении кортежей (единиц информации), языки СУБД FoxPro, Visual Basic for Application (СУБД Access) и т.д.

    Вместе с тем сохранились и языки запросов, например язык запросов по примеру Query By Example (QBE) класса исчисления доменов. С помощью языков БД создаются приложения, базы данных и интерфейс пользователя, включающий экранные формы, меню, отчеты. При создании БД на базе СУБД FoxPro эти элементы (объекты) фиксируются в отдельных файлах, которые, в свою очередь, сосредоточиваются в одном файле, называемом проектом. После отработки БД проект преобразуется в приложение. В СУБД Access все созданные объекты размещаются в одном файле.

    Для работы с созданной БД пользователю или администратору БД следует иметь перечень файлов-таблиц с описанием состава их данных (структуры, схемы). Для этого создается специальный файл, называемый словарем данных (депозитарием, словарем-справочником, энциклопедией). Описание БД относится к метаинформации.

    В качестве технических средств могут выступать супер- или персональные компьютеры с соответствующими периферийными устройствами.

    Организационно-методические средства – это совокупность инструкций, методических и регламентирующих материалов, описаний структуры и процедуры работы пользователя с СУБД и БД.

    Пользователей, возможно, разделить на две основные категории: конечные пользователи и администраторы баз данных.

    Особо следует поговорить об администраторе базы данных (АБД). Естественно, что база данных строится для конечного пользователя (КП). Однако первоначально предполагалось, что КП не смогут работать без специалиста-программиста, которого назвали администратором базы данных. С появлением СУБД они взяли на себя значительную часть функций АБД, особенно для БД с небольшим объемом данных. Однако для крупных централизованных и распределенных баз данных потребность в АБД сохранилась. В широком плане под АБД понимают системных аналитиков, проектировщиков структур данных и информационного обеспечения, проектировщиков технологии процессов обработки, системных и прикладных программистов, операторов, специалистов в предметной области и по техническому обслуживанию. Иными словами, в крупных базах данных это могут быть коллективы специалистов.

    База знаний — совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе управления базами знаний используются методы искусственного интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.

    Содержание

    Введение 3
    База знаний 4
    Процесс построения баз знаний 5
    Модели представления знаний 6
    Продукционные модели 6
    Логические модели 7
    Семантические сети или сетевые модели 8
    Фреймовые модели 9
    Система управления базами знаний 10
    Заключение 12
    Список использованных источников 13

    Прикрепленные файлы: 1 файл

    Реферат Базы знаний.docx

    МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

    ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

    Кафедра электронных приборов

    Студент: Аяганов Н. Ш.

    Преподаватель: Невейко Е. Н.

    Процесс построения баз знаний 5

    Модели представления знаний 6

    Продукционные модели 6

    Логические модели 7

    Семантические сети или сетевые модели 8

    Фреймовые модели 9

    Система управления базами знаний 10

    Список использованных источников 13

    Введение

    Знания отличаются от данных рядом существенных свойств:

    База знаний

    База знаний — совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе управления базами знаний используются методы искусственного интеллекта, специальные языки описания знаний, интеллектуальный интерфейс.

    Машины, реализующие алгоритмы искусственного интеллекта, называются машинами, основанными на знаниях, а подраздел теории искусственного интеллекта, связанный с построением экспертных систем, — инженерией знаний.

    Знания о предметной области, ее объектах и закономерностях описываются на некотором формальном языке, называемом языком представления знаний. При этом, язык представления знаний должен обеспечивать не только возможность формальной записи знаний, но и необходимую обработку элементов этой записи. Совокупность знаний, хранящаяся во внешней памяти ЭВМ, называется системой знаний. Над ней производятся различные операции: поиск необходимой информации, ее модификация, интерпретация знаний, вывод новых знаний на основе имеющихся и т.д. Организация интеллектуальных компьютерных систем работы со знаниями, в той или иной прикладной области, зависят не только от специфики самих систем, но и в существенной мере от используемых языков представления знаний и метода хранения системы знаний в ЭВМ. В современных системах искусственного интеллекта знания хранятся в специальных базах данных — базах знаний. Существует самая непосредственная аналогия между понятиями модель данных, используемая в технологии баз данных и понятием способ представления знаний в технологии баз знаний. Грубо говоря, можно сказать, что если базы данных содержит собственно данные о некоторой предметной области, то базы знаний содержит как сами данные, так и описание их свойств.

    Процесс построения баз знаний

    Процесс построения баз знаний на основе информации эксперта состоит из трех этапов:

    • описание предметной области;
    • выбор способа и модели представления знаний;
    • приобретение знаний.

    Сам процесс построения баз знаний достаточно сложен, как правило, плохо структурирован и носит итеративный характер, заключающийся в циклической модификации баз знаний на основе результатов ее тестирования. На первом шаге построения баз знаний четко очерчивается предметная область, на решение задач из которой ориентируется проектируемая экспертная система, т.е. инженер знаний определяет область применения будущей системы и класс решаемых ею задач. В перечень работ данного шага входят:

    • определение характера решаемых экспертной системой задач и основных понятий, объектов предметной области, а также отношений между ними;
    • установление специфических особенностей предметной области;
    • выбор модели представления знаний.

    После решения первых двух вопросов инженер знаний формально описывает предметную область на языке представления знаний, т.е. создает модель представления знаний. В настоящее время универсальный способ представления знаний отсутствует, поэтому инженер знаний должен максимально учитывать специфику исходной предметной области. Полученная после формализации предметной области база знаний может быть уже конкретно реализована программными средствами, например, на язык вычислительных устройств таких, как Pascal, C, Prolog, Fortran, Forth и др.

    Модели представления знаний

    Во многих случаях для принятия решений в той или иной области человеческой деятельности неизвестен алгоритм решения, т.е. отсутствует четкая последовательность действий, заведомо приводящих к необходимому результату.

    Совокупность знаний нужных для принятия решений, принято называть предметной областью или знаниями о предметной области.

    В любой предметной области есть свои понятия и связи между ними, своя терминология, свои законы, связывающие между собой объекты данных предметной области, свои процессы и события. Кроме того, каждая предметная область имеет свои методы решения задач.

    Решая задачи такого вида на ЭВМ, используют информационные системы, ядром которых являются базы знаний, содержащие основные характеристики предметных областей.

    При построении баз знаний традиционные языки, основанные на численном представлении данных, являются неэффективными. Для этого используются специальные языки представления знаний, основанные на символьном представлении данных. Они делятся на типы по формальным моделям представления знаний:

      • продукционные модели;
      • логические модели;
      • семантические сети или сетевые модели;
      • фреймовые модели.

      Продукционные модели

      Основные достоинства систем, основанных на продукционных моделях, связаны с простотой представления знаний и организации логического вывода. К недостаткам таких систем можно отнести следующее: отличие от структур знаний, свойственных человеку; неясность взаимных отношений правил; сложность оценки целостного образа знаний; низкая эффективность обработки знаний.

      При разработке небольших систем проявляются в основном положительные стороны продукционных моделей знаний, однако при увеличении объёма знаний более заметными становятся слабые стороны.

      Логические модели

      Основная идея при построении логических моделей знаний заключается в следующем — вся информация, необходимая для решения прикладных задач, рассматривается как совокупность фактов и утверждений, которые представляются как формулы в некоторой логике. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода.

      Семантические сети или сетевые модели

      Однозначное определение семантической сети в настоящее время отсутствует. В инженерии знаний под ней подразумевается граф, отображающий смысл целостного образа. Узлы графа соответствуют понятиям и объектам, а дуги – отношениям между объектами.

      Семантическая сеть как модель наиболее часто используется для представления декларативных знаний. С помощью этой модели реализуются такие свойства системы знаний, как интерпретируемость и связность, в том числе по отношениям IS-A и PART-OF. За счет этих свойств семантическая сеть позволяет снизить объем хранимых данных, обеспечивает вывод умозаключений по ассоциативным связям.

      Одной из первых известных моделей, основанных на семантической сети, является TLC-модель (Teachaple Languge Compre-hender — доступный механизм понимания языка), разработанная Куиллианом в 1968 году. Модель использовалась для представления семантических отношений между концептами (словами) с целью описания структуры долговременной памяти человека в психологии.

      Фреймовые модели

      Фреймовая модель основана на концепции Марвина Мински (Marvin Minsky) — профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания.

      Фреймы образуют иерархию. Иерархия во фреймовых моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами процедур, присоединенных к фрейму и вызываемых при его актуализации.

      Фреймы подразделяются на:

      • фрейм-экземпляр — конкретная реализация фрейма, описывающая текущее состояние в предметной области;
      • фрейм-образец — шаблон для описания объектов или допустимых ситуаций предметной области;
      • фрейм-класс — фрейм верхнего уровня для представления совокупности фреймов образцов.

      Состав фреймов и слотов в каждой конкретной фреймовой модели может быть разный, однако в рамках одной системы целесообразно единое представление для устранения лишнего усложнения.

      В целом фреймовая модель допускает представление всех свойств декларативных и процедурных знаний. Глубина вложенности слотов во фрейме (число уровней) зависит от предметной области и языка, реализующего модель.

      Под базами данных понимаются технологии ввода, систематизации, хранения и предоставления информации с использованием компьютерной техники. Базы данных могут включать в состав информационного массива раз­личную статистическую, текстовую, графическую и иллюстративную информа­цию в неограниченном объеме с обязательной ее формализацией (представлением, вводом и выводом в компьютер определенной, характерной для данной системы форме - формате).

      1. Базы данных. Базы знаний.
      2. Практика реализации идей.
      ВложениеРазмер
      lekciya_no5.docx 182.51 КБ
      prilozhenie_no7.docx 41.26 КБ
      zaklyuchenie.doc 35 КБ
      trenazher.ppt 451.5 КБ

      Предварительный просмотр:

      1. Базы данных. Базы знаний.
      2. Практика реализации идей.

      Под базами данных понимаются технологии ввода, систематизации, хранения и предоставления информации с использованием компьютерной техники. Базы данных могут включать в состав информационного массива раз личную статистическую, текстовую, графическую и иллюстративную информа цию в неограниченном объеме с обязательной ее формализацией (представлением, вводом и выводом в компьютер определенной, характерной для данной системы форме - формате). Для целого ряда традиционно перерабатываемой информации существуют стандартные форматы ее представления, например: библиография, статистические данные, рефераты, обзоры и другие. Систематизация и поиск ин формации в базе данных осуществляются тремя основными способами.

      Иерархическая база данных в качестве классификационной основы ис пользует каталоги и рубрикаторы, т.е. информационно-поисковые языки иерархического типа.

      В реляционной базе данных каждой единице информации присваиваются определенные атрибуты (автор, ключевые слова, регион, класс информации и т.п.) и ее поиск производится по какому-либо из них или по их комбинации.

      Статистические базы данных оперируют с числовой информацией, организованной с помощью двухмерной (реже - трехмерной) матрицы, так, что информация находится в системе путем задания ее координат. Статистическиe базы данных более известны под названием электронные таблицы.

      В практике создания баз данных, содержащих тексто - графическую информацию , ее систематизация чаще всего осуществляется гибридно.

      Базы данных используются в обучении для оперативного предоставления учителю и учащимся необходимой, не вошедшей в учебники и пособия информации, как непосредственно в дидактическом процессе, так и в режиме свободного выбора информации самим пользователем (сервисный режим).

      Базы знаний. Базы знаний представляют собой информационные системы, содержащие замкнутый, не подлежащий дополнению объем информации по данной теме, структурированной таким образом, что каждый ее элемент содержит ссылки и другие логически связанные с ним элементы из их общего набора. Ссылки на элементы, не содержащиеся в данной базе знаний, не допускаются. Такая организация информации в базе знаний позволяет учащемуся изучать ее в той логике, которая ему наиболее предпочтительна в данный момент, т. к. он может по своему желанию легко переструктурировать информацию при знакомстве с ней. Привычным библиографическим аналогом базы знаний являются энциклопедии и словари, где в статьях содержатся ссылки на другие статьи этого же издания. Программные продукты, реализующие базы знаний, относятся к классу HIPERMEDIA сверхсреда), поскольку они позволяют не только осуществлять свободный выбор пользователем логики ознакомления с информацией, но дают возможность сочета ть тексто-графическую информацию со звуком, видео- и кинофрагментами, мультипликацией. Компьютерная техника, способная работать в таком режиме, объединяется интегральным термином MULTIMEDIA (многовариантная среда).

      Аппаратные средства multimedia, наряду с базами знаний позволили создать и использовать в учебном процессе компьютерные имитации, микромиры и на их базe дидактические и развивающие игры, вызывающие особый интерес у детей.

      Приложение Access позволяет создавать, просматривать и редактировать базы данных. Применительно к физике можно создать базу данных о знаменитых физиках, наличии оборудования и наглядных пособий в кабинете физики. Такая информация позволяет учителю оперативно находить и использовать данные об известных физиках, включать её на уроке и во внеклассной работе.

      На рисунке показан фрагмент базы данных о кинофильмах в школьном кабинете физики.

      Основные методы работы с Access описаны в приложении 7.

      Работа с учебной базой данных УЧЕНИК.

      Итак, перед вами довольно простая база данных, которой может пользоваться даже непрофессионал и которая вполне может быть частью автоматизированного рабочего места учителя, классного руководителя, директора или завуча школы.

      В этой базе данных содержатся следующие сведения об учениках школы:

      • Информация о братьях и сестрах: год рождения имя

      (Можно внести и другие: успеваемость по предметам, данные о родителях и т. д.)

      1. Выберите пункт меню "Список с сортировкой и поиском по фамилиям" (с помощью клавиш управления курсором установите рамочку на этом пункте меню и нажмите клавишу ).

      Перед тем как начать поиск, машина в большинстве случаев выдает запрос, касающийся того, какую информацию вы хотите получить: обо всех классах, данные о которых есть в базе, или только об одном конкретном классе. Исключение составляет лишь поздравление с днем рождения. Здесь поиск всегда ведется по всей базе.

      Естественно, такой запрос сразу же появился.

      2. Укажите, что вас интересует один класс. Затем наберите на клавиатуре номер этого класса и (перемещая курсор) выберите соответствующую букву. Далее, как говорится, возможны варианты.

      Если в базе данных уже имеются сведения об учениках нужного вам класса (бывших или нынешних), то вы сразу же получите долгожданный список.

      Правила работы с ним просты:

      • Чтобы перейти к нужной записи, используйте клавиши или (перемещение на одну запись), а также
      клавиши

      ("перелистывание" текста на экране вверх и вниз соответственно); для перехода к самой
      первой записи нажмите одновременно клавиши и

      , а для перехода к самой последней записи — клавиши
      и

      1. Чтобы найти запись по первым буквам (или цифрам), надо просто набрать эти символы на клавиатуре. Нужные записи появятся в самом верху экрана.
      2. Чтобы добавить новую запись, надо нажать клавишу (при этом на экране появится ОКНО ВВОДА ИНФОРМАЦИИ, и вам будет предложено, используя это окно, ввести новую информацию).
      3. Чтобы убрать запись из базы данных, надо нажать клавишу (вам будет предложено подтвердить, что запись должна быть удалена).
      4. Чтобы внести изменения в старую запись, надо нажать клавишу .
      5. В любой момент молено воспользоваться палочкой-выручалочкой — клавишей .

      Если же в базе данных сведений об учащихся выбранного вами класса нет, сразу же произойдет переход в режим ввода новой записи (как если бы вы нажали клавишу ).

      3. При вводе новой информации вам время от времени будет предлагаться помощь в виде уже готового списка видов спорта или увлечений (тут от вас требуется лишь выбрать нужные данные и нажать клавишу ).

      В эти списки можно вносить изменения точно так же, как в списки учеников. Единственное отличие — в использовании клавиши . Как вы уже должны были понять из изложенного ранее, с помощью данной клавиши осуществляется перенос, скажем, наименования вида спорта или увлечения в запись, относящуюся к какому-либо конкретному ученику. А что если ошибка была допущена еще при внесении наименования в список? Что же, теперь вся школа будет "Прыгать в длену" или "Увликаться фудболом" ? Конечно, нет.

      Однако здесь, чтобы получить возможность внести исправления, надо нажать не одну клавишу , обычно используе мую для изменения данных, а две клавиши одновременно: и .

      Добавим, что для "путешествия" по пунктам меню вам потребуется еще клавиша , с помощью которой осуществля ется возврат на шаг назад.

      Теперь выполните задания:

      © Проверьте, совпадают ли в базе данных сведения, касающиеся вашего класса, с тем, что есть на самом деле, и если нет — внесите изменения или создайте базу данных заново.

      © Занесите в базу данных результаты последних спортивных соревнований в вашем классе. Если это сделают и для осталь ных классов, то легко будет определить чемпиона школы.

      © Не забывайте — и здесь вам тоже поможет база данных — поздравлять с днями рождения.

      © Если в базе данных уже достаточно много информации, выясните, какие имена в вашей школе встречаются наиболее часто.

      © Придумайте еще несколько задач, которые можно решить с помощью этой базы данных.

      * Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

      Базы знаний как современные интеллектуальные информационные системы

      Содержание

      1 Общие положения

      1.1 Классификация баз знаний

      1.2 Применение баз знаний

      2 Интеллектуальная информационная система

      2.1 Классификация задач, решаемых ИИС

      3 Базы знаний в интеллектуальной системе

      3.1 Машинное обучение

      3.1.1 Общая постановка задачи обучения по прецедентам

      3.1.2 Способы машинного обучения

      3.1.3 Классические задачи решаемые с помощью машинного обучения

      3.1.4 Типы входных данных при обучении

      3.1.5 Типы функционалов качества

      3.1.6 Практические сферы применения

      3.2 Автоматическое доказательств

      Введение

      База знаний, БЗ (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

      Под базами знаний понимается совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информация. Например, в языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.

      Обобщенные сведения в языке Пролог задаются с помощью правил логического вывода, выполняющих роль определения понятий, а также логических процедур, состоящих из наборов правил логического вывода. Достоверность обобщенных сведений зависит от наличия необходимых фактов и достоверности данных в базах знаний.

      Наиболее важный параметр БЗ — качество содержащихся знаний. Лучшие БЗ включают самую релевантную, достоверную и свежую информацию, имеют совершенные системы поиска информации и тщательно продуманную структуру и формат знаний.

      1. Общие положения

      1.1 Классификация баз знаний

      В зависимости от уровня сложности систем, в которых применяются базы знаний, различают:

      1) БЗ всемирного масштаба — например, Интернет или Википедия

      2) БЗ национальные — например, Википедия

      3) БЗ отраслевые— например, Автомобильная энциклопедия

      4) БЗ организаций

      5) БЗ экспертных систем

      6) БЗ специалистов

      1.2 Применение баз знаний

      Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

      Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.

      База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации.

      Создание и использование систем искусственного интеллекта потребует огромных баз знаний.

      2. Интеллектуальная информационная система

      Интеллектуальная информационная система (ИИС) — это один из видов автоматизированных информационных систем, иногда ИИС называют системой, основанных на знаниях. ИИС представляет собой комплекс программных, лингвистических и логико-математических средств для реализации основной задачи: осуществление поддержки деятельности человека и поиска информации в режиме продвинутого диалога на естественном языке.

      ИИС могут размещаться на каком-либо сайте, где пользователь задает системе вопросы на естественном языке (если это вопросно-ответная система) или, отвечая на вопросы системы, находит необходимую информацию (если это экспертная система). Но, как правило, ЭС в интернете выполняют рекламно-информационные функции (интерактивные баннеры), а серьезные системы (такие, как, например, ЭС диагностики оборудования) используются локально, так как выполняют конкретные специфические задачи.

      Для разработки ИИС раньше использовались логические языки (Пролог, Лисп и т. д.), а сейчас используются различные процедурные языки. Логико-математическое обеспечение разрабатывается как для самих модулей систем, так и для состыковки этих модулей. Однако на сегодняшний день не существует универсальной логико-математической системы, которая могла бы удовлетворить потребности любого разработчика ИИС, поэтому приходится либо комбинировать накопленный опыт, либо разрабатывать логику системы самостоятельно. В области лингвистики тоже существует множество проблем, например, для обеспечения работы системы в режиме диалога с пользователем на естественном языке необходимо заложить в систему алгоритмы формализации естественного языка, а эта задача оказалась куда более сложной, чем предполагалось на заре развития интеллектуальных систем. Еще одна проблема — постоянная изменчивость языка, которая обязательно должна быть отражена в системах искусственного интеллекта.

      2.1 Классификация задач, решаемых ИИС

      1) Интерпретация данных. Это одна из традиционных задач для экспертных систем. Под интерпретацией понимается процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Обычно предусматривается многовариантный анализ данных.

      6) Планирование. Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции. В таких ЭС используются модели поведения реальных объектов с тем, чтобы логически вывести последствия планируемой деятельности.

      8) Управление. Под управлением понимается функция организованной системы, поддерживающая определенный режим деятельности. Такого рода ЭС осуществляют управление поведением сложных систем в соответствии с заданными спецификациями.

      9) Поддержка принятия решений. Поддержка принятия решения — это совокупность процедур, обеспечивающая лицо, принимающее решения, необходимой информацией и рекомендациями, облегчающие процесс принятия решения. Эти ЭС помогают специалистам выбрать и/или сформировать нужную альтернативу среди множества выборов при принятии ответственных решений.

      В общем случае все системы, основанные на знаниях, можно подразделить на системы, решающие задачи анализа, и на системы, решающие задачи синтеза. Основное отличие задач анализа от задач синтеза заключается в том, что если в задачах анализа множество решений может быть перечислено и включено в систему, то в задачах синтеза множество решений потенциально не ограничено и строится из решений компонент или под-проблем. Задачами анализа являются: интерпретация данных, диагностика, поддержка принятия решения; к задачам синтеза относятся проектирование, планирование, управление. Комбинированные: обучение, мониторинг, прогнозирование.

      3. Базы знаний в интеллектуальной системе

      Ниже перечислены интересные особенности, которые могут (но не обязаны) быть у интеллектуальной системы, и которые касаются баз знаний.

      2) Автоматическое доказательство (вывод): Способность системы выводить новые знания из старых, находить закономерности в БЗ. Некоторые авторы считают, что БЗ отличается от базы данных наличием механизма вывода.

      3) Интроспекция: Нахождение противоречий, нестыковок в БЗ, слежение за правильной организацией БЗ.

      3.1 Машинное обучение

      Машинное обучение (англ. Machine Learning) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Различают два типа обучения. Обучение по прецедентам, или индуктивное обучение, основано на выявлении закономерностей в эмпирических данных. Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде базы знаний. Дедуктивное обучение принято относить к области экспертных систем, поэтому термины машинное обучение и обучение по прецедентам можно считать синонимами.

      Машинное обучение находится на стыке математической статистики, методов оптимизации и дискретной математики, но имеет также и собственную специфику, связанную с проблемами вычислительной эффективности и переобучения. Многие методы индуктивного обучения разрабатывались как альтернатива классическим статистическим подходам. Многие методы тесно связаны с извлечением информации, интеллектуальным анализом данных.

      3.1.1 Общая постановка задачи обучения по прецедентам

      Данная постановка является обобщением классических задач аппроксимации функций. В классических задачах аппроксимации объектами являются действительные числа или векторы. В реальных прикладных задачах входные данные об объектах могут быть неполными, неточными, нечисловыми, разнородными. Эти особенности приводят к большому разнообразию методов машинного обучения.

      3.1.2 Способы машинного обучения

      Так как раздел машинного обучения, с одной стороны, образовался в результате разделения науки о нейросетях на методы обучения сетей и виды топологий архитектуры сетей, а с другой, вобрал в себя методы математической статистики, то указанные ниже способы машинного обучения исходят из нейросетей. То есть базовые виды нейросетей, такие как перцептрон и многослойный перцептрон (а так же их модификации) могут обучаться как с учителем, без учителя, с подкреплением, и активно. Но некоторые нейросети и большинство статистических методов можно отнести только к одному из способов обучения. Поэтому если нужно классифицировать методы машинного обучения в зависимости от способа обучения, то, касательно нейросетей, не корректно их относить к определенному виду, а правильнее классифицировать алгоритмы обучения нейронных сетей.

      - Метод коррекции ошибки

      - Метод обратного распространения ошибки

      - Метод ближайших соседей

      4) Активное обучение - отличается тем, что обучаемый алгоритм имеет возможность самостоятельно назначать следующую исследуемую ситуацию, на которой станет известен верный ответ:

      6) Трансдуктивное обучение (transduction) - обучение с частичным привлечением учителя, когда прогноз предполагается делать только для прецедентов из тестовой выборки

      3.1.3 Классические задачи решаемые с помощью машинного обучения

      - Классификация как правило, выполняется с помощью обучения с учителем на этапе собственно обучения.

      - Кластеризация как правило, выполняется с помощью обучения без учителя

      - Регрессия как правило, выполняется с помощью обучения с учителем на этапе тестирования, является частным случаем задач прогнозирования.

      - Понижение размерности данных и их визуализация выполняется с помощью обучения без учителя

      - Восстановление плотности распределения вероятности по набору данных

      - Одноклассовая классификация и выявление новизны

      - Построение ранговых зависимостей

      3.1.4 Типы входных данных при обучении

      - Признаковое описание объектов — наиболее распространённый случай.

      - Описание взаимоотношений между объектами, чаще всего отношения попарного сходства, выражаемые при помощи матрицы расстояний, ядер либо графа данных

      - Временной ряд или сигнал.

      - Изображение или видеоряд.

      3.1.5 Типы функционалов качества

      При обучении без учителя - функционалы качества могут определяться по-разному, например, как отношение средних межкластерных и внутрикластерных расстояний.

      При обучении с подкреплением - функционалы качества определяются физической средой, показывающей качество приспособления агента.

      3.1.6 Практические сферы применения

      Целью машинного обучения является частичная или полная автоматизация решения сложных профессиональных задач в самых разных областях человеческой деятельности.

      - Машинное обучение имеет широкий спектр приложений:

      - Распознавание рукописного ввода

      - Прогнозирование временных рядов

      - Биржевой технический анализ

      - Предсказание ухода клиентов

      Сфера применений машинного обучения постоянно расширяется. Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении. Возникающие при этом задачи прогнозирования, управления и принятия решений часто сводятся к обучению по прецедентам. Раньше, когда таких данных не было, эти задачи либо вообще не ставились, либо решались совершенно другими методами.

      3.2 Автоматическое доказательство

      Автоматическое доказательство— доказательство, реализуемое программно. В основе лежит аппарат математической логики. Используются идеи теории искусственного интеллекта. Процесс доказательства основывается на логике высказываний и логике предикатов.

      Логика высказываний (или пропозициональная логика) — это формальная теория, основным объектом которой служит понятие логического высказывания. С точки зрения выразительности, её можно охарактеризовать как классическую логику нулевого порядка. Логика высказываний является простейшей логикой, максимально близкой к человеческой логике неформальных рассуждений и известна ещё со времён античности.

      Логика первого порядка (исчисление предикатов) — формальное исчисление, допускающее высказывания относительно переменных, фиксированных функций, и предикатов. Расширяет логику высказываний. В свою очередь является частным случаем логики высшего порядка.

      Читайте также: