Реферат на тему инженерия знаний

Обновлено: 07.07.2024

1. Основные определения
2. История возникновения термина
3. Базы знаний.
4. Задачи инженерии знаний.

4.1 Анализ предметной и проблемной областей.
4.2 Приобретение знаний.

4.2.1 Выявление источников знаний.
4.2.2 Автоматизация процесса сбора знаний.

4.3 Представление знаний.

4.3.1 Модели представления знаний.
4.3.2 Выбор способа представления знаний.

4.4 Поиск и хранение знаний.

5. Методы инженерии знаний
6. Ссылки по теме

Основные определения

Инженерия знаний представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний – это теория, методология и технология, которые охватывают методы добычи, анализа, представления и обработки знаний экспертов.

Представление знаний, их обработка и использование, рассматриваемые применительно к конкретной прикладной области, являются предметом инженерии знаний.

На высоком уровне, процесс инженерии знаний состоит из двух:

С областью инженерии знаний тесно связано понятие искусственного интеллекта (ИИ).

Сущностью искусственного интеллекта (ИИ) можно считать научный анализ и автоматизацию интеллектуальных функций человека. Однако для большинства проблем общая реальность – трудность их машинного воплощения. Исследования по ИИ позволили утвердиться во мнении, что подлинно необходимым для решения проблем являются знания экспертов, т.е. если создать систему, способную запоминать и использовать знания экспертов, то она найдет применение в практической деятельности. [1]

История возникновения термина

Инженерия знаний тесно связана со всем процессом разработки интеллектуальных информационных систем в целом и экспертных систем (ЭС) в частности – от возникновения замысла до его реализации и совершенствования.

Базы знаний

Знания — совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:

  • информация, подвергшаяся преобразованию в части выд еле ния сущностных зависимостей . Знание само задает контекст описания и является целостным описанием ситуации;
  • результаты обобщения информации и установления определенных закономерностей в какой-либо предметной области, которые позволяют ставить и решать задачи в этой области;
  • ресурс, базирующийся на практическом опыте специалистов и на информации, существующей на предприятии.

Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной прикладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).

Итак, База знаний — это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем. Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены. При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ. [1]


Задачи инженерии знаний

Анализ предметной и проблемной областей

Предметная область - сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.

Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.

При исследовании экономических систем и решаемых ими задач с целью формализации знаний в БЗ и работе необходимо учитывать специфику таких систем. Экономическим системам присуща динамичность функционирования, частая смена ситуаций, обновление больших массивов измерительных и других данных, характеризующих состояние объекта. Они часто функционируют в условиях полной определенности из-за действия случайных возмущающих факторов. [1]

Приобретение знаний

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации.

Классификация этапов обучения, соответствующих способностям компьютеров к формализации знаний:

А. Получение информации без логических выводов.

  1. Ввод программ.
  2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в виде знаний.

  1. Получение готового набора знаний, представленных во внутреннем формате.
  2. Получение знаний, представленных во внутреннем формате, в режиме диалога.
  3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

  1. Параметрическое обучение.
  2. Обучение на основе выводов по аналогии.
  3. Обучение на основе выводов по индукции – эвристическое обучение.

Г. Приобретение знаний на метауровне.

В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами знаний (инженерами по знаниям).

Итак, инженер по знаниям – это специалист по искусственному интеллекту, проектирующий и создающий Экспертную систему или другую информационную систему. [1]

Выявление источников знаний

Выявление источников знаний и работа с ними - основная задача инженера знаний.

Инженер знаний выполняет важные функции при разработке БЗ. Он должен хорошо ориентироваться в проблемной области и быть неплохим психологом, чтобы общаться с экспертом в процессе приобретения знаний. Вместе с тем он должен хорошо знать и возможности программного обеспечения компьютеров, чтобы структурировать знания для хранения и работы с ними. Основным источником знаний о проблемной области является человек-эксперт. Эксперт - специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области.

Инженер знаний работает с ним в режиме диалога или интервью и формирует необходимый объем знаний и сведений для работы с объектом. Возможно также использование опросников, которые затем соответствующим образом обрабатываются.

Табл.1 Методы извлечения знаний из предметного эксперта.

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте.

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач.

Представить эксперту ряд реалистических задач для решения вслух с целью выявить логические основания конкретных шагов рассуждения.

Попросить эксперта предоставить вам несколько задач для решения и с использованием правил, выявленных во время интервью.

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой.

Предоставить примеры, решенные экспертом и прототипом системы, другим независимым экспертам для сравнения и оценки.

Знания об объекте можно формировать путем использования статистической обработки информации и информации о результатах имитационных экспериментов.

Другим важным источником знаний является Интернет. Помимо традиционного поиска необходимой информации и знаний в Интернет, в настоящее время в процесс поиска знаний вовлекаются интеллектуальные агенты. [1]

Автоматизация процесса сбора знаний

Автоматизация извлечения знаний и запись их в БЗ. Неавтоматизированный сбор знаний специалистов трудоемкий процесс. В развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Автоматическая структуризация неформальных знаний, доступных в Интернет через распределенную гипермедиа систему – Web. Технология гипермедиа через Web обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко–машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы. Многие Web – механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам. Причина экспоненциального роста количества информации, обеспечиваемого через Web-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиа системах. Такая интеграция между технологией гипермедиа и методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний. [1]

Представление знаний

Важное место в системах управления знаниями занимает проблема представления знаний, являющаяся ключевой.

Существует также ряд общих для всех СПЗ проблем. К ним можно отнести,
в частности, проблемы:

Модели представления знаний

Модели представления знаний можно условно разделить на декларативные и процедурные.

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом оказываются раздельными синтаксические и семантические аспекты знания, что является достоинством указанных форм представления из-за возможности достижения их определенной универсальности.

В декларативных моделях не содержатся в явном виде описания выполняемых процедур. Эти модели представляют собой множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния.

Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

В процедурном представлении знания содержатся в процедурах небольших программах, которые определяют, как выполнять специфичные действия (как поступать в специфичных ситуациях).

При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий. При процедурном представлении знаний семантика непосредственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. [1]

Выбор способа представления знаний

Важным вопросом при создании БЗ является выбор способа представления знаний. Цель представления знаний — организация необходимой информации в такую форму, чтобы программа ИИ имела легкий доступ к ней для принятия решений, планирования, узнавания объектов и ситуаций, анализа сцен, вывода заключений и других когнитивных функций.

Основные типы моделей представления знаний применительно к процессу разработки БЗ:

  • При использовании логики предикатов первого порядка (дедуктивной логики) БЗ может рассматриваться как совокупность логических формул, которые обеспечивают частичное описание проблемной среды.
  • Семантические сети позволяют описывать свойства и отношения объектов событий, понятий, ситуаций или действий с помощью направленного графа, состоящего из вершин и помеченных ребер.
  • Фреймы представляют собой декларативно-процедурные структуры. Во многих фреймовых структурах возможна реализация наследственных отношений, при которых объекты могут наследовать атрибуты более абстрактных объектов. Такая форма организации знаний позволяет экономить объем памяти.
  • Продукционные модели (основанные на правилах вида Если-То) являются наиболее популярным способом представления знаний. При организации знаний с использованием продукционных моделей в БЗ содержатся правила продукций, а в БД содержится информация, которая отображает текущее состояние решаемой задачи. Инициализацию необходимого правила осуществляет блок управления.
  • Большие трудности возникают при создании моделей нечетких знаний.

Формализация таких знаний осуществляется на основе теории нечетких множеств. Развиваются также модели на основе искусственных нейронных сетей (ИНС), многоагентных систем, генетических алгоритмов и другие моделипредставления и обработки знаний. [1]

Поиск и хранение знаний

Поиcк и хранение необходимых знаний cвязаны c понятием корпоративной памяти, которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок, что является пока достаточно труднореализуемым на практике.
Корпоративная память хранит неоднородную информацию из различных иcточников и делает ее доступной пользователям для решения корпоративных задач.

Становится актуальной разработка модели представления знаний, которая обеспечивала бы автоматизированную обработку информации на cемантическом уровне в системах управления знаниями.

Большую популярность в последнее время приобретают онтологии. [1]

Методы инженерии знаний

В области инженерии знаний было созданы различные средства и модели, позволяющие эффективно управлять знаниями и их представлением. Рассмотрим некоторые из них на нашей странице, посвященной методам инженерии знаний.

Ссылки по теме

Базы знаний

При изучении интеллектуальных систем традиционно возникает вопрос — что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным

Методы инженерии знаний

Система - посредник, заключение договора на поставку.

Инженерия знаний - область информатики, в рамках которой проводятся исследования по представлению знаний в ЭВМ, поддержание их в актуальном состоянии и манипулировании ими.

Knowledge system - система основанная на знаниях.

СОЗ СБЗ СУБД ЭС ИС СИИ - система искусственного интеллекта.

Структура системы, основанной на знаниях.




БЗ механизм получения решения



БЗ - это модель, представляющая в ЭВМ знания, накопленные в определенной предметной области. Эти знания должны быть формализованы. Знания формируются с помощью модели, а затем представляются с помощью определенного языка.

В БЗ обычно выделяются знания о конкретных объектах и правила. Эти правила исполняются как механизм получения решений, для того, чтобы из исходных фактов вывести новые.

Интерфейс обеспечивает ведение диалога на языке, близком пользователю.

Методы, основанные на использовании логических выводов, часто используется в инженерии знаний.

Понятие предметной области.

Объект – то что существует или воспринимается в качестве отдельной сущности.

Основные свойства: дискретность; различие.

При представлении знаний используется прагматический подход, т.е. выделяются те свойства объекта, которые важны для решения задач, которые будет решать создаваемая система. Поэтому система, основанная на знаниях, имеет дело с предметами, которые являются абстрактными объектами. Предмет выступает в роли носителя некоторых свойств объекта. Состояние предметной области может меняться со временем. В каждый момент времени состояние предметной области характеризуется множеством объектов и связями. Состояние предметной области характеризуется ситуацией.



Концептуальные средства описания предметной области.

Концептуальная модель отражает наиболее общие свойства. Для того, чтобы детализировать описание нужны языки. Характерными чертами концептуальных средств описания предметной области являются абстрактность и универсальность. Их можно использовать для описания любой предметной области.

Понятие класса объекта.

Понятие объекта – понятие множеств. Сходные между собой объекты объединяются в классы. В разные моменты времени одному и тому же классу могут соответствовать разные множества объектов.

К – класс объекта.

К t – множество объектов класса К в момент времени t.







1 4 Геометрическая фигура, форма квадрат, цвет синий.


2 5


3

имя атрибут название



объектов атрибутная пара

Идентификация объектов может быть прямая и косвенная. В случае прямой используются имена объектов, порядковые номера объектов; косвенная основана на использовании свойств объектов.

Атрибут может быть компонентом. Под атрибутом понимается свойство, характеристика, название компонентов.

форма Геометрическая форма

Пары имя атрибута и значение атрибута часто совпадают.

Роли участников ситуации:

(К: А1 К12 К2 , … , Аn Кn ) – представление знаний в виде некоторой структуры.

(дата, число, день_месяца)

(дата, месяц, название_месяца)

(геометрическая_фигура, форма, геометрическая_форма)

(геометрическая_фигура, цвет, цвет)

Такому представлению знаний соответствует представление знаний в виде отдельных фактов.

Представления знаний об объектах делятся на:

- классы объекта (структура данных)

- знания о конкретных объектах (о данных)

Аi – имя атрибута

Кi – классы объекта, являются значением атрибута

(преподаватель, ФИО фамилия_с_инициалами,

преподаватель, должность преподпвательская_должность)

(преподаватель (фамилия_с_инициалами, преподпвательская_должность),

преподаватель (ФИО, должность))

Представление знаний для первой формы:

Атрибутивное представление знаний:

(преподаватель: - представляет собой

ФИО Семенов - некоторую структуру

Должность доцент) - данных

Представление знаний для второй формы:

Атрибутивное представление знаний в виде отдельных фактов:

(преподаватель1 , ФИО, Семенов) - 1 , 2 являются связками между

(преподаватель1 , должность, доцент) - фактами

(преподаватель2 , ФИО, Петров)

(преподаватель2 , должность, ассистент)

Представление знаний для третьей формы:

(преподаватель (Семенов, доцент) - позиционное представление знаний

Если имена атрибутов отсутствуют, а сами атрибуты записываются на определённых позициях, то – позиционноё представление знаний.

Для представления неточных значений используются коэффициенты уверенности – (объект, атрибут, значение, коэффициент уверенности).

(пациент1, диагноз, колит, К760)

0 – соответствует неопределенности.

отрицательное значение – степень уверенности в невозможности значения атрибута.




(пациент1, диагноз, гастрит, К740)

* (пациент, ФИО, Антонов, диагноз колит К760, гастрит К740)

Представление знаний о классе объекта называется минимальным, если при удалении одного из атрибутов приводит к тому, что оставшееся множество атрибутов перестает быть представлением данного класса объекта.

Аренда (объект_аренды, арендатор, арендодатель, срок_аренды, плата).

Представление знаний в реляционной базе данных.

Реляционная база данных – данные хранятся в позиционном формате.

Данные хранятся в виде таблицы, где название таблицы – имя класса. Каждому классу соответствует таблица или файл БД. Имя класса - название соответствующей таблицы. Имена атрибутов – соответствующие поля таблицы (столбец). Строки таблицы – записи БД. Записи соответствует запись в позиционном формате.

Инженерия знаний представляет собой совокупность моделей, методов и технических приемов, нацеленных на создание систем, которые предназначены для решения проблем с использованием знаний. Фактически инженерия знаний – это теория, методология и технология, которые охватывают методы добычи, анализа, представления и обработки знаний экспертов.

Представление знаний, их обработка и использование, рассматриваемые применительно к конкретной прикладной области, являются предметом инженерии знаний.

На высоком уровне, процесс инженерии знаний состоит из двух:

2. Внедрение знаний – преобразование организованных знаний в реализованные.

С областью инженерии знаний тесно связано понятие искусственного интеллекта (ИИ) .

Сущностью искусственного интеллекта (ИИ) можно считать научный анализ и автоматизацию интеллектуальных функций человека. Однако для большинства проблем общая реальность – трудность их машинного воплощения. Исследования по ИИ позволили утвердиться во мнении, что подлинно необходимым для решения проблем являются знания экспертов, т.е. если создать систему, способную запоминать и использовать знания экспертов, то она найдет применение в практической деятельности.

История возникновения термина

Инженерия знаний тесно связана со всем процессом разработки интеллектуальных информационных систем в целом и экспертных систем (ЭС) в частности – от возникновения замысла до его реализации и совершенствования.

Базы знаний.

Знания - совокупность сведений, понятий, представлений о чем-либо, полученных, приобретенных, накопленных в результате учения, опыта, в процессе жизни и т.д. и обычно реализуемых в деятельности. Более формальные определения применяемые обычно в рамках менеджмента знаний:

  • информация, подвергшаяся преобразованию в части выд

Представление знаний, их обработка и использование, рассматриваемое применительно к конкретной прикладной области, является предметом инженерии знаний. Коллекция совместно организованных знаний, относящихся к задачам, решаемым в системе искусственного интеллекта (ИИ), называется базой знаний (БЗ).

Итак, База знаний - это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом систем Искусственного интеллекта и Экспертных систем. Большинство БЗ ограничены в некоторой специальной, обычно узкой предметной области, в которой они сосредоточены. При создании БЗ технология ИИ позволяет встраивать в компьютер механизм и способности вывода, основывающиеся на фактах и отношениях, содержащихся в БЗ.

Задачи инженерии знаний.

Анализ предметной и проблемной областей.

Предметная область - сфера человеческой деятельности, выделенная и описанная согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду.

Проблемная область - комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых в производственной системе, и стоящих перед ней целях.

При исследовании экономических систем и решаемых ими задач с целью формализации знаний в БЗ и работе необходимо учитывать специфику таких систем. Экономическим системам присуща динамичность функционирования, частая смена ситуаций, обновление больших массивов измерительных и других данных, характеризующих состояние объекта. Они часто функционируют в условиях полной определенности из-за действия случайных возмущающих факторов.

Приобретение знаний.

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации.

Классификация этапов обучения, соответствующих способностям компьютеров к формализации знаний:

А. Получение информации без логических выводов.

1. Ввод программ.

2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в виде знаний.

1. Получение готового набора знаний, представленных во внутреннем формате.

2. Получение знаний, представленных во внутреннем формате, в режиме диалога.

3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

1. Параметрическое обучение.

2. Обучение на основе выводов по аналогии.

3. Обучение на основе выводов по индукции – эвристическое обучение.

Г. Приобретение знаний на метауровне.

В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами знаний (инженерами по знаниям).

Итак, инженер по знаниям – это специалист по искусственному интеллекту, проектирующий и создающий Экспертную систему или другую информационную систему.

Выявление источников знаний.

Инженер знаний выполняет важные функции при разработке БЗ. Он должен хорошо ориентироваться в проблемной области и быть неплохим психологом, чтобы общаться с экспертом в процессе приобретения знаний. Вместе с тем он должен хорошо знать и возможности программного обеспечения компьютеров, чтобы структурировать знания для хранения и работы с ними. Основным источником знаний о проблемной области является человек-эксперт. Эксперт - специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области.

Инженер знаний работает с ним в режиме диалога или интервью и формирует необходимый объем знаний и сведений для работы с объектом. Возможно также использование опросников, которые затем соответствующим образом обрабатываются.

Табл.1 Методы извлечения знаний из предметного эксперта.

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте.

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач.

Представить эксперту ряд реалистических задач для решения вслух с целью выявить логические основания конкретных шагов рассуждения.

Попросить эксперта предоставить вам несколько задач для решения и с использованием правил, выявленных во время интервью.

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой.

Предоставить примеры, решенные экспертом и прототипом системы, другим независимым экспертам для сравнения и оценки.

Знания об объекте можно формировать путем использования статистической обработки информации и информации о результатах имитационных экспериментов.

Другим важным источником знаний является Интернет. Помимо традиционного поиска необходимой информации и знаний в Интернет, в настоящее время в процесс поиска знаний вовлекаются интеллектуальные агенты.

Автоматизация процесса сбора знаний.

Автоматизация извлечения знаний и запись их в БЗ . Неавтоматизированный сбор знаний специалистов трудоемкий процесс. В развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Автоматическая структуризация неформальных знаний , доступных в Интернет через распределенную гипермедиа систему – Web. Технология гипермедиа через Web обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко–машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы. Многие Web – механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам. Причина экспоненциального роста количества информации, обеспечиваемого через Web-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиа системах. Такая интеграция между технологией гипермедиа и методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний.

Представление знаний.

Важное место в системах управления знаниями занимает проблема представления знаний, являющаяся ключевой.

Существует также ряд общих для всех СПЗ проблем. К ним можно отнести,

в частности, проблемы:

• приобретения новых знаний и их взаимодействие с уже существующими;

• организации ассоциативных связей;

• неоднозначности и выбора семантических примитивов;

• модульности и понимания;

• явности знаний и доступности;

• выбора соотношения декларативной и процедурной составляющих представления, что влияет на экономичность системы, полноту, легкость кодировки и понимания.

Модели представления знаний.

Модели представления знаний можно условно разделить на декларативные и процедурные.

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом оказываются раздельными синтаксические и семантические аспекты знания, что является достоинством указанных форм представления из-за возможности достижения их определенной

В декларативных моделях не содержатся в явном виде описания выполняемых процедур. Эти модели представляют собой множество утверждений. Предметная область представляется в виде

синтаксического описания ее состояния.

Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

В процедурном представлении знания содержатся в процедурах небольших программах, которые определяют, как выполнять специфичные действия (как поступать в специфичных ситуациях).

При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий. При процедурном представлении знаний семантика непосредственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений.

Выбор способа представления знаний.

Важным вопросом при создании БЗ является выбор способа представления знаний. Цель представления знаний — организация необходимой информации в такую форму, чтобы программа ИИ имела легкий доступ к ней для принятия решений, планирования, узнавания объектов и ситуаций, анализа сцен, вывода заключений и других когнитивных функций.

Основные типы моделей представления знаний применительно к процессу разработки БЗ:

При использовании логики предикатов первого порядка (дедуктивной логики) БЗ может рассматриваться как совокупность логических формул, которые обеспечивают частичное описание проблемной среды.

Семантические сети позволяют описывать свойства и отношения объектов событий, понятий, ситуаций или действий с помощью направленного графа, состоящего из вершин и помеченных ребер.

Фреймы представляют собой декларативно-процедурные структуры. Во многих фреймовых структурах возможна реализация наследственных отношений, при которых объекты могут наследовать атрибуты более абстрактных объектов. Такая форма организации знаний позволяет экономить объем памяти.

Продукционные модели (основанные на правилах вида Если-То) являются наиболее популярным способом представления знаний. При организации знаний с использованием продукционных моделей в БЗ содержатся правила продукций, а в БД содержится информация, которая отображает текущее состояние решаемой задачи. Инициализацию необходимого правила осуществляет блок управления.

Большие трудности возникают при создании моделей нечетких знаний.

Формализация таких знаний осуществляется на основе теории нечетких множеств. Развиваются также модели на основе искусственных нейронных сетей (ИНС), многоагентных систем, генетических алгоритмов и другие моделипредставления и обработки знаний.

Поиск и хранение знаний.

Пои c к и хранение необходимых знаний c вязаны c понятием корпоративной памяти , которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок, что является пока достаточно труднореализуемым на практике.

Корпоративная память хранит неоднородную информацию из различных и c точников и делает ее доступной пользователям для решения корпоративных задач.

Становится актуальной разработка модели представления знаний, которая обеспечивала бы автоматизированную обработку информации на c емантическом уровне в системах управления знаниями.

Большую популярность в последнее время приобретают онтологии.

Методы инженерии знаний

В области инженерии знаний было созданы различные средства и модели, позволяющие эффективно управлять знаниями и их представлением. Рассмотрим некоторые из них на нашей странице, посвященной методам инженерии знаний.

Ссылки по теме:

Книга "Управление знаниями корпорации и реинжиниринг бизнеса". Абдикеев Н.М., Киселев А.Д. Основными ресурсами развития компаний во все большей мере становятся люди и знания, которыми они обладают, интеллектуальный капитал и растущая профессиональная компетенция кадров. Сегодня требуются новые методы развития организации, основанные на стыке гуманитарного и инженерного подходов, что позволит получить синергетический эффект от их взаимодействия. Этот подход базируется на современных достижениях информационных технологий, а именно когнитивных технологиях развития организации. Актуально развитие симбиоза концепции управления знаниями, реинжиниринга, бизнес-процессов и когнитивной человеческой составляющей.

Сайт Новгородского Государственного Университета предоставляет статью на тему инженерии знаний. В статье представлен обзор некоторых теоретических аспектов получения знаний, рассматриваются практические методы получения знаний, а также информация о структурирование знаний.

Сайт Ульяновского Государственного Технического Университета. На странице представлены материалы по вопросу извлечения знаний. Приводится классификация некоторых методов извлечения знаний, а также их практическое применение.

Сайт, посвященный базам данных. На странице вводятся понятия знаний, информации, управление знаниями, познание и т.д. Также описаны некоторые возможности баз знаний, а также рассказывается об их практическом применении и проблемах, связанных с их использованием. Каждому понятию отведена отдельная веб-страница.

В статье рассматриваются вопросы построения, структурирования, описания, классификации и использования онтологических баз знаний. Приведен обзор современных исследований, посвященных различным аспектам создания и использования онтологии. Пристальное внимание в работе уделено разграничению формальных и лингвистических онтологий. Также, предложена достаточно подробная методология построения ресурсов онтологического типа.

Статья, повященная семантическим сетям. Описывается история создания семантических сетей, а также принципы построения и классификация.

Статья о когнитивных картах. Приводится несколько примеров использования когнитивных карт.

Материал из википедии. Статья о семантических сетях.

Сайт научно-исследовательского центра. Можно найти пример визуализации биохимической и биологической онтологии.

В статье дается обзор исследований в области инженерии знаний, описываются принципы и методы, а также два подхода, сформированные в данной области. Ссылка на статью в формате pdf содержится на веб-странице.


Статья посвящена важным теоретическим проблемам в области исследования искусственного интеллекта, а именно теоретическим аспектам инженерии знаний, связанным с получением и структурированием знаний специалистов некоторой предметной области для их последующего использования в системах, основанных на знаниях.

Ключевые слова: искусственный интеллект, инженерия знаний, экспертные системы, извлечение знаний, структурирование знаний

  1. Извлечение знаний.
  2. Представление и структурирование знаний.
  3. Использование знаний.

Как известно, традиционно выделяется шесть этапов разработки экспертных систем (или систем, основанных на знаниях), а именно [1]:

  1. Выбор проблемы.
  2. Разработка прототипа экспертной системы. Прототип являются усеченной версией будущей и экспертной системы и помогает понять, насколько правильно выбран подход в разработке экспертной системы.
  3. Доработка до промышленной экспертной системы. На данном этапе принимается решение, как именно должен быть доработан прототип, и, соответственно, происходит непосредственная разработка промышленной экспертной системы.
  4. Оценка экспертной системы. При оценке работы экспертной системы необходимо понять, насколько эффективно она выполняет поставленные перед ней задачи. При недостижении определенного критериев система отправляется на доработку.
  5. Стыковка экспертной системы. На данном этапе происходит интеграция экспертной системы с различными программными модулями, а также обучение пользователей будущей системы работе с ней.
  6. Поддержка экспертной системы. Необходимость в поддержке возникает тогда, когда с течением времени проблемная область и знания о ней изменяются, что обуславливает внесений этих изменений в разработанную экспертную систему.

Наибольший интерес в рамках вопроса инженерии знаний представляет второй этап, на котором происходит разработка прототипа системы, основанной на знаниях. Данный этап делится на следующие пять стадий:

  1. Уточнение проблемы — это знакомство с проблемой, выработку ее неформального описания, а также планирование хода разработки прототипа экспертной системы.
  2. Извлечение знаний — это процесс получения экспертом наиболее полного представления об предметной области, а также способах принятия решений в ней.
  3. Структурирование знаний — это выделение структуры полученных знаний с определений основных понятий и атрибутов, отношений между ними.
  4. Формализация — это преставление знаний на некотором формализованном языке представления знаний, который позволит в дальнейшем программно реализовать прототип.
  5. Реализация — это непосредственная программная разработка прототипа, обязательно включающая базу знаний и показывающая, что выбранный подход имеет право на существование
  6. Тестирование — это отладка и получение обратной связи на основе работы с реальными запросами пользователей.

Как видно, целые три стадии на этапе разработки прототипа имеет прямое отношение к области инженерии знаний, что еще раз подтверждает ее значимость.

Начинается работа со знаниями с их извлечения. Происходит данный процесс при взаимодействии эксперта с источниками знаний и специалистами предметной области, в ходе которого эксперту необходимо установить процесс рассуждения специалистов при принятии решений и структуру их представлений о предметной области [1]. При этом при извлечении знаний возникает целый ряд проблем, к которым, например, относятся неправильная постановка диалога между экспертом и специалистом, отсутствие четкой и устоявшейся терминологии, неверно выбранный способ извлечения знаний и некоторые другие. Кроме того, извлечение знаний — крайне длительный и трудоемкий процесс. Как правило, он занимает от одного до трех месяцев. Само же получение знаний может происходить как с использованием электронно-вычислительной техники, так и без нее, причем, в первом случае возможно даже отсутствие диалога со специалистом при условии достаточного количества различных обучающих программ принятия решения в исследуемой области знаний, однако он является наименее используемым, а обучающие программы, в свою очередь, не могли разрабатываться без участия специалиста предметной области.

При извлечении знаний эксперту необходимо принимать во внимание три аспекта: психологический, лингвистический и гносеологический.

Психологический аспект возникает на почве возникновения диалога между экспертом и специалистами предметной области. Эксперт должен быть крайне внимателен, ведь если беседа не задастся, то ему не удастся получить от специалиста всего объема столь необходимых и ценных знаний.

Лингвистический аспект проявляется на почве использования в определенной предметной области терминологии, недоступной эксперту. Для правильного извлечения знаний ему придется быть готовым углубиться в изучение исследуемой области.

Наконец, гносеологический аспект, который, возможно, сыграет одну из важнейших ролей в дальнейшей работе эксперта, возникает по причине того, что, вполне возможно, исследуемая экспертом область окажется для него абсолютно новой, и ему придется в определенном смысле осознать полученные знания, чтобы правильно отразить выявленные им закономерности.

По окончании процесса извлечения знаний эксперт переходит к их описанию, причем к нему выдвигаются определенные требования с точки зрения выбранного им языка представления знаний. Дело в том, что крайне важно добиться максимальной формализации и точности знаний. К сожалению, на данный момент не существует общепринятого языка инженерии знаний, хотя работы в этом направлении ведутся уже не один десяток лет. Именно поэтому представление знаний экспертом, его личный выбор начинает приобретать настолько большое значение.

При структурировании же данных экспертом чаще всего выбирается один из двух подходов: структурный, при котором основное внимание уделяется выделению модулей, выполняющий какой-либо важный процесс, либо объектный, при которым выделяются не процессы, а, соответственно, объекты. Кроме этого, существует также и объектно-структурный подход, который ставит по главу угла взаимосвязь между понятиями, выявление существенных характеристик понятия, которые отличают его от других, ранжирование на упорядоченные системы абстракций, выделение классов понятий с частичным наследованием свойств в подклассах, разбиение задачи на подзадачи и наглядность и простоту нотации.

Таким образом, инженерия знаний является очень важной областью знаний, ведь без ее исследований не удастся разработать действительно ценные и отвечающие всем запросам пользователей экспертные системы.

  1. Гаврилова, Т. А. Базы знаний интеллектуальных систем / Т. А. Гаврилова, В. Ф. Хорошевский. — СПб.: Питер, 2001. — 384 с.: ил.

Основные термины (генерируются автоматически): экспертной системы, инженерии знаний, предметной области, извлечения знаний, структурирование знаний, извлечение знаний, Извлечение знаний, инженерия знаний, представление знаний, извлечении знаний, представления знаний, прототипа экспертной системы, промышленной экспертной системы, аспекты инженерии знаний, аспектам инженерии знаний, структурированием знаний специалистов, рамках инженерии знаний, области инженерии знаний, представление знаний экспертом, извлечении знаний эксперту.

Читайте также: