Представление нечетких знаний реферат

Обновлено: 03.07.2024

3. ПРЕДСТАВЛЕНИЕ ЗНАНИЙ

3.1. Данные и знания

Данные являются разновидностью декларативной информации и представляют собой конкретные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

К знаниям относятся процедурная информация и остальная часть декларативной информации.

Перечислим особенности (свойства) декларативных знаний [17].

1. Индентифицируемость. Каждая информационная единица должна иметь уникальное имя, по которому информационная система выделяет ее среди других.

2. Внутренняя интерпретируемость. Информационные единицы, как правило, содержат сведения о том, как их использовать.

3. Структурированность. Информационные единицы должны иметь четкую, но в тоже время гибкую структуру, позволяющую задавать рекурсивные 1 определения информационных единиц или вложенность одних информационных единиц в другие.

4. Связность. В информационной базе между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Например, таких как функциональные отношения, причинно-следственные связи, структурные и семантические отношения, отношения несовместимости информационных единиц в едином контексте, отношение релевантности и т.д. Отношение релевантности (смысловой и ситуационной близости) информационных единиц позволяет находить знания, близкие к уже найденным.

5. Активность. В традиционных информационных системах данные пассивны, а команды активны. В ИИС, как и у человека, актуализации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в ИИС инициируется текущим состоянием информационной базы, т.е. декларативными знаниями.

Следует иметь в виду, что резкой границы между данными и знаниями нет [4, 17]. В частности, современные СУБД обеспечивают реализацию идентифицируемости всех информационных единиц, хранящихся в БД. В современных языках программирования гибкая структурированность достигается за счет использования абстрактных типов данных или объектно-ориентированного представления информации. При проектировании реляционных БД широко используется понятие функциональной зависимости. Использование объектно-ориентированного подхода при создании систем различного класса, хранимых процедур в БД и т.п. делает данные в какой-то мере активными. Таким образом, отличия знаний от данных, перечисленные выше, с развитием средств информатики сглаживаются.

Однако, попытаемся перечислить основные отличия знаний от данных [4]:

- знания более структурированы;

- в знаниях существенное значение имеют не только атомарные элементы (как в данных), но и взаимосвязи между ними;

- знания активны в отличие от пассивных данных, т.е. знания могут порождать действия системы, использующей их.

Знания — это закономерности предметной области (факты, принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

Знания — это хорошо структурированные данные (данные о данных, метаданные).

Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний — базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний — это совокупность знаний, описанных с использованием выбранной формы (модели) их представления. База знаний — основа любой интеллектуальной системы.

1 Рекурсия – процесс повторения элементов самоподобным образом.

3.2. Классификация знаний

Знания могут быть классифицированы по следующим категориям:

- по степени основательности [11, 4]:

- по степени теоретической обоснованности [2]:

- фактические - хорошо известные (аксиомы) и теоретически обоснованные законы и правила, а также конкретные достоверные факты и сведения;

- эвристические - знания, теоретически не обоснованные, но подтвержденные в результате многолетней практики или экспериментов;

- по способу представления и использования в интеллектуальных информационных системах [2]:

- декларативные (факты);

- процедурные (правила);

- метазнания (знания о знаниях) - знания, предписывающие способы и порядок использования знаний, а также их свойства;

- по степени детерминированности (определенности):

- детерминированные (точные) - знания, воспринимаемые всеми однозначно (например, Путин президент России, S_круга = πR 2 , в сутках 24 часа). Как правило, это аксиомы, теоретические обоснованные законы и количественные характеристики. В любом случае, эти знания могут быть интерпретированы либо как полностью истинные (true, 1) либо как полностью ложные (false, 0);

- недетерминированные (нечеткие, неточные) - знания, воспринимаемые неоднозначно или степень достоверности которых отличается от 0 или 1 (например, достоверность того, что Иванов умный - 0.7). Как правило, это качественные характеристики, такие как рост (высокий, средний, низкий, карликовый), возраст (старый, пожилой, в расцвете сил, молодой, юный) и т.п.

3.3. Модели представления знаний

Наиболее популярные модели представления знаний приведены в табл.3.1.

Модели представления знаний

Знания, извлеченные из экспертов, как правило, содержат различные виды так называемых НЕ-факторов – нечетких знаний.

Они могут проявляться в умолчаниях, неточных сравнениях, подсознательных знаниях и др., но для представления таких знаний в БЗ требуется конкретная формализация.

Все нечеткости можно классифицировать: Недетерминированность выводов, Многозначность, Ненадежность, Неполнота, Неточность.

Недетерминированное управление выводом наиболее характерно для систем искусственного интеллекта. Таким образом, возникает необходимость определения пути, по которому следует начать поиск в первую очередь.

Алгоритм А. Поисковая задача сформулирована как задача поиска в пространстве состояний пути от исходного состояния заданной задачи до целевого состояния путем повторения возможных преобразований.

Задача Нильсона: .); на поле 3x3 размещены восемь пронумерованных шашек, цель игры — от заданного начального состояния перейти к целевому состоянию так, как показано ниже:

На поле один пустой квадрат: состояние можно изменить, передвигая шашку сверху, снизу, справа или слева на пустой квадрат. Следовательно, в этой игре есть четыре оператора преобразования состояния и до четырех степеней свободы квадрата или шашек, соответствующие одному из передвижений шашки на пустой квадрат, будем перемещать пустой квадрат:

перемещение пустого квадрата влево (при этом слева есть квадрат);

перемещение пустого квадрата вверх (при этом вверху есть квадрат);

перемещение пустого квадрата вправо (при этом справа есть квадрат);

перемещение пустого квадрата вниз (при этом внизу есть квадрат)

Зададим оценочную функцию f(n) - стоимость оптимального пути к цели от первой вершины (нач. состояния) через n вершин дерева поиска: f(n) = g(n) + h(n),

где g(n) - стоимость оптимального пути от 1-ой вершины до n-й вершины,

h(n) - стоимость оптимального пути от n-й вершины до цели.

Будем считать, что перемещение 1 шашки имеет стоимость 1, а до цели ведет оптимальный путь с минимальной стоимостью.

Пусть априорное значение оценочной функции (т.к.точное значение f(n) в процессе игры знать не возможно) : f’(n)=g(n)+h’(n),

где h’(n) — априорное значение h(n) – количесво фишек, стоящих не на своих местах. g(n) — это глубина от 1-ой вершины до n-й вершины.

Выбираем вершину с наименьшим из значений оценочной функции, применяем оператор и раскрываем вершину, затем создаем дочерние вершины (при этом не возвращаемся к уже появившимся вершинам). Повторяем эту процедуру, до целевого состояния.

Если на каком-либо шаге встречаем h_i’(n) >h’_i_-1(n), товозвращаемся на шаг назад и раскрываем вершину со следующим по порядку значением оценочной функции.

Многозначность. Многозначность интерпретации — обычное явление при понимании естественных языков и распознавании изображений и речи. Устранить многозначность в зависимости от типа информации можно более широким контекстом и семантическими ограничениями.

Модель доски объявлений. Фреймовая модель со слотами с понижением рангов. Семь уровней интерпретации от звуков к слогам, словам, группам слов и фразам, многозначность интерпретации на каждом уровне устраняется путем согласования с верхними уровнями, на основе модели доски объявлений; интерпретация не всегда однозначна и обычно генерируются несколько гипотез. Интерпретируем от низшего к высшему (от акустических параметров звуковых волн до понимания смысла вопроса).

Немного теории

На рис. 2 показаны области наиболее эффективного применения современных технологий управления. Как видно, классические методы управления хорошо работают при полностью детерминированном объекте управления и детерминированной среде, а для систем с неполной информацией и высокой сложностью объекта управления оптимальными являются нечеткие методы управления. (В правом верхнем углу рисунка приведена еще одна современная технология управления - с применением искусственных нейронных сетей, но мы не станем столь глубоко вдаваться в достижения ученых.)

Получившие наибольшее развитие из всех разработок искусственного интеллекта, экспертные системы завоевали устойчивое признание в качестве систем поддержки принятия решений. Подобные системы способны аккумулировать знания, полученные человеком в различных областях деятельности. Посредством экспертных систем удается решить многие современные задачи, в том числе и задачи управления. Однако большинство систем все еще сильно зависит от классической логики.

Главным же недостатком продукционных систем остается то, что для их функционирования требуется наличие полной информации о системе.

Нечеткие системы тоже основаны на правилах продукционного типа, однако в качестве посылки и заключения в правиле используются лингвистические переменные, что позволяет избежать ограничений, присущих классическим продукционным правилам.

Целевая установка процесса управления связывается с выходной переменной нечеткой системы управления, но результат нечеткого логического вывода является нечетким, а физическое исполнительное устройство не способно воспринять такую команду. Необходимы специальные математические методы, позволяющие переходить от нечетких значений величин к вполне определенным. В целом весь процесс нечеткого управления можно разбить на несколько шагов: фаззификация, разработка нечетких правил и дефаззификация.

Фаззификация (переход к нечеткости)

Точные значения входных переменных преобразуются в значения лингвистических переменных посредством применения некоторых положений теории нечетких множеств, а именно - при помощи определенных функций принадлежности.

Лингвистические переменные

В нечеткой логике значения любой величины представляются не числами, а словами естественного языка и называются ТЕРМАМИ. Так, значением лингвистической переменной ДИСТАНЦИЯ являются термы ДАЛЕКО, БЛИЗКО и т. д.

Конечно, для реализации лингвистической переменной необходимо определить точные физические значения ее термов. Пусть, например, переменная ДИСТАНЦИЯ может принимать любое значение из диапазона от 0 до 60 метров. Как же нам поступить? Согласно положениям теории нечетких множеств, каждому значению расстояния из диапазона в 60 метров может быть поставлено в соответствие некоторое число, от нуля до единицы, которое определяет СТЕПЕНЬ ПРИНАДЛЕЖНОСТИ данного физического значения расстояния (допустим, 10 метров) к тому или иному терму лингвистической переменной ДИСТАНЦИЯ. В нашем случае расстоянию в 50 метров можно задать степень принадлежности к терму ДАЛЕКО, равную 0,85, а к терму БЛИЗКО - 0,15. Конкретное определение степени принадлежности возможно только при работе с экспертами. При обсуждении вопроса о термах лингвистической переменной интересно прикинуть, сколько всего термов в переменной необходимо для достаточно точного представления физической величины. В настоящее время сложилось мнение, что для большинства приложений достаточно 3-7 термов на каждую переменную. Минимальное значение числа термов вполне оправданно.Такое определение содержит два экстремальных значения (минимальное и максимальное) и среднее. Для большинства применений этого вполне достаточно. Что касается максимального количества термов, то оно не ограничено и зависит целиком от приложения и требуемой точности описания системы. Число же 7 обусловлено емкостью кратковременной памяти человека, в которой, по современным представлениям, может храниться до семи единиц информации.

В заключение дадим два совета, которые помогут в определении числа термов:

n исходите из стоящей перед вами задачи и необходимой точности описания, помните, что для большинства приложений вполне достаточно трех термов в переменной;

n составляемые нечеткие правила функционирования системы должны быть понятны, вы не должны испытывать существенных трудностей при их разработке; в противном случае, если не хватает словарного запаса в термах, следует увеличить их число.

Функции принадлежности

Как уже говорилось, принадлежность каждого точного значения к одному из термов лингвистической переменной определяется посредством функции принадлежности. Ее вид может быть абсолютно произвольным. Сейчас сформировалось понятие о так называемых стандартных функциях принадлежности (см. рис. 3).

Стандартные функции принадлежности легко применимы к решению большинства задач. Однако если предстоит решать специфическую задачу, можно выбрать и более подходящую форму функции принадлежности, при этом можно добиться лучших результатов работы системы, чем при использовании функций стандартного вида.

Подведем некоторый итог этапа фаззификации и дадим некое подобие алгоритма по формализации задачи в терминах нечеткой логики.

Шаг 3. После определения экстремальных значений нужно определить промежуточные значения. Для них выбираются П- или Л-функции из числа стандартных функций принадлежности.

Шаг 4. Для значений, соответствующих экстремальным значениям параметра, выбираются S- или Z-функции принадлежности.

Если удалось подобным образом описать стоящую перед вами задачу, вы уже целиком погрузились в мир нечеткости. Теперь необходимо что-то, что поможет найти верный путь в этом лабиринте. Таким путеводителем вполне может стать база нечетких правил. О методах их составления мы поговорим ниже.

Разработка нечетких правил

На этом этапе определяются продукционные правила, связывающие лингвистические переменные. Совокупность таких правил описывает стратегию управления, применяемую в данной задаче.

Большинство нечетких систем используют продукционные правила для описания зависимостей между лингвистическими переменными. Типичное продукционное правило состоит из антецедента (часть ЕСЛИ …) и консеквента (часть ТО …). Антецедент может содержать более одной посылки. В этом случае они объединяются посредством логических связок И или ИЛИ.

Процесс вычисления нечеткого правила называется нечетким логическим выводом и подразделяется на два этапа: обобщение и заключение.

Пусть мы имеем следующее правило:

ЕСЛИ ДИСТАНЦИЯ=средняя И

УГОЛ=малый , ТО МОЩНОСТЬ=средняя .

Обратимся к примеру с контейнерным краном и рассмотрим ситуацию, когда расстояние до платформы равно 20 метрам, а угол отклонения контейнера на тросе крана равен четырем градусам. После фаззификации исходных данных получим, что степень принадлежности расстояния в 20 метров к терму СРЕДНЯЯ лингвистической переменной ДИСТАНЦИЯ равна 0,9, а степень принадлежности угла в 4 градуса к терму МАЛЫЙ лингвистической переменной УГОЛ равна 0,8.

На первом шаге логического вывода необходимо определить степень принадлежности всего антецедента правила. Для этого в нечеткой логике существуют два оператора: MIN(…) и MAX(…). Первый вычисляет минимальное значение степени принадлежности, а второй - максимальное значение. Когда применять тот или иной оператор, зависит от того, какой связкой соединены посылки в правиле. Если использована связка И, применяется оператор MIN(…). Если же посылки объединены связкой ИЛИ, необходимо применить оператор MAX(…). Ну а если в правиле всего одна посылка, операторы вовсе не нужны. Для нашего примера применим оператор MIN(…), так как использована связка И. Получим следующее:

Следовательно, степень принадлежности антецедента такого правила равна 0,8. Операция, описанная выше, отрабатывается для каждого правила в базе нечетких правил.

Следующим шагом является собственно вывод или заключение. Подобным же образом посредством операторов MIN/MAX вычисляется значение консеквента. Исходными данными служат вычисленные на предыдущем шаге значения степеней принадлежности антецедентов правил.

После выполнения всех шагов нечеткого вывода мы находим нечеткое значение управляющей переменной. Чтобы исполнительное устройство смогло отработать полученную команду, необходим этап управления, на котором мы избавляемся от нечеткости и который называется дефаззификацией .

Дефаззификация (устранение нечеткости)

На этом этапе осуществляется переход от нечетких значений величин к определенным физическим параметрам, которые могут служить командами исполнительному устройству.

Результат нечеткого вывода, конечно же, будет нечетким. В примере с краном команда для электромотора крана будет представлена термом СРЕДНЯЯ (мощность), но для исполнительного устройства это ровно ничего не значит.

Для устранения нечеткости окончательного результата существует несколько методов. Рассмотрим некоторые из них. Аббревиатура, стоящая после названия метода, происходит от сокращения его английского эквивалента.

Метод центра максимума (СоМ)

Так как результатом нечеткого логического вывода может быть несколько термов выходной переменной, то правило дефаззификации должно определить, какой из термов выбрать. Работа правила СоМ показана на рис. 4.

Метод наибольшего значения (МоМ)

При использовании этого метода правило дефаззификации выбирает максимальное из полученных значений выходной переменной. Работа метода ясна из рис. 5.

Метод центроида (СоА)

В этом методе окончательное значение определяется как проекция центра тяжести фигуры, ограниченной функциями принадлежности выходной переменной с допустимыми значениями. Работу правила можно видеть на рис. 6.

Основные шаги разработки нечеткой системы управления с использованием CAD-системы fuzzy TECH 3.0

Процесс разработки проекта нечеткой системы управления на fuzzy TECH разбивается, как уже говорилось, на четыре основных этапа. Все они схематично показаны на рис. 7.

На этом этапе при помощи средств, доступных в fuzzy TECH, задача формализуется. Здесь необходимо описать лингвистические переменные, которые вы будете использовать; их функции принадлежности; описать стратегию управления посредством нечетких правил, которые вы сможете объединить в единую базу правил или знаний о системе. В целом CASE-технология, на основе которой построен пакет, позволяет все эти действия выполнить только посредством общения с экраном ЭВМ, не заглядывая в программный код. Поэтому начальный этап проектирования вы воспримете с легкостью, несмотря на кажущуюся сложность. Можно дать один совет: обратите внимание на некоторые тонкости при разработке. Так, например, вы можете установить разрядность машинного кода, генерируемого пакетом. Это влияет на формат величин, которые можно использовать (см. табл. ниже).

Off-line-оптимизация

On-line-оптимизация

На этом шаге разрабатываемая система управления и реальный объект управления соединяются физической линией связи (см. рис. 8).

Такой вид отладки позволяет наблюдать поведение системы в реальных условиях и при необходимости вносить изменения в систему управления.

Реализация

На этом этапе необходимо получить окончательный вариант кода для конкретного микроконтроллера и, если нужно, связать его с вашей основной программой. Об оптимальности создаваемого fuzzy TECH кода можно судить по данным табл. ниже.

Основу программного кода, генерируемого пакетом fuzzy TECH, составляет аппаратно-ориентированное на конкретный тип процессора ядро. Поставляемое с пакетом fuzzy TECH MCU-96 программное ядро совместимо с такими контроллерами, как 8096BH, 8096-90, 80196KB/KC/KD, 80196 KR, 80196MC, 80196NT/NQ.

Важное замечание касается структуры генерируемого кода. Он, как правило, состоит из трех основных частей:

- код библиотечных функций;

- сегмент базы правил и функций принадлежности;

- функции нечеткой системы.

Найти объем ОЗУ и ПЗУ, потребный для работы и хранения вашей системы, помогут следующие формулы:

- для оперативной памяти,

где

S_v - объем необходимой оперативной памяти;

n_i - число входных переменных;

n_o - число выходных переменных;

t_i - число термов во входной лингвистической переменной i;

t_j - число термов в выходной лингвистической переменной j;

C - константа, равная 28 байтам для MCU-96 и 7 байт для MCU-51;

- для постоянной памяти:,

где

S_f - размер базы правил в байтах;

n_i - число входных переменных;

n_o - число выходных переменных;

n_r - число правил в базе знаний;

t_i - число термов во входной лингвистической переменной i;

t_j - число термов в выходной лингвистической переменной j;

I_r - число входных условий для правила r;

O_r - число выходных условий для правила r;

Точный размер сгенерированного fuzzy TECH 3.0 кода указывается по окончании процесса компиляции.

Платформа	20 правил 2 вх. и 1 вых.	20 FAM-правил 2 вх. И 1 вых.	80 правил 3 вх. и 1 вых.
MCS-96, 16 бит, 80С196KD, встроенное ПЗУ, 20 Мгц	0,28 мс 0,84 Кбайт ПЗУ 63 байт ОЗУ	0,29 мс 0,87 Кбайт ПЗУ 63 байт ОЗУ	0,43 мс 1.27 Кбайт ПЗУ 69 байт ОЗУ
MCS-51, 8 бит, 80С51, встроенное ПЗУ, 12 МГц	1,4 мс 0,54 Кбайт ПЗУ 25 байт ОЗУ	1,5 мс 0,58 Кбайт ПЗУ 25 байт ОЗУ	4,4 мс 1,0 Кбайт ПЗУ 29 байт ОЗУ

1. Zade L. A. The concept of a linguistic variable and its application to approximate reasoning. Part 1, 2, 3 // Information Sciences, n. 8 pp.199-249, pp.301-357; n. 9 pp. 43-80.

2. Прикладные нечеткие системы: Перевод с япон./ К. Асаи, Д. Ватада, С. Иваи и др.; под ред. Т. Тэрано, К. Асаи, М. Сугено. - М.: Мир, 1993.

3. Mamdani E. H. Applications of fuzzy algorithms for simple dynamic plant. Porc. IEE. vol. 121, n. 12, pp. 1585-1588, 1974.

4. Smidth F. L. Computing with a human face. New Scientist, 6 may, 1982.

5. Yagashita O., Itoh O., and Sugeno M. Application of fuzzy reasoning to the water purification process, in Industrial Applications of Fuzzy Control, Sugeno M, Ed. Amsterdam: North-Holand 1985, pp.19-40.

6. Yasunobu S., Miyamoto S., and Ihara H. Fuzzy control for automatic train operation system, in Proc. 4th. IFAC/IFIP/IFORS Int. Congress on Control in Transportation Systems, Baden-Baden, April, 1983.

7. Yasunobu S., and Hasegawa T. Predictive fuzzy control and its applications for automatic container crane operation system, in Proc. 2nd. IFSA Congress, Tokyo, Japan, Julie 1987.

8. F. Fujitec, FLEX-8800 series elevator group control system, Fujitec Co., Ltd., Osaka, Japan, 1988.

9. Watanabe H., and Dettloff. Reconfigurable fuzzy logic processor: A full custom digital VLCI, in Int. Workshop on Fuzzy Systems Applications, Iiruka, Japan, Aug. 1988, pp. 49-50.

Кроме того, при принятии решений некоторые высказывания не могут быть интерпретированы как полностью истинные или ложные. Существуют знания, достоверность которых выражается некоторой вероятностью.

Для решения таких проблем в начале 70-х американский математик Лотфи Задепредложил формальный аппарат нечеткой алгебры и нечеткой логики (fuzzy logic). Это направление получило широкое распространение в задачах искусственного интеллекта, распознавания образов, классификации реальных объектов.

Вычисления на основе нечеткой логики получили название мягкие вычисления(soft computing).

Одно из главных понятий в нечеткой логике — понятие лингвистической переменной.

Лингвистическая переменная (ЛП) — это переменная, значение которой определяется набором словесных характеристик некоторого свойства, образующих нечеткое множество (fuzzy set).

Нечеткое множество, характеризующее ЛП, определяется на некотором базовомнаборе значений или базовой числовой шкале, имеющей размерность. При этом значение ЛП определяется как нечеткое множество.

Нечеткое множество в свою очередь определяется через некоторую базовую шкалу В и функцию принадлежности m(x), хÎВ.

Допускается и такое математическое описание:

где х_i - значение базовой шкалы.

Функция принадлежности определяет субъективную степень уверенности эксперта в том, что данное конкретное значение базовой шкалы соответствует определяемому нечеткому множеству. Это отличает ее от вероятности.

2 эксперт = (25/1 + 10/0.7 + 5/0.5>

Пример 9.1

Ребенок до полугода здесь с высокой степенью уверенности относится к младенцам (m=1). Дети до четырех лет причисляются к младенцам тоже, но с меньшей степенью уверенности (0.5 2 =

Тема 10.

Инженерия знаний.

Поле знаний.

В процессе проектирования БЗ, эксперт взаимодействует с инженером по знаниям с целью извлечения знаний, их структурирования, где важную роль играет стратегия получения знаний.

Поле знаний – это условное неформальное описание основных понятий и взаимосвязей предметной области, выявленных из системы знаний эксперта в виде графа, диаграммы, таблицы или текста.

Поле знаний (ПЗ) является концептуальной моделью предметной области и формируется на стадии структурирования при разработке ЭС.

Описание ПЗ дается на некотором языке, который является связующим звеном между естественным языком и формальным языком математики.

Требования, предъявляемые к языку описания ПЗ:

1) Однозначность понятий и высказываний.

2) Заимствованные термины из предметной области должны сохранять свой смысл.

3) Язык должен быть символьным или графическим.

На стадии структурирования описание ПЗ переносится на какой-либо язык представления знаний, выбор которого зависит от структуры ПЗ.

Существует 3 основных подхода к выбору языков описания знаний:

1 – использование уникальных языков, разработанных для конкретной предметной области (SSL, язык К-схем);

2 – использование языков классификации знаний (языки Вилкинса и Далгарно);

3 – использование логико-конструктивных языков, разработанных в семиотике (науке об универсальном методе познания).

Методы третьего подхода не нашли применения в естественных науках в силу жесткой структуры знаний. В искусственном интеллекте знания нечеткие, поэтому эти методы и языки могут применяться.

Язык семиотического моделирования является наиболее лучшим приближением к универсальному языку инженерии знаний.

Необходимо учитывать, что при формировании ПЗ главной является правильная передача структуры предметной области. Тогда ПЗ является некоторой семиотической моделью, в которой рассматриваются 3 аспекта:

Синтаксис задает набор правил построения языковых конструкций.

Семантика показывает связи между элементами языка.

Прагматика задает отношения между объектами предметной области и их пользователями.

1) Синтаксис ПЗ представляется моделью, описываемой с помощью множеств:

где In – структура входных данных;

Out – структура выходных данных;

М – модель предметной области.

где Sk – концептуальная структура (показывает взаимосвязь элементов);

Sf – функциональная структура (моделирует рассуждения эксперта в процессе принятия решения).

2) Семантика ПЗ зависит от особенностей предметной области и обладает полиморфизмом, т.е. одни и те же операторы языка могут иметь различные значения для разных задач.

Семантика рассматривается на двух уровнях:

1 – ПЗ есть модель знаний эксперта некоторой предметной области;

2 – ПЗ есть модель самих знаний, не зависимых от эксперта. В данном случае ПЗ формируется в результате 4-х этапов извлечения знаний:

1. Визуальное восприятие и интерпретация экспертом некоторой ситуации в предметной области, происходящей в памяти эксперта Vi;

2. Вербальное объяснение рассуждений эксперта в виде текста или речи Ti/Ci.

4. Кодирование и вербальное описание модели представления знаний на языке описания ПЗ – Pz.

Семантическая составляющая ПЗ является чисто субъективной. Это – БЗ эксперта в понимании инженера по знаниям.

3) Прагматика ПЗ рассматривается на уровне анализа технологии предметной области, используя которые инженер по знаниям может описать ПЗ. Т.о., это – программные средства формирования ПЗ.

Для моделирования ПЗ можно использовать:

1. Традиционные CASE-средства (Rational Rose, ERWin).

2. Специальные программы (VICONT, Axon, Idea Processor).

Т.о., учитывая знания психологии, можно рассматривать ПЗ в виде пирамиды. В пирамиде знаний каждый уровень служит для восхождения на новую ступень обобщения знаний о предметной области.

Пирамида знаний отражает глубину опыта эксперта. Восхождение по ступеням к вершине пирамиды соответствует уменьшению размерности семантического пространства памяти и увеличению опыта эксперта.

Есть другая модель описания ПЗ – сфера знаний. Здесь поверхность сферы определяет знания и опыт в соответствие с текущим опытом эксперта (радиусом сферы).

Увеличение радиуса сферы влечет увеличение объема семантической памяти. Т.о., эксперт выходит на новый уровень познания предметной области, т.е. способен усвоить и получить знания, которые ранее были недоступны.

Стратегии получения знаний.

Процесс получения знаний, т.е. передача знаний эксперта в БЗ экспертной системы является ключевым вопросом формирования поля знаний.

Стратегии формирования знаний:

1) Приобретение знаний(Knowledge, Aquisition). Эксперт вводит знания в БЗ ЭС с помощью специальной программы, жестко задающей структуры данных в соответствии с моделью представления знаний, заложенных в ЭС.

2) Извлечение знаний (Extraction).

3) Установление знаний (Elicitation).

В двух последних стратегиях происходит взаимодействие эксперта и инженера по знаниям.

Извлечение знаний является самым сложным вопросом в разработке ЭС.

Основные проблемы, возникающие при извлечении знаний:

1 – Упрощение представлений инженера по знаниям уровня знаний эксперта.

2 – Неудачно выбранный метод извлечения знаний, не соответствующий структуре данной предметной области.

3 – Неправильно выбранный язык представления знаний.

4 – Терминологические несоответствия.

5 – Отсутствие целостной системы знаний.

6 – Неумение наладить контакт с экспертом.

Для успешного извлечения знаний инженер по знаниям должен хорошо владеть рядом наук:

ü системным анализом;

ü математической логикой;

ü когнитивной психологией;

ü искусственным интеллектом.

Согласно Платону, мышление человека диалогично, поэтому диалог эксперта и инженера по знаниям является самой лучшей формой извлечения знаний, хотя в ряде случаев эксперт не общается с инженером по знаниям, а работает с программой ввода знаний (Tetresias – программа заполнения БЗ, MYCIN, EMYCIN, разработанные на основе продукционной модели представления знаний).

4) Формирование знаний. Эта стратегия характеризует разработку моделей, методов и алгоритмов обучения ЭС (Mashine Learning) – процесс анализа данных и выявления закономерностей предметной области.

Основные области применения Mashine Learning:

- прогнозирование, расшифровка языков;

- методы обучения распознаванию образов;

- индуктивный вывод правил и фактов.

Существует 2 основных подхода к обучению:

1 – алгебраический, основанный на дополнении исходных эвристических алгоритмов какими-либо алгебраическими операциями, характеризующими объект, и построении алгоритмов классификации новых объектов.

2 – обучение на примерах (Case-based Reasoning). Здесь знания являются описанием множества примеров из предметной области.

Читайте также: