Реферат методы извлечения знаний

Обновлено: 05.07.2024

ВВЕДЕНИЕ
Центральной проблемой при создании интеллектуальных информационных технологий является адекватное отображение знаний специалиста в памяти компьютера. Это привело к развитию нового направления в информатике — инженерии знаний, где определяется соотношение человеческого знания и его формализованного (информационного) отображения в ЭВМ. Инженерия знанийизучает и разрабатывает вопросы, связанные с получением знаний, их анализом и формализацией для дальнейшей реализации в интеллектуальной системе.
Цель данной курсовой работы — познакомить с некоторыми практическими методами работы инженеров по знаниям, а конкретно с коммуникативными методами извлечения знаний.

1.1. Классификацияметодов извлечения знаний.

Изложим классификацию методов извлечения знаний на схеме (рис. 1). Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальнойлитературы (статей, монографий, учебников).

Рис.1. Классификация методов извлечения знаний.

В свою очередь, коммуникативные методы можно также разделить на две группы: активные и пассивные. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решенийили записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами - в играх, диалогах, беседах за "круглым столом" и т.д.

1.2. Пассивные методы

Пассивные методы на первый взгляд достаточно просты, но на самом деле требуют oтинженера по знаниям умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность инженера по знаниям) значительно ослабляет эффективность этих методов, чем и объясняется их обычно вспомогательная роль при активных методах.
Название "пассивные" не должно вызывать иллюзий, поскольку этот термин введен как противовес к"активным" методам. В реальности же пассивные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог. Согласно классификации (см. рис. 1) к этой группе относятся:
• наблюдения;
• анализ протоколов "мыслей вслух";
• лекции.
•
1.2.1. Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время егопрофессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.
Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Может быть сделана и видеозапись в реальном масштабе времени. Непременное условие этого метода -.

Разработка теории, методов и технологий представления и использования знаний остается актуальной задачей для дальнейшего развития интеллектуальных систем. Одна из них, наиболее важная и актуальная, по нашему мнению на современном этапе, является проблема извлечения знаний. Уже сейчас ясно, что применение систем, основанных на знаниях, должно привести к рассмотрению и использованию Всемирной паутины как организованного и структурированного пространства знаний.

Содержание работы

Введение 3
1. Теория, основные понятия. 4
2. Стратегия получения знаний. 5
3. Практические методы извлечения знаний. 6
4. Методика извлечения знаний из эксперта на примере. 7
4.1. Проблема извлечения знаний. 7
Заключение 19
Список литературы 20

Файлы: 1 файл

ИИС реферат.docx

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Байкальский государственный университет экономики и права

Исполнитель: Прохоров В. А.

Руководитель: Хитрова Т.И.

Теория, основные понятия. 4
Стратегия получения знаний. 5
Практические методы извлечения знаний. 6
Методика извлечения знаний из эксперта на примере. 7
1. Проблема извлечения знаний. 7
Список литературы 20

В настоящее время в области баз знаний интеллектуальных систем уже имеется серьезный теоретический базис, существует достаточно широкий спектр соответствующих методов и технологий разработки. Многие из них поддержаны адекватным программным инструментарием.

Не секрет, что для построения и использования баз знаний, на которых основываются современные интеллектуальные системы, требуются исследовательские коллективы, работающие вместе долго и имеющие опыт разработки такого рода систем. Для получения действительно хороших результатов необходимы дорогостоящие людские и материальные ресурсы — специалисты, лицензионные инструментарии, документация. Кроме того, разработка их достаточно трудоемкий (годы) и дорогостоящий (десятки, если не сотни тыс. долларов) процесс. Вот почему в настоящее время действующие интеллектуальные системы ориентированы в основном на поддержку работы постоянно работающих групп пользователей для достаточно специализированных задач. Следует отметить и то, что в настоящее время почти нет действительно интеллектуальных систем, удобных для работы широкого круга пользователей в сети Интернет.

Таким образом, разработка теории, методов и технологий представления и использования знаний остается актуальной задачей для дальнейшего развития интеллектуальных систем. Одна из них, наиболее важная и актуальная, по нашему мнению на современном этапе, является проблема извлечения знаний. Уже сейчас ясно, что применение систем, основанных на знаниях, должно привести к рассмотрению и использованию Всемирной паутины как организованного и структурированного пространства знаний.

Термин интеллект (intelligence) происходит от латинского intellectus — что означает ум, рассудок, разум; мыслительные способности человека. Соответственно искусственный интеллект (artificial intelligence) — ИИ (AI) обычно толкуется, как свойство автоматических систем брать на себя отдельные функции интеллекта человека, например, выбирать и принимать оптимальные решения на основе ранее полученного опыта и рационального анализа внешних воздействий.

Интеллектом называется способность мозга решать (интеллектуальные) задачи путем приобретения, запоминания и целенаправленного преобразования знаний в процессе обучения на опыте и адаптации к разнообразным обстоятельствам1.

В этом определении под термином "знания" подразумевается не только ту информацию, которая поступает в мозг через органы чувств. Такого типа знания чрезвычайно важны, но недостаточны для интеллектуальной деятельности. Дело в том, что объекты окружающей нас среды обладают свойством не только воздействовать на органы чувств, но и находиться друг с другом в определенных отношениях. Ясно, что для того, чтобы осуществлять в окружающей среде интеллектуальную деятельность (или хотя бы просто существовать), необходимо иметь в системе знаний модель этого мира. В этой информационной модели окружающей среды реальные объекты, их свойства и отношения между ними не только отображаются и запоминаются, но и, как это отмечено в данном определении интеллекта, могут мысленно "целенаправленно преобразовываться". При этом существенно то, что формирование модели внешней среды происходит "в процессе обучения на опыте и адаптации к разнообразным обстоятельствам".

База знаний - это один из структурных элементов экспертной системы.

Экспертная система – это интеллектуальная программа, способная делать логические выводы на основании знаний в конкретной предметной области и обеспечивающая решение специфических задач.

2. Стратегия получения знаний

Выделяют три стратегии получения знаний – приобретение знаний, извлечение знаний и обнаружение знаний в базах данных:

Под приобретением (acquisition) знаний понимают способ автоматизированного наполнения базы знаний посредством диалога эксперта и специальной программы.

Извлечением (elicitation) знаний называют процедуру взаимодействия инженера по знаниям с источником знаний (экспертом, специальной литературой и др.) без использований вычислительной техники. Извлечение знаний предполагает изучение множества источников знаний, к которым относятся специальная литература, базы фактуальных знаний, отчеты о решении аналогичных проблем, а самое главное, опыт работы специалистов в исследуемой проблемной области - экспертов. Успех проектирования экспертной системы во многом определяется тем, насколько компетентны привлекаемые к разработке эксперты и насколько они способны передать свой опыт инженерам по знаниям. Вместе с тем, эксперты не имеют представления о возможностях и ограничениях ЭС. Следовательно процесс разработки ЭС должен быть организован инженерами по знаниям таким образом, чтобы в процессе их итеративного взаимодействия с экспертами они получили весь необходимый объем знаний для решения четко очерченных проблем.

Термином “обнаружение знаний в базах данных” (knowledge discovery in databases – KDD) сегодня обозначают процесс получения из “сырых” данных новой, потенциально полезной информации о предметной области. Этот процесс включает несколько этапов (рис. 1.2). Сюда относится накопление сырых данных, отбор, подготовка, преобразование данных, поиск закономерностей в данных, оценка, обобщение и структурирование найденных закономерностей.

Рис. 1.2. Процесс обнаружения знаний в БД

Классификация методов извлечения знаний (рис. 1.3) позволит инженерам по знаниям, в зависимости от конкретной задачи и ситуации, выбрать конкретный метод. Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).

Разделение этих групп методов на верхнем уровне классификации не означает их антагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.

Рис. 1.3. Классификация методов извлечения знаний.

В свою очередь, коммуникативные методы можно также разделить на две группы: активные и пассивные. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами - в играх, диалогах, беседах за "круглым столом" и т.д.

Пассивные методы на первый взгляд достаточно просты, но на самом деле требуют oт инженера по знаниям умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность инженера по знаниям) значительно ослабляет эффективность этих методов, чем и объясняется их обычно вспомогательная роль при активных методах.

Активные методы можно разделить на две группы в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно помимо серии индивидуальных контактов с каждым применять и методы групповых обсуждений предметной области. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.
В работе приводится методика извлечения знаний из эксперта, основанная на свойстве монотонности. Эта методика позволяет извлечь из эксперта Булеву функцию принятия решений и переписать её в виде системы правил.

Методика использует свойство монотонности, что сильно сокращает количество вопросов, задаваемых эксперту, и тем самым дает возможность извлекать сложные булевы функции знаний за приемлемое время. Даная методика иллюстрируется примером извлечения знаний из эксперта James Ruiz при создании диагностической системы рака груди для Baton Rouge, (Louisiana), Women hospital.

Ключевые слова: извлечение знаний из эксперта, экспертные системы, базы знаний, экспертные оценки.

4.1. Проблема извлечения знаний из эксперта

В данной работе описывается методика извлечения знаний из эксперта. Эти знания, представленные множеством правил, могут служить ядром компьютерной диагностической системы. Разработанная методика [Kovalerchuk B., Vityaev E., 1997, 2000, 2001] основана на свойстве монотонности. Преимущества методики показаны на примере компьютерной системы диагностики рака груди.

В США рак груди – наиболее часто встречаемый женский рак [Wingo P.A.]. Наиболее эффективный метод борьбы против рака груди – скрининг маммограмм. Однако было обнаружено, что есть значительная интра- и интернаблюдателя вариабельность маммографической интерпретации (до 25 %). Дополнительно, несколько ретроспективных исследований нашли, что ошибка варьируется в пределах от 20 до 43 %. Эти данные ясно демонстрируют потребность улучшить надежность маммографической интерпретации.

Архивы маммографии в больницах во всем мире содержат миллионы результатов биопсии и маммограмм. Несколько университетов и больниц создали базы данных изображений маммографии, которые являются доступными в Интернете. Такие усилия обеспечивают возможность масштабного анализа данных и извлечения знаний в области диагностики рака груди.

Обнаружение полного множества экспертных правил – экспоненциально сложная задача.

Полный опрос эксперта может потребовать задания тысячи вопросов эксперту. Это известная проблема при разработке экспертных систем. Например, для 11 бинарных диагностических признаков мы получаем

(2 11 = 2 048) комбинаций признаков, каждый из которых может дать

отдельное правило. Лобовой метод потребовал бы опроса эксперта для каждой из этих 2 048 комбинаций.

2. Иерархический подход.

Извлечение знаний из эксперта основано на оригинальном методе восстановления Булевых функций с использованием свойства монотонности [Kovalerchuk B., 1996]. Мы будем иллюстрировать метод на примере диагностической системы рака груди, но специфика задачи практически не будет сказываться на общности метода.

Если попросить эксперта оценить конкретный случай, представленный набором значений признаков, то типичный вопрос будет иметь следующий вид:

Каждый набор признаков (V1, V2, . Vn) представляет возможный клинический случай.

Первая задача состоит в том, что бы свести все признаки к бинарным признакам, разбив их значения на два класса – связанных с подозрением на рак и нет.

Вторая задача состоит в том, что бы построить иерархию признаков, начиная с общих признаков и кончая менее общими признаками. Эта иерархия начинается с определения 11 медицинских первичных бинарных признаков.

Медик-эксперт обнаружил, что первичные 11 бинарных признаков w1, w2, w3, y1, y2, y3, y4, y5, x3, x4, x5 могут быть представлены иерархией с добавлением двух новых обобщенных признаков x1 и x2:

Уровень 1 (5 признаков) Уровень 2 (все 11 признаков)

x2 y1, y2, y3, y4, y5

Мы рассматриваем пять бинарных признаков x1, x2, x3, x4, и x5, на уровне 1.

Наибольшей эффективности современные интеллектуальные системы достигают при реализации их как интегрируемых систем, объединяющих различные модели и методы представления и оперирования знаниями, а также механизмы приобретения (извлечения) знаний из различных источников.

Актуальность данной темы заключается в том, что извлечение данных может происходить путем простого диалога, не требующий никаких дополнительных знаний.

Данная работа посвящена реализации метода извлечения знаний диалог.

Достижение указанной цели будет осуществляться путем решения следующих основных задач:

Описание предметной области.

Формализация метода диалога.

Разработка программного приложения.

Практическая значимость данной темы заключается в приобретении навыков формирования и извлечения знаний путем выбранного метода извлечения знаний.

Разработанная система должна характеризироваться тем, что диалог ведется в терминах проблемной области и на выходе пользователь получает конечный результат, являющийся целью его общения с программным приложением.

Структура курсовой работы включает в себя следующие разделы: введение, теоретическую часть, а именно описание предметной области и описание метода извлечения знаний, формализацию метода диалог, компьютерную реализацию метода и заключение.

Во введении обосновывается актуальность избранной проблемы, ее практическая значимость, определяется логическая последовательность выполнения задач, а так же что является объектом и предметом курсовой работы.

Теоретическая часть делится на две главы. В первой описывается выбранная предметная область, во второй описывается выбранный метод извлечения данных.

В разделе формализация метода описывается проектирование метода в виде графиков, алгоритмов, дерева иерархии.

Раздел компьютерная реализация делится еще на два раздела, в которых описывается разработка самой системы и в итоге ее тестирование.

В заключении курсовой работы следует описать выводы, полученные студентом на этапах разработки системы.

Данная курсовая работа написана 23 страницы, содержит 16 рисунков, 23 используемых источников, и 1 приложение на 6 страниц.

Предметной областью данной работы является выбор чая. Что бы понять, о чем в дальнейшем будет идти речь, проведем общую характеристику нашей предметной области.

Чай - напиток, получаемый варкой, завариванием и/или настаиванием листа чайного куста, который предварительно подготавливается специальным образом.В строгом смысле слова, чай – это напиток из листьев чайного куста и только его[21].

При выборе чая главными критериями являются:

чистый и натуральный вкус, без примесей

Сильный природный аромат при заваривании, который долго сохраняется в пустой горячей чашке;

ярко выраженное послевкусие, которое держится довольно продолжительное время;

способность завариваться многократно при традиционном китайском заваривании, - чай должен выдерживать как минимум 6 проливов, а зачастую и гораздо больше;

оздоровительное влияние на организм вообще и пищеварительную систему в частности. только качественный и настоящий чай по-настоящему полезен для здоровья!;

эффект расслабления, прилива энергии или другие - в зависимости от сорта чая и индивидуального восприятия (подробнее о действии чая - в этой статье)

Можно ли рассчитывать, что компьютер когда-либо сможет извлекать знания из текста на естественном языке?

Тема извлечения знаний привлекает внимание учёных как в Европе, так и во всём мире. Изучением данной темы занимаются У. Файяд, Г. Пятетский-Шапиро, Т. Гаврилова, Л. Григорьев, П. Смит, Дж. Сейферт, В. Фроли, Ц. Матеус, Е. Монк, Б. Вагнер, С.Хааг и др[10].

Многообразие задач, ситуаций и источников знаний обусловило появление большого количества методов извлечения, приобретения и формирования знаний. Первый класс образуют коммуникативные методы, которые ориентированы на непосредственный контакт инженера по знаниям с экспертом (источником знаний), второй класс — текстологические методы, основанные на приобретении знаний из документов и специальной литературы.

Метод диалог относится к коммуникативным методам.

Диалог - самостоятельный или дополнительный метод исследования, применяемый с целью получения необходимой информации или разъяснения того, что не было достаточно ясным при наблюдении. Диалог проводится по заранее намеченному плану с выделением вопросов, требующих выяснения[7].

Достоинства метода: гибкость, обратная связь, возможность изменения сценария и формы сеанса.

Недостатки метода: требует от аналитика высочайшего напряжения, отсутствие формальных методик проведения, трудность протоколирования результатов.

Подготовка к диалогу, так же, как и к другим активным методам извлечения знаний, включает составление плана проведения сеанса, в котором необходимо предусмотреть следующие стадии:

Диалог по извлечению знаний.

Заключительная стадия (благодарность за потраченное время, подведение итогов, договоренность о последующих встречах).

уникальность каждого партнера и их принципиальное равенство друг другу;

различие и оригинальность их точек зрения;

ориентацию каждого на понимание и на активную интерпретацию его точки зрения партнером;

ожидание ответа и его предвосхищение в собственном высказывании;

В данном примере будет использоваться неформализованный диалог. Первая часть блок-схемы работы программы в режиме диалога представлена в виде дерева иерархии на рисунке 2.1, а продолжение дерева иерархии представлено на рисунке 2.2. Проектирование дерева иерархии выполнялось в графическом редакторе Microsoft Visio.

Microsoft Visio — векторный графический редактор, редактор диаграмм и блок-схем для Windows. Это мощное решение для создания диаграмм, которое позволяет упростить и связать информацию, а также поделиться ей. Microsoft Visio обладает мощным интерфейсом со множеством опций для создания собственных методов организации информации[23].

Оно идеально подходит для ИТ-специалистов, разработчиков и аналитиков (например, связанных с бизнес-процессами, кадрами и управлением), которым требуется интерпретировать, обновлять и передавать сложную информацию о процессах, инфраструктуре и приложениях[23].

Visio предоставляет мощные средства для создания графических диаграмм и работы с данными без художественных или технических навыков. Создаете ли вы организационную диаграмму, сетевую диаграмму или диаграмму процессов, вы можете получить нужное изображение с помощью готовых фигур.

Рисунок 1 – Первая часть дерева иерархии диалога

Рисунок 2 – Вторая часть дерева иерархии диалога

Диалог - самостоятельный или дополнительный метод исследования, применяемый с целью получения необходимой информации или разъяснения того, что не было достаточно ясным при наблюдении. Диалог проводится по заранее намеченному плану с выделением вопросов, требующих выяснения.

Необходимо написать программный код, реализующий блок-схему работы программы в режиме диалога. Сам диалог будет реализован в виде чат-бота.

Чат-бот (англ. chatterbot) – это компьютерная программа-собеседник, которая создана для имитации речевого поведения человека при общении с одним или несколькими собеседниками. Чат-бот может обладать своего рода искусственным интеллектом и способностью к обучению. А может быть простым эмулятором, способным адекватно реагировать на определённые слова и фразы.

Данный чат-бот реализован с среде разработки IntelliJ IDEA на языке программирования Java.

IntelliJ IDEA - интегрированная среда разработки программного обеспечения на многих языках программирования, в частности Java, JavaScript, Python, разработанная компанией JetBrains[19].

Java представляет собой объектно-ориентированный язык программирования и платформу вычислений, которая была впервые выпущена Sun Microsystems в 1995 г. Существует множество приложений и веб-сайтов, которые не работают при отсутствии установленной Java, и с каждым днем число таких веб-сайтов и приложений увеличивается[19].

Первым шагом необходимо реализовать интерфейсную оболочку. Для этого импортируем три библиотеки: java.awt, java.awt.event, javax.swing, они необходимы для того чтобы работала графика.

На языке Java все программы являются классами. В каждом классе Java может существовать метод main, который объявляется следующим образом:

public static void main(String[] args)

Этот метод срабатывает тогда, когда программа запускается.

Для отображения формы используем константы, каждая из которых начинается со слова final, то есть это объявление переменной которая не будет изменяться. Final string - объявление неизменяемой строки, final int - объявление неизменяемой целочисленной переменной.

Рисунок 3 – Объявление констант

Рисунок 4 – Программный код для работы кнопки

Далее для работы самого диалога необходимо прописать следующий программный код (рис. 3.5)

Рисунок 5 – Формирование вопросов

Для того, чтобы программа работала необходимо создать базу данных, из которых и будут браться вопросы и возможные варианты ответа. База данных создаваться будет в программной среде Open Server.

Рисунок 7 – Вид вопросов в таблице

На следующем рисунке представлена таблица возможных вариантов ответа эксперта.

Рисунок 8 – Возможные варианты ответа

После разработки необходимо протестировать программу.

После написания программы необходимо выполнить тестирование всех ее исходных вариантов. Так как предметной областью является тема выбора чая, то при выборе других вариантов программа, в данном случае, не сможет продолжить диалог.

Рисунок 9 – Вариант выбора другой тематики

Далее выберем все же тематику чая и ответим на заданный вопрос, что любим чай. После этого программа пойдет по другому алгоритму и перейдет к следующему вопросу.

Рисунок 10 – Вариант выбора пакетированного чая

Рисунок 11 – вариант выбора китайского производителя

Рисунок 12 – Согласие на вывод отчет

Рисунок 13 – завершение диалога

Рассмотрим другой вариант развития событий. К примеру, мы выбрали зеленый чай, из добавок предпочитаем лимон и завариваем чай в листья, то есть листовой (рис.14).

Далее напишем в каком виде предпочитаем чай, в какой упаковке покуем чаще чай, после который последует разветвленный вопрос, про производителя, где напишем, что предпочитаем производителя Россию (рис.15).

Рисунок 14 – Вариант выбора листового чая

Рисунок 15 – Выбор производителя

Далее по желанию мы можем вывести отчет. В нашем варианте, мы написали, что хотим вывести отчет (рис.16).

Рисунок 16 – вывод результата диалога

Задачей программной реализации было реализовать одно разветвление дерева иерархии по предметной области.

Таким образом программа анализирует введенный ответ и на основе его конструирует следующий вопрос, и в итоге выводи отчет по желанию эксперта.

Таким образом, интеллектуальная информационная система - это компьютерная модель интеллектуальных возможностей человека в целенаправленном поиске, анализе и синтезе текущей информации об окружающей действительности для получения о ней новых знаний и решения на этой основе различных жизненно важных задач.

Для ее достижения были решены следующие задачи:

Было разработано дерево иерархии по предметной области, для упрощения реализации программы.

Реализована программа языком программирования java, представляющая способ извлечения и анализа данных.

Было совершено подробное тестирование программы.

Разработанная система в итоге характеризируется тем, что диалог ведется в терминах проблемной области и на выходе пользователь получает конечный результат, являющийся целью его общения с программным приложением.

Все требования и задачи были выполнены. Данный проект масштабируемый так как хранит в себе алгоритм работы и базу знаний.

Список использованных источников

Андерсен В. Базы данных Microsoft Access. Проблемы и решения: Практ. пособ. /Пер. с англ.— М.: Издательство ЭКОМ, 2001.—384 с.: илл.

Глухих, И. Н. Интеллектуальные информационные системы : учеб. пособие для студентов учреждений высш. проф. образования / И. Н. Глухих ; М-во образования и науки Рос. Федерации, Тюм. гос. ун-т. - М. : Академия, 2012. - 110 с.

Ефимов, Е. Н. Информационные системы и технологии в экономике : учеб. пособие для студентов, обучающихся по специальностям "Мировая экономика", "Бухгалт. учет, анализ и аудит" и "Финансы и кредит" / Е. Н. Ефимов, Е. В. Ефимова, Г. М. Лапицкая ; под ред. Г. М. Лапицкой. - Ростов н/Д : МарТ: Феникс, 2012. - 296 с.

Ясницкий, Л. Н. Введение в искусственный интеллект : учеб. пособие для студентов вузов, обучающихся по мат. направлениям и специальностям / Л. Н. Ясницкий. - 3-е изд., стер. - М. : Академия, 2013. - 175 с.

Боженюк, А. В. Интеллектуальные интернет-технологии : учеб. для студентов вузов, обучающихся по специальности "Прикладная информатика (по обл.)" и др. специальностям / А. В. Боженюк, Э. М. Котов, А. А. Целых. - Ростов н/Д : Феникс, 2012. - 382 с.

Рассмотрев в главе 16 различные аспекты извлечения знаний, мы, однако, в явном виде не определили, каким методом эти знания получены. В неявном виде предполагалось, что это некоторое взаимодействие инженера по знаниям и эксперта в форме непосредственного живого общения. Однако это не единственная форма извлечения знаний, хотя и довольно распространенная.

Изложим классификацию методов извлечения знаний (рис. 17.10) [4], что позволит инженерам по знаниям, в зависимости от конкретной задачи и ситуации, выбрать конкретный метод. Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний – экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников).

Разделение этих групп методов на верхнем уровне классификации не означает их антагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.

Рис. 17.10.Классификация методов извлечения знаний

В свою очередь, коммуникативные методы можно также разделить на две группы: активные и пассивные. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний как бы передается эксперту, а инженер по знаниям только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции. В активных методах, напротив, инициатива полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами – в играх, диалогах, беседах за "круглым столом" и т.д.

Пассивные методы на первый взгляд достаточно просты, но на самом деле требуют от инженера по знаниям умения четко анализировать "поток сознания" эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность инженера по знаниям) значительно ослабляет эффективность этих методов, чем и объясняется их обычно вспомогательная роль при активных методах.

Активные методы можно разделить на две группы в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно помимо серии индивидуальных контактов с каждым применять и методы групповых обсуждений предметной области. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.

Отдельно следует сказать об играх. Игровые методы сейчас широко используются в социологии, экономике, менеджменте, педагогике для подготовки руководителей, учителей, врачей и других специалистов. Игра – это особая форма деятельности и творчества, где человек раскрепощается и чувствует себя намного свободнее, чем в обычной трудовой деятельности.

ПАССИВНЫЕ МЕТОДЫ

Название "пассивные" не должно вызывать иллюзий, поскольку этот термин введен как противовес к "активным" методам. В реальности же пассивные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог. Согласно классификации (см. рис. 17.10) к этой группе относятся:

2. анализ протоколов "мыслей вслух";

Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Может быть сделана и видеозапись в реальном масштабе времени. Непременное условие этого метода - невмешательство аналитика в работу эксперта хотя бы на первых порах.

Существуют две разновидности проведения наблюдений:

1. наблюдение за реальным процессом;

2. наблюдение за имитацией процесса.

Обычно используют обе разновидности.

Сеансы наблюдений могут потребовать от инженера по знаниям:

1. овладения техникой стенографии для фиксации действий эксперта в реальном масштабе времени;

2. ознакомления с методиками хронометрирования для четкого структурирования производственного процесса по времени;

3. развития навыков "чтения по глазам", наблюдательности к жестам, мимике и другим невербальным компонентам общения;

4. серьезного предварительного знакомства с предметной областью, так как из-за отсутствия "обратной связи" иногда многое непонятно в действиях экспертов. Протоколы наблюдений после сеансов в ходе домашней работы тщательно расшифровываются, а затем обсуждаются с экспертом. Таким образом, наблюдения – один из наиболее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.

Анализ протоколов "мыслей вслух"

Протоколирование "мыслей вслух" отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку своих рассуждений. Во время рассуждения эксперта все его слова протоколируются инженером по знаниям: при этом полезно отмечать даже паузы и междометия. Вопрос об использовании для этой цели магнитофонов и диктофонов является дискуссионным, поскольку магнитофон иногда действует на эксперта парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства, что люди не всегда в состоянии достоверно описать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, различные процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием.

Автор теории фреймов М. Минский считает, что "только как исключение, а не как правило человек может объяснить то, что он думает".

Расшифровка полученных протоколов производится инженером по знаниям самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" является одним из наиболее эффективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, он как бы свободно парит в потоке своих умозаключений и рассуждений. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.

Лекции

Лекция – самый старый способ передачи знаний. Лекторское искусство издревле высоко ценилось во всех областях науки и культуры. Но нас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и усваивать. Уже говорилось, что экспертов чаще всего не выбирают, и поэтому инженер по знаниям учить эксперта чтению лекций не сможет. Но если у эксперта опыт преподавателя (например, профессора клиники или опытного руководителя производства), то можно воспользоваться таким концентрированным фрагментом знаний, как лекция.

В лекции эксперту предоставлено много степеней свободы для самовыражения; при этом необходимо сформулировать эксперту тему и задачу лекции. При такой постановке опытный лектор может заранее структурировать свои знания, ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце задать необходимые вопросы.

Продолжительность лекции стандартная – от 40 до 50 мин и через 5-10 мин – еще столько же. Курс – от двух до пяти лекций.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.

В заключение несколько советов, как слушать лекции [15]:

1. к лекции подготовьтесь, т.е. познакомьтесь с предметной областью;

2. слушайте с максимальным вниманием. Для этого: устраните мешающие факторы (скрип двери, шорохи и т.д.); удобно устройтесь; поменьше двигайтесь;

3. учитесь отдыхать во время слушания (например, когда лектор приводит цифры, которые найдете в справочнике);

4. слушайте одновременно и лектора, и самого себя (параллельно рассуждениям лектора по ассоциации возникают и собственные мысли);

5. слушайте и одновременно записывайте, но записывайте текст сокращенно, используя условные значки (для всего этого достаточно только установить для себя ряд условных значков и ими неизменно пользоваться);

Читайте также: