5.3. Методы извлечения знаний
По принципу источника знаний методы их извлечения делятся на коммуникативные и текстологические. Коммуникативные методы – это набор приемов и процедур, предпочитающих контакт когнитолога с непосредственным источником знаний – экспертом, а текстологические включают методы извлечения знаний из документов и специальной литературы.
В свою очередь коммуникативные методы делятся на пассивные и активные. Пассивные методы извлечения знаний включают такие методы, где ведущая роль фактически передается эксперту, а когнитолог только фиксирует рассуждения эксперта во время работы по принятию решений. К этим методам относятся наблюдения, анализ протоколов «мыслей вслух» и лекции.
В процессе наблюдений когнитолог находится рядом с экспертом во время его профессиональной деятельности и протоколирует все его действия. Эксперт максимально комментирует свои действия. Непременное условие этого метода – невмешательство когнитолога в работу эксперта. Наблюдения – один из распространенных методов извлечения знаний на начальных этапах разработки ЭС.
Протоколирование «мыслей вслух» отличается от наблюдений тем, что эксперт не просто комментирует, но и объясняет цепочку рассуждений при решении конкретной задачи. Основной трудностью при протоколировании «мыслей вслух» является принципиальная сложность для любого человека объяснить, как он думает, поскольку люди не всегда в состоянии достоверно описать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме, слабо коррелируют с их словесным описанием (например, различные процедурные знания типа «Как завязать галстук»). Обычно «мысли вслух» дополняются одним из активных методов для реализации обратной связи с экспертом.
Лекция является самым старым способом передачи знаний. Использование лекции для извлечения знаний целесообразно, если эксперт обладает лекторским мастерством. В процессе лекции когнитолог может задавать уточняющие вопросы. Как и другие пассивные методы, лекции используются для извлечения знаний на начальных стадиях разработки ЭС.
В активных методах извлечения знаний ведущая роль принадлежит когнитологу. Активные методы подразделяются на индивидуальные и групповые. Активные индивидуальные методы извлечения знаний в настоящее время являются наиболее распространенными и включают анкетирование, интервью, свободный диалог, игры с экспертом.
Анкетирование – наиболее жесткий метод (стандартизированный). Когнитолог заранее составляет вопросник и осуществляет опрос некоторых экспертов. Существует несколько общих рекомендаций при составлении анкет:
анкета не должна быть монотонной и однообразной;
анкета не должна быть приспособлена к языку экспертов;
поскольку вопросы влияют друг на друга, их последовательность должна быть строго продумана;
желательно стремиться к оптимальной избыточности;
язык анкеты должен быть ясным, понятным, предельно вежливым.
Под интервью понимается специфическая форма общения когнитолога с экспертом, в которой когнитолог задает эксперту серию заранее подготовленных вопросов. В интервью когнитолог имеет возможность в зависимости от ситуации ряд вопросов опускать или вставлять новые, изменять темп, разнообразить ситуацию общения. По форме вопросы подразделяются на открытые (для ответа предоставляют полную свободу) и закрытые (предполагают фиксированные ответы), личные и безличные, прямые и косвенные, вербальные и с использованием наглядного материала. По функции – на основные, зондирующие и контрольные, по воздействию вопросы подразделяются на нейтральные и наводящие.
Свободный диалог – это метод извлечения знаний в форме беседы когнитолога и эксперта. Диалог предполагает выбор правильного темпа и ритма беседы, поскольку при больших паузах эксперт отвлекается, а при высоком темпе быстро утомляются оба собеседника.
Игра с экспертом предполагает, что эксперт и когнитолог в моделируемой ситуации берут на себя некоторые роли, например «учитель» и «ученик». В процессе игры эксперт поправляет ошибки «ученика». Существуют следующие советы когнитологу по проведению индивидуальных игр: играть смело, нешаблонно; не навязывать игру эксперту, если он не расположен; в игре «не давить на эксперта» и не забывать цели игры.
К активным групповым методам извлечения знаний относятся «мозговой штурм», дискуссии за круглым столом и ролевые игры.
«Мозговой штурм», или «мозговая атака», – один из наиболее распространенных методов раскрепощения и активизации творческого мышления. Основная идея «штурма» – это отделение процедуры генерирования идей в замкнутой группе экспертов от процесса анализа и оценки высказанных идей. Как правило, «штурм» длится не более 40 минут с числом участников до 10 человек. Экспертам предлагается высказывать любые идеи на заданную тему (критика запрещена). Оценивает результаты группа экспертов, не участвовавшая в «штурме».
Метод круглого стола предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Задача дискуссии – коллективно, с разных точек зрения, под разными углами исследовать спорные гипотезы предметной области. По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменили тему и чтобы критика позиций друг друга была обоснованной.
Ролевые игры предусматривают участие в экспертной игре нескольких экспертов. Роль – комплекс образцов поведения. Когнитолог является режиссером и сценаристом, и ему предоставляется полная свобода в выборе формы проведения игры. Из трех основных типов деловых игр (учебных, планово-производственных и исследовательских) к экспертам ближе всего исследовательские, которые используются для анализа систем, проверки правил принятия решений.
Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении текстов. Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре (смысловой структуре, или макроструктуре текста), настраиваемой над естественным текстом. При этом можно выделить две смысловые структуры (рис. 5.3):
М1 – смысл, который пытался заложить автор в текст, его модель мира;
М2 – смысл, который постигает читатель, в данном случае когнитолог, в процессе интерпретации I (понимания) текста;
Т – результат вербализации V смысла М1.
Сложность процесса извлечения знаний из текста заключается в принципиальной невозможности совпадения знаний, образующих М1 и М2. Таким образом, два когнитолога извлекут из одного текста Т две различные модели.
Рис. 5.3. Схема извлечения знаний из специальных текстов
Сложность интерпретации научных и специальных текстов заключается еще и в том, что любой текст приобретает смысл только в контексте, под ним понимается окружение, в которое «погружен» текст.
Методы извлечения знаний являются основой к структурированию знаний. Простейший прагматический подход к формированию Рz включает этапы:
Определение входных и выходных данных.
Составление словаря терминов и набора ключевых слов.
Выявление объектов и понятий, т.е. формирование полного систематического набора терминов из области знаний.
Выявление связей между понятиями.
Выявление метапонятий и детализация понятий на более низком уровне.
Построение пирамиды знаний – иерархической лестницы понятий, подъем по которой означает углубление понимания и повышение уровня обобщенности понятий.
Определение отношений между понятиями как внутри каждого из уровней пирамиды, так и между уровнями.
Определение стратегий принятия решений, т.е. выявление цепочек рассуждений, связывающих все сформированные ранее понятия и отношения.
Структурирование Рz.
- Введение
- Глава 1. Интеллектуальные информационные системы
- Основные направления в искусственном интеллекте
- Нейросетевые и нейрокомпьютерные технологии.
- Мультиагентные (многоагентные) системы.
- 1.2. Данные и знания
- Эволюция развития информационных систем
- 1.4. Основные разновидности иис и характеристики решаемых задач
- 1.5. Классификация иис
- Глава 2. Структура и этапы проектирования экспертных систем
- 2.1. Структура статической и динамической эс
- 2.2. Характеристики, стадии существования и этапы проектирования статических эс
- Глава 3. Модели представления знаний
- 3.1. Продукционная модель
- 3.2. Формально-логическая модель
- 3.3. Фреймовая модель
- 3.4. Семантические сети
- Глава 4. Методы обработки знаний в интеллектуальных системах. Нечеткие знания
- 4.1. Интерпретатор правил и управление выводом
- 4.2. Нечеткие знания и нечеткая логика
- Глава 5. Теоретические основы инженерии знаний
- 5.1. Процедура извлечения знаний
- 5.2. Основные аспекты извлечения знаний
- 5.3. Методы извлечения знаний
- Глава 6. Нейронные сети
- 6.1. Искусственный нейрон и функции активации
- 6.2. Нейронные сети с прямой связью
- 6.3. Алгоритмы обучения нейронных сетей
- Глава 7. Технология создания экономических советующих систем
- 7.1. Определение и виды информационных технологий
- 7.2. Технология «Ресурс – Обучение – Цель»
- 7.3. Определение коэффициента важности целей
- Глава 8. Программный инструментарий разработки систем, основанных на знаниях
- 8.1. Цели и принципы технологии разработки программных средств
- 8.2. Технология и инструментарий разработки программных средств
- Глава 9. Интеллектуальные интернет-технологии
- 9.1. Интеллектуальные агенты
- 9.2. Мультиагентные системы
- Мультиагентные системы различного функционального назначения
- Глава 10. Новые тенденции инженерии знаний,
- 10.1. Методы извлечения глубинных пластов экспертного знания
- 10.2. Хранилища данных
- 10.3. Управление знаниями
- 10.4. Технология создания систем управления знаниями
- Глава 11. Интеллектуальные информационные системы в условиях неопределенности и риска
- 11.1. Понятие риска в сппр слабоструктурированных проблем
- 11.2. Реализация эс инвестиционного проектирования
- * Эс определения целей инвестирования капитала.
- Глава 12. Системы, ориентированные на естественно-языковые запросы. Машинное обучение
- 12.1. Естественно-языковые интерфейсы
- 12.2. Машинное обучение
- Глава 13. Современные методы исследования,
- 13.1. Интеллектуальные методы проектирования сложных систем
- 13.2. Эвристические методы синтеза сложных систем
- 13.3. Интегрированные, гибридные и синергетические системы
- Библиографический список
- Оглавление
- Николай Александрович Семенов Интеллектуальные информационные системы
- 170026, Г. Тверь, наб. Афанасия Никитина, 22