logo
217 Информационные технологии в ЭИС

8.2. Базы знаний. Представление знаний.

Основой экспертной системы является база знаний. Она накапливается в процессе ее построения.

База знаний – это совокупность моделей, правил и факторов, порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области. База знаний, обусловливающая компетентность экспертной системы, воплощает в себе знания специалистов учреждения, отдела, опыт группы специалистов и представляет собой институциональные знания (свод квалифицированных, обновляющихся стратегий, методов, решений).

Рис. 8.2. Свойства базы знаний.

Содержание базы знаний может быть применено пользователем для получения эффективных управленческих решений. На рис. 8.3. показана структура базы знаний и ее функционирование.

Рис. 8.3. Технология использования базы знаний.

Блок приобретения знаний отражает накопление базы знаний (БЗ), этап модификации знаний и данных. БЗ отражает возможность использования высококачественного опыта на уровне мышления квалифицированных специалистов.

Блок объяснений отражает в технологии использования баз знаний пользователем последовательность шагов, которые привели к тому или иному выводу с возможностью ответа на вопрос «почему».

Блок логических выводов, осуществляя сопоставление правил с фактами, порождает цепочки выводов.

База знаний может иметь значительный объем памяти и специальные средства с хранимыми в ней знаниями. По отношению к БЗ рекомендуются те же основные функции, что и к базе данных:

- создание, загрузка;

- актуализация, поддержание в достоверном состоянии;

- расширение, включение новых знаний;

- обработка, формирование знаний, соответствующих текущей ситуации.

Для выполнения этих функций разрабатываются соответствующие программные средства.

База знаний представляет собой модель экспертных знаний, т.е. знаний специалистов в данной предметной области.

Знания основаны на данных, полученных эмпирическим путем. Знания – это закономерности предметной области, полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области. Знания – это хорошо структурированные данные, или данные о данных, т.е. метаданные. Подобное свойство означает, что значимостью обладают не только набор единиц информации, но и связи между этими единицами, отображающие определенные информационные отношения. Связи могут выражаться числовыми величинами, устанавливаемыми экспертным путем и задающими тесноту связи между объектами или явлениями, а также содержать условия типа «если (условие) – то (действие)», определяющие факт наличия или отсутствия связи в зависимости от истинности или ложности условия.

Знания связаны семантическими, синтаксическими и прагматическими отношениями и позволяют решать прикладные задачи.

Знаниям присуще пять свойств:

1. Внутренняя интерпретируемость. Вместе с информационной единицей в памяти хранится система имен, связанная с информационной единицей. Наличие системы имен позволяет системе «знать», что хранится в ее памяти, и, следовательно, уметь отвечать на запросы о содержании памяти.

2. Рекурсивная структурируемость. Информационные единицы могут расчленяться на более мелкие и объединяться в более крупные. Для этих операций могут использоваться родовидовые отношения и принадлежность элементов к классу.

3. Взаимосвязь единиц. Между единицами возможно установление самых разнообразных отношений, отражающих семантику и прагматику связей, явлений и фактов.

4. Наличие семантического пространства с метрикой. Оно характеризует близость – удаленность информационных единиц.

5. Активность. Активность базы знаний позволяет экспертным системам формировать мотивы, ставить цели и строить процедуры их выполнения.

Знания бывают:

- декларативные и процедурные,

- глубинные и поверхностные,

- жесткие и мягкие,

- конкретные и общие,

- теоретические и эмпирические,

- концептуальные и экспертные знания,

- синтаксические, семантические и прагматические знания.

Представление знаний в ЭС является решающим аспектом их разработки. Выбор модели (или языков) представления знаний важен ввиду их разнообразия, так как он оказывает огромное влияние на любую часть экспертной системы, предопределяет ее возможности (свойства и характеристики), определяет характер получения, накопления знаний, в результате которого создается база знаний, ориентированная на определенную структуру представления.

Под представлением знаний подразумевают соглашение о том, как описывать реальную предметную область (понятия и отношения). Иногда такое соглашение называют нотацией.

Существуют следующие типы моделей представления знаний:

Логические модели основаны на исчислении высказываний и предикатов, заимствованных из логики. Предикат - часть суждения, отображающая предмет мышления. Каждый факт в БЗ представляется в виде некоторого набора предикатов, а сложная структура из фактов задается формулами, связывающими предикаты с помощью логических союзов (отрицания, конъюнкции (V), импликации (۸), дизъюнкции, логического следования (→)). Достоинство модели: возможность использования для поиска в БЗ фактов и закономерностей, достаточно хорошо разработанных в логике процедур логического вывода. Недостатки: плохая наглядность представления знаний, громоздкость записей, при формировании записей можно допустить ошибки.

Семантические сети – это ориентированный граф, вершины которого – понятия, а дуги – отношения между ними. В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения – это связи типа «это», «имеет частью», «принадлежит» и др. Семантические сети предоставляют разработчикам много возможностей для отображения в базе знаний необходимых фактов и закономерностей предметной области. Недостатками модели являются сложность организации процедуры поиска и вывода на семантической сети, а также неоднозначность представления знаний и неоднородность связей.

На рис. 8.4. изображена семантическая сеть. В качестве вершин выступают понятия: «человек», «Иванов», «Волга», «автомобиль», «вид транспорта» и «двигатель».

Рис. 8.4. Семантическая сеть.

Фреймы используются в экспертных системах как одна из распространенных форм представления знаний.

Фрейм – это минимально возможное описание сущности какого – либо явления, события, процесса или объекта. Минимально возможное означает, что при дальнейшем упрощении описания теряется его полнота, оно перестает определять ту единицу знаний, для которой оно предназначено.

Различают фреймы – образцы или прототипы (протофреймы), хранящиеся в базе знаний, и фреймы - экземпляры (экзофреймы), которые создаются для отображения реальных фактических ситуаций на основе поступающих данных.

Фрейм имеет почти однородную структуру и состоит из стандартных единиц, называемых слотами. Каждая такая единица имеет название и свое значение. Изображается фрейм в виде цепочки:

Фрейм = < слот 1 > < слот 2 > … < слот N >.

В качестве слота может быть указано имя другого фрейма. Значениями слота могут быть конкретные данные, процедуры и даже продукции.

Фрейм определяется как структура следующего вида:

(имя фрейма,

имя слота 1 (значение слота 1)

имя слота 2 (значение слота 2)

имя слота N (значение слота N))

Определим, например, фрейм для объекта «служащий»:

служащий

Ф.И.О. (Петров И.П.)

Должность (инженер)

Категория (2)

Если значение слотов не определены, то фрейм называют фреймом – прототипом, в противном случае – конкретным фреймом или экземпляром фрейма.

Из всех рассмотренных ранее моделей представления знаний только фреймам свойственна высокая структурируемость, внутренняя интерпретируемость посредством имен и значений, связность слотов и их значений. Фреймы также обладают высокой наглядностью и модульностью. Однако фреймы наиболее эффективны при обработке семантической составляющей знаний. У фреймов, как и у семантических сетей, отсутствуют универсальные процедуры их обработки, что приводит к неэффективному использованию ресурсов вычислительной техники (памяти и быстродействия).

Продуктивные модели представления знаний, основанные на правилах, позволяют представить знания в виде выражений типа:

Если < условия > то < действие >

Если < причина > то < следствие >

Если < ситуация > то < решение >

Суть этих выражений заключается в том, что если выполняется условие, то нужно произвести некоторое действие. Продукционные модели могут быть реализованы как процедурно, так и декларативно. В процедурных системах присутствуют три компонента:

- база данных;

- некоторое число продукционных правил, состоящих из условий и действий;

- интерпретатор, который последовательно определяет, какие продукции могут быть активированы в зависимости от содержащихся в них условий.

В базе данных хранятся известные факты выбранной предметной области. Продукционные правила (продукции) содержат специфические знания предметной области о том, какие еще дополнительные факты могут быть учтены, есть ли специфические данные в БД.

Благодаря свойству модульности, присущему продукционным моделям, можно добавлять и изменять знания (правила, факты). Поэтому продукционные модели применяются в предметной области, где нет четкой логики и задачи решаются на основе независимых правил (эвристик).

Правила продукции несут информацию о последовательности целенаправленных действий. Продукция выражается языковой конструкцией вида «если возникает определенная ситуация, то возможно предпринять определенный набор действий».

Достоинства модели: наглядность, высокая модульность, легкость внесения дополнений и изменений, простота механизма логического вывода. Недостатком является то, что при увеличении объема знаний эффективность информационных единиц модели падает.

Рассмотренные модели (языки) представления знаний используются в современных интеллектуальных системах и прежде всего в экспертных системах. Каждая из форм представлений знаний может служить основой для создания языка программирования, ориентированного на работу со знаниями. Такими языками являются язык FRL (Frame Representations Language), основанный на фреймовых представлениях, язык Пролог, опирающийся на модель представления в виде продукций. Однако, как было отмечено выше, разные модели имеют свои преимущества и недостатки. Поэтому в последнее время наметилась тенденция создавать комбинированные языки представления знаний. Чаще всего комбинируются фреймовые и продукционные модели.