Горячева Н

5.4.6. Стадия тестирования

Стадия тестирования включает оценивание качества работы и полезности программы-прототипа и ее пересмотр, если это необходимо. Эксперт обычно оценивает прототип и помогает заставить разработчиков заново пройти через разные этапы разработки [8].

Оценивание качества работы системы-прототипа состоит в ответе на следующие вопросы:

- Принимает ли система решения, которые обычно признаются экспертами правильными?

- Являются ли правила вывода безошибочными, непротиворечивыми и полными?

- Адекватно ли объяснения системы описывают, как и почему были получены те или иные заключения?

Оценивание полезности системы заключается в ответе на следующие вопросы:

- Помогает ли решение задачи пользователю сколь-нибудь существенным образом?

- Являются ли заключения системы упорядоченными и изложенными с нужной степенью подробности?

- Удовлетворяет ли пользователя скорость работы системы?

В свою очередь инженер по знаниям подбирает примеры, обеспечивающие проверку всех возможностей разработанной экспертной системы. Различают следующие источники неудач в работе системы: тестовые примеры, ввод-вывод, правила вывода, управляющие стратегии [3].

Показательные тестовые примеры являются наиболее очевидной причиной неудачной работы экспертной системы. В худшем случае тестовые примеры могут оказаться вообще вне предметной области, на которую рассчитана экспертная система, однако чаще множество тестовых примеров оказывается слишком однородным и не охватывает всю предметную область. Поэтому при подготовке тестовых примеров следует классифицировать их по подпроблемам предметной области, выделяя стандартные случаи, определяя границы трудных ситуаций и т. п.

Ввод-вывод характеризуется данными, приобретенными в ходе диалога с экспертом, и заключениями, предъявленными экспертной системой в ходе объяснений. Методы приобретения данных могут не давать требуемых результатов, так как, например, задавались неправильные вопросы или собрана не вся необходимая информация. Кроме того, вопросы системы могут быть трудными для понимания, многозначными и не соответствующими знаниям пользователя. Ошибки при вводе могут возникать также из-за неудобного для пользователя входного языка. В ряде приложения для пользователя удобен ввод не только в печатной, но и в графической или звуковой форме.

Выходные сообщения (заключения) системы могут оказаться непонятны пользователю (эксперту) по разным причинам. Например, их может быть слишком много или, наоборот, слишком мало. Также причиной ошибок может являться неудачная организация, упорядоченность заключений или неподходящий пользователю уровень абстракций с непонятной ему лексикой.

Наиболее распространенный источник ошибок в рассуждениях касается правил вывода. Важная причина здесь часто кроется в отсутствии учета взаимозависимости сформированных правил. Другая причина заключается в ошибочности, противоречивости и неполноте используемых правил. Если неверна посылка правила, то это может привести к употреблению правила в неподходящем контексте. Если ошибочно действие правила, то трудно предсказать конечный результат. Правило может быть ошибочно, если при корректности его условия и действия нарушено соответствие между ними.

Нередко к ошибкам в работе экспертной системы приводят применяемые управляющие стратегии. Изменение стратегии бывает необходимо, например, если экспертная система анализирует сущности в порядке, отличном от «естественного» для эксперта. Последовательность, в которой данные рассматриваются экспертной системой, не только влияет на эффективность работы системы, но и может приводить к изменению конечного результата. Так, рассмотрение правила А до правила В способно привести к тому, что правило В всегда будет игнорироваться системой. Изменение стратегии бывает также необходимо и в случае неэффективной работы экспертной системы. Кроме того, недостатки в управляющих стратегиях могут привести к чрезмерно сложным заключениям и объяснениям экспертной системы.

Средняя продолжительность составляет 1-2 недели.

Содержание