logo
Практические работы

3.3. Интерпретация ассоциативных правил

Теперь остановимся на наиболее важном этапе – интерпретации ассоциативных правил. Дело в том, что ассоциативные правила сами по себе, как результат работы некоторого алгоритма, еще не готовы к использованию. Их нужно проинтерпретировать, то есть понять, какие из ассоциативных правил представляют интерес, действительно ли правила отражают закономерности или, наоборот, являются артефактом. Это требует от аналитика тщательной работы и понимания предметной области, в которой решается задача ассоциации.

Все множество ассоциативных правил можно разделить на три вида.

Варьируя верхний и нижний пределы поддержки и достоверности, можно избавиться от очевидных и неинтересных закономерностей. Как следствие, правила, генерируемые алгоритмом, принимают приближенный к реальности вид. Значения верхнего и нижнего пределов сильно зависят от предметной области, поэтому не существует четкого алгоритма их выбора. Но есть ряд общих рекомендаций.

Вернемся к задаче. Представим результаты расчетов в OLAP-кубе, как это показано на рис. 3.7.

Рис. 3.7. Ассоциативные правила в OLAP-кубе

Например, правило кондиционер для белья → стиральный порошок-автомат имеет S = 3,86%; С = 84,95%. Это означает следующее.

Анализ правил позволяет прийти к выводу, что многие из них тривиальны, так как это лидеры продаж магазина (см. популярные наборы, рис. 3.5), хотя есть и интересные правила (например, средство от накипи → чистящий порошок универсальный). И тот факт, что при достоверности 42-43% встречаются тривиальные ассоциативные правила (например, мыло кусковое → мыло жидкое), говорит о том, что можно найти интересные правила при меньших значениях достоверности. Сделаем следующее:

В итоге получим как вариант следующие дополнительные правила (рис. 3.8). Как видно, все эти правила можно назвать полезными: они неочевидны, но понятны. Например, возьмем правило пятновыводитель → отбеливатель.

Рис. 3.8. Полезные правила с достоверностью меньше 40%

Рассчитаем его улучшение:

Величина 2,88 > 1. Значит, предсказать покупку отбеливателя с помощью правила вероятнее, чем угадать случайно.

Как компания может применять на практике результаты ассоциативного анализа? Перечислим лишь некоторые варианты: