logo
ИС_і технол_управл_Лаб

3.4.7 Прогнозирование с помощью линейной регрессии

Линейная регрессия необходима тогда, когда предполагается, что зависимость между входными факторами и результатом линейная. Достоинством ее можно назвать быстроту обработки входных данных и простоту интерпретации полученных результатов.

Обучение линейной регрессии

Для построения линейной регрессии необходимо запустить Мастер обработки и выбрать в качестве обработки данных Линейную регрессию.

На первом шаге задаем назначение исходных столбцов. Предположим, что на прогноз влияет информация за 2 прошлых месяца и за два месяца год назад, тогда укажем входными столбцами поля: "Количество-12", "Количество-11", "Количество-2", и "Количество-1". В качестве выходного поля укажем столбец "Количество". Остальные поля помечаем как информационные или неиспользуемые.

На следующем шаге происходит настройка обучающего и тестового множеств, способ разложения исходного множества данных.

Третий шаг установки позволяет осуществить ограничение диапазона входных значений. Данный шаг оставим без изменений. При нажатии на кнопку "Далее" появляется окно запуска процесса обучения. В процессе выполнения видно, какая часть распознана на этапе обучения и теста.

После выполнения процесса выберем в качестве способа отображения диаграмму рассеяния и отображение результатов в виде диаграммы. Как видно из диаграммы рассеяния, обучение прошло с хорошей точностью.

Рисунок 3.15 – Коэффициенты полученной регрессионной модели

На рис. 3.15 приведены коэффициенты полученной модели. Запишем саму модель, обозначив - объем продаж в момент времени :

Возьмем теперь в качестве - момент времени, следеющий за последним известным значением. Используя приведенную модель, можно будет вычислить объем продаж на месяц вперед. Повторив эту процедуру, вычислим объем продаж еще на месяц вперед и т.д.

В программе Deductor прогноз вычисляется автоматически.

Прогнозирование

Теперь для построения прогноза запустим Мастера обработки, в котором выберем прогнозирование. На первом шаге обработчика происходит настройка связи столбцов для прогнозирования. Укажем связь между столбцами и горизонт прогноза равный 3 (рис. 3.16).

На следующем шаге задаются параметры визуализации. Для данного примера выбираем отображение результатов в виде диаграммы прогноза. Теперь аналитик может дать прогноз о продажах, основываясь на модели, построенной с помощью линейной регрессии (рис. 3.17).

Рисунок 3.16 – Настройка параметров прогнозирования

Выводы

Данный пример показал целесообразность применения линейного регрессионного анализа для прогнозирования линейных зависимостей.

Простота настроек и быстрота построения модели иногда бывают необходимы. Аналитику достаточно указать входные столбцы - факторы, выходные – результат, указать способ разбиения данных на тестовое и обучающее множество и запустить процесс обучения. Причем после этого будут доступны все механизмы визуализации и анализа данных, позволяющие построить прогноз, провести эксперимент по принципу "Что-если", исследовать зависимость результата от значений входных факторов, оценить качество построенной модели по диаграмме рассеяния. Также по результатам работы этого алгоритма можно подтвердить или опровергнуть гипотезу о наличии линейной зависимости.

Рисунок 3.17 – Прогноз продаж на три периода вперед