logo
Avtomatizatsia_ekonomicheskih_raschetov_v_Excel

7.3.3. Проверка уравнения регрессии на адекватность

По мере увеличения степени полинома будет наблюдаться все лучшее соответствие экспериментальных и расчетных данных.

Очевидно, что повышать степень полинома до бесконечности не имеет смысла. Поэтому встает вопрос: а на какой степени полинома остановится?

Критерием остановки расчетов является получение адекватного описания данных.

Для решения этого вопроса используется следующая схема вычислений:

Пусть для обработки было представлено 10 измерений – N=10.

И пусть в результате расчетов остаточных сумм квадратов для уравнений разных степеней получены следующие результаты:

Степень уравнения

0

1

2

3

4

Остаточная сумма квадратов

10000

4000

155

152

150

Как следует из таблицы, с увеличением степени полинома остаточная суммы квадратов уменьшается, т.е. степень соответствия уравнения описываемым данным увеличивается. В то же время видно, что для больших степеней уменьшение остаточной суммы практически прекращается. Поэтому необходимо объективное правило, согласно которому увеличение степени полинома можно прекратить без ущерба для точности описания данных.

Для решения этого вопроса производятся следующие вычисления.

  1. Вычисляются сумы квадратов, приходящиеся на каждую компоненту уравнения. Вычисления производятся по формуле:

SSk = SSk-1SSk , (7.9)

где

SS – остаточная сумма квадратов;

k – степень полинома.

Для данного примера:

Степень уравнения

0

1

2

3

4

Остаточная сумма квадратов

10000

4000

155

152

150

Сумма квадратов, приходящаяся на компоненту уравнения

6000

3845

3

2

  1. Определяются числа степеней свободы для компонент уравнения остаточной суммы квадратов.

Для каждой компоненты это число равно 1, а для остаточной суммы вычисляется по формуле:

f = Nk – 1, (7.10)

где

N – общее число измерений;

k – количество коэффициентов в уравнении.

Для данного примера:

Степень уравнения

0

1

2

3

4

Число степеней свободы, для компоненты

1

1

1

1

Число степеней свободы на остаточную сумму квадратов (ошибки)

7

6

5

4

  1. Определяются величины дисперсий для компоненты и ошибки текущей степени уравнения.

Вычисления производятся по формуле:

s2 = SS / f. (7.11)

Для данного примера:

Степень уравнения

0

1

2

3

4

Дисперсия для компоненты

6000

3845

3

2

Дисперсия для ошибки

571,42

25,83

30,4

37,5

  1. Для каждой компоненты вычисляется критерий Фишера.

Вычисления производятся по формуле:

F = s2k / s2e , (7.12)

где

s2k – дисперсия компоненты;

s2e – дисперсия ошибки.

Для данного примера:

Степень уравнения

0

1

2

3

4

F-отношение

10,5

148,84

0,098

0,0533

  1. Для каждой компоненты определяются критические значения критерия Фишера.

Эти значения вычисляются с помощью встроенной в Excel функции FРАСПОБР.

Аргументами этой функции являются:

а) уровень значимости.

Если мы хотим сделать свои выводы с надежность 95%, то его значение должно быть равно 0,05.

б) число степеней свободы для числителя.

У нас при вычислении F-отношения в числителе находилась дисперсия компоненты, число степеней свободы которой всегда равно 1.

в) число степеней свободы для знаменателя.

Здесь указывается число степеней свободы для ошибки.

В результате всех вычислений должна получиться следующая сводная таблица.

Степень уравнения

0

1

2

3

4

Остаточная сумма квадратов

10000

4000

155

152

150

Сумма квадратов, приходящаяся на компоненту уравнения

 

6000

3845

3

2

Число степеней свободы, для компоненты

 

1

1

1

1

Число степеней свободы для остаточной суммы квадратов

 

7

6

5

4

Дисперсия для компоненты

 

6000

3845

3

2

Дисперсия для ошибки

 

571,42

25,83

30,4

37,5

F-отношение

 

10,5

148,84

0,098

0,0533

F критическое

 

5,59

5,98

6,608

7,7086

Для решения вопроса о статистической значимости компонент уравнения производится сравнение вычисленных значений критерия Фишера с критическими.

Если вычисленное значение больше критического, компонента признается статистически значимой при выбранном уровне надежности. В противном случае компонента признается статистически не значимой.

В данном примере статистически существенными является компоненты первой и второй степени. Компоненты более высоких степеней не существенны. Поэтому для адекватного описания наших данных достаточно использовать уравнение второй степени следующего вида:

. (7.13)