logo
ММвЭ- лекции

5.4 Определение уравнений линейной регрессии

При оптимальном проектировании важными элементами ма­тематической модели являются зависимости между параметра­ми объекта проектирования, как в форме ограничений, так и целевой функцией. Такие зависимости могут быть теоретиче­скими и статистическими. Примером теоретических зависимо­стей может служить объем бака

V = abh, который был целевой функцией.

Но, к сожалению, такие теоретические зависимости между па­раметрами бывают известны далеко не всегда.

Если теоретические зависимости отсутствуют, то необходимые соотношения можно определять на основании имеющихся ста­тистических данных. Для определения статистических зависи­мостей необходимо выполнить 2 шага:

Полученные аналитические зависимости называются уравне­ниями регрессии и в общем случае имеют вид у = f(x1, х2....хn).

Классификация уравнений регрессии приведена на рис. 5.8.

Уравнение регрессии

Число переменных

Вид зависимости

Парная

Линейная

Множественная

Нелинейная

Рис. 5.8

Регрессия называется парной, если она описывает зависимость между функцией и одной переменной и имеет вид

y=f(x) (5.3)

Регрессия называется множественной, если она описывает зави­симость функции от нескольких переменных и имеет вид

y=f(x1,x2,...xn). (5.4)

Если зависимости (5.3) и (5.4) являются линейными, то регрессия называется линейной, в противном случае регрессию называют нелинейной. Зависимости между параметрами объек­тов проектирования, как правило, являются нелинейными. Очень важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается величи­ной R2, находящейся в пределах

0 R2 1.

При R2 = 0 величины, для которых определяются уравнения регрессии, являются независимыми; при R2 = 1 имеет место функциональная (а не статистическая) зависимость. Принято считать допустимым R2 0,7.

Чем больше статистических данных, используемых при опре­делении уравнения регрессии, тем точнее будет определена ис­комая зависимость. Но при этом следует иметь в виду, что ко­личество статистических данных не может обеспечить получе­ние достоверной зависимости, если в действительности такой зависимости между исследуемыми величинами нет. Вместе с тем, есть минимальное количество К необходимых исходных данных, определяемое методом наименьших квадратов, с по­мощью которого, как мы отмечали, находится уравнение рег­рессии. К определяется по формуле

К=М+2. (5.5)

где М — количество неизвестных величин в искомом уравне­нии регрессии. Например, для уравнения парной регрессии:

у = b + mх

необходимо определить 2 величины: b и m;

у = b + m1x + m2x2

необходимо определить 3 величины: b, m1, m2.

Уравнение множественной регрессии при решении практиче­ских задач принимается, как правило, в виде полинома 2-й степени, для которого число определяемых величин находится по зависимости

М= , (5.6)

где n — число искомых переменных.

Объединяя (5.5) и (5.6), нетрудно выяснить минимально необходимое количество исходных данных для определения

уравнения регрессии:

(5.7)

Подчеркнем, что эта величина К является нижней границей количества исходных данных, необходимых для метода наи­меньших квадратов. А достоверность полученного результата следует оценивать с помощью уже упомянутой величины R2.

Регрессия является линейной в том случае, когда уравнение (5.4) имеет вид:

(5.8)

Для получения уравнения регрессии необходимо: