ММвЭ- лекции

5.4 Определение уравнений линейной регрессии

При оптимальном проектировании важными элементами математической модели являются зависимости между параметрами объекта проектирования, как в форме ограничений, так и целевой функцией. Такие зависимости могут быть теоретическими и статистическими. Примером теоретических зависимостей может служить объем бака

V = abh, который был целевой функцией.

Но, к сожалению, такие теоретические зависимости между параметрами бывают известны далеко не всегда.

Если теоретические зависимости отсутствуют, то необходимые соотношения можно определять на основании имеющихся статистических данных. Для определения статистических зависимостей необходимо выполнить 2 шага:

На основании физического смысла статистических данных принять вид аналитических зависимостей, например, полином 2-й степени, экспонента, линейная зависимость и т. д.

С помощью метода наименьших квадратов по имеющимся статистическим данным найти значения величин, определяющих конкретный вид принятых зависимостей.

Полученные аналитические зависимости называются уравнениями регрессии и в общем случае имеют вид у = f(x₁, х₂....х_n).

Классификация уравнений регрессии приведена на рис. 5.8.

Уравнение регрессии

Число переменных

Вид зависимости

Парная

Линейная

Множественная

Нелинейная

Рис. 5.8

Регрессия называется парной, если она описывает зависимость между функцией и одной переменной и имеет вид

y=f(x) (5.3)

Регрессия называется множественной, если она описывает зависимость функции от нескольких переменных и имеет вид

y=f(x₁,x₂,...x_n). (5.4)

Если зависимости (5.3) и (5.4) являются линейными, то регрессия называется линейной, в противном случае регрессию называют нелинейной. Зависимости между параметрами объектов проектирования, как правило, являются нелинейными. Очень важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается величиной R², находящейся в пределах

0 R² 1.

При R² = 0 величины, для которых определяются уравнения регрессии, являются независимыми; при R² = 1 имеет место функциональная (а не статистическая) зависимость. Принято считать допустимым R² 0,7.

Чем больше статистических данных, используемых при определении уравнения регрессии, тем точнее будет определена искомая зависимость. Но при этом следует иметь в виду, что количество статистических данных не может обеспечить получение достоверной зависимости, если в действительности такой зависимости между исследуемыми величинами нет. Вместе с тем, есть минимальное количество К необходимых исходных данных, определяемое методом наименьших квадратов, с помощью которого, как мы отмечали, находится уравнение регрессии. К определяется по формуле

К=М+2. (5.5)

где М — количество неизвестных величин в искомом уравнении регрессии. Например, для уравнения парной регрессии:

при линейной зависимости

у = b + mх

необходимо определить 2 величины: b и m;

при уравнении регрессии в виде полинома 2-й степени

у = b + m₁x + m₂x²

необходимо определить 3 величины: b, m₁, m₂.

Уравнение множественной регрессии при решении практических задач принимается, как правило, в виде полинома 2-й степени, для которого число определяемых величин находится по зависимости

М= , (5.6)

где n — число искомых переменных.

Объединяя (5.5) и (5.6), нетрудно выяснить минимально необходимое количество исходных данных для определения

уравнения регрессии:

(5.7)

Подчеркнем, что эта величина К является нижней границей количества исходных данных, необходимых для метода наименьших квадратов. А достоверность полученного результата следует оценивать с помощью уже упомянутой величины R².

Регрессия является линейной в том случае, когда уравнение (5.4) имеет вид:

(5.8)

Для получения уравнения регрессии необходимо:

определить значения b, mi;
оценить достоверность полученного уравнения.

Содержание