logo
информатика

57. Регрессионный анализ. Линейная регрессия

Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xiи имеет вид:

где у - зависимая переменная (она всегда одна);

хi - независимые переменные (факторы) (их может быть несколько).

Если независимая переменная одна - это простой регрессионный анализ. Если же их несколько (п 2)то такой анализ называется многофакторным.

В ходе регрессионного анализа решаются две основные задачи:

Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы.

В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.

Регрессионный анализ - один из наиболее разработанных методов математической статистики. Строго говоря, для реализации регрессионного анализа необходимо выполнение ряда специальных требований (в частности, xl,x2,...,xn; y должны быть независимыми, нормально распределенными случайными величинами с постоянными дисперсиями). В реальной жизни строгое соответствие требованиям регрессионного и корреляционного анализа встречается очень редко, однако оба эти метода весьма распространены в экономических исследованиях. Зависимости в экономике могут быть не только прямыми, но и обратными и нелинейными. Регрессионная модель может быть построена при наличии любой зависимости, однако в многофакторном анализе используют только линейные модели вида:

Построение уравнения регрессии осуществляется, как правило, методом наименьших квадратов, суть которого состоит в минимизации суммы квадратов отклонений фактических значений результатного признака от его расчетных значений, т.е.:

где т - число наблюдений;

j = a + b1x1+ b2x2j+ ... + bnхnj - расчетное значение результатного фактора.

Коэффициенты регрессии рекомендуется определять с помощью аналитических пакетов для персонального компьютера или специального финансового калькулятора. В наиболее простом случае коэффициенты регрессии однофакторного линейного уравнения регрессии вида y = а + bх можно найти по формулам:

Линейная регрессия

Если функция регрессии линейна, то говорят о линейной регрессии. Линейная регрессия (линейное уравнение) является распространенным (и простым) видом зависимости между экономическими переменными. Для простейшего случая парной линейной регрессии

или ,

где - теоретические параметры регрессии;- случайное отклонение.

По выборке ограниченного объема строится выборочное уравнение регрессии(1)

где - оценки неизвестных параметров, называемыевыборочными коэффициентами регрессии, - оценка условного математического ожидания. Для величинсправедлива формула

(2),где - оценка теоретического отклонения.

Построенная прямая выборочной регрессии должна наилучшим образом описывать эмпирические данные, т.е. коэффициентыдолжны быть такими, чтобы случайные отклонениябыли минимальны. Наиболее распространенным методом нахождения коэффициентов уравнения регрессии являетсяметод наименьших квадратов (МНК).

Если по выборке требуется определить оценкивыборочного уравнения регрессии (2), то вводится в рассмотрение и минимизируетсяфункция

.

Необходимым условием существования минимума данной функции двух переменных является равенство нулю ее частных производных по неизвестным параметрам :

.

Отсюда 

,

и выразив из последних соотношений коэффициенты, получим

. (3)

где введены обозначения .