logo
Учебник Математики и информатики

Ранговые корреляционные статистики. Устойчивость оценки

Если гху > 0, то линии регрессии наклонены вправо, если гху < 0 - влево.

Если | rxv | = 1, то линии регрессии сливаются в одну линию, а cлучайные величины X и Y связаны между собой линейной функ­циональней зависимостью Y = аХ + b (а и b r).

Если гху = 0, то линии регрессии проходят параллельно осям координат, в этом случае X к Y некоррелированы, в частности так будет всегда, когда X и Y - независимы; обратное заключение сделать нельзя, так как случайные величины X и Y могут быть cвязаны некоторой нелинейной функциональной зависимостью, а коэффициент корреляции гху = 0 .

Таким образом, величина коэффициента корреляции характери­зует, насколько близка связь между случайными величинами X и Y к линейной зависимости, если гху  0,4, то считают, что линей­ной корреляционной зависимости нет.

Выборочные уравнения прямых регрессий, найденные методом наименьших квадратов, имеют вид:

в(y)

yx – y = rв (x - x) (4)

в(x)

в(x)

xy – x = rв (y - y) (5)

в(y)

где x - оценка математического ожидания случайной величины X (выборочная средняя X);

y - оценка M(Y) (выборочная средняя Y).

в(x) =  Dв (x), в(x) =  Dв(y), где

Dв(x) – выборочная дисперсия (оценка D (X)), Dв(y) выборочная дисперсия (оценка D (Y)),

rв - выборочный коэффициент корреляции (оценка коэффициента корреляции),

п ричем rв = xy - x y

в(x) в(y)

г де xy = 1/n nij xi yj ,

(ij)

п - объем выборки;

nij - частота наблюдавшегося значения i, уj) случайного вектора (X, Y)

 nij xi yj - n x y

или rв = (i,j) (6)

nв(x) в(y)

Выборочный коэффициент корреляции также служит для ха­рактеристики линейной связи между X и Y.

Пример:

Координаты (X; Y) падения ракеты есть нормальный случай­ный вектор. Результаты 100 испытаний записаны в корреляционной таблице (табл. 3.2).

Таблица 3.2.

Y

X

16

26

36

46

56

ni

20

4

4

25

6

8

14

30

10

32

4

46

35

3

12

1

16

40

9

6

5

20

nj

10

18

44

22

6

N=100

Задача: 1. Рассчитать для каждого значения случайной величины X соответствующую среднюю у х , результат записать в виде таблицы 3.3.

Таблица 3.3

X

x1

x2

• • •

xn

yх

yх1

yх2

• • •

yхn

2. Изобразить точки (xyх ) = 1,n на поле корреляции (прямоуголь­ная система координат, на которой отмечены значения изучаемого случайного вектора) и соединить их отрезками прямой, получим ломаную линию, которую называют опытной линией регрессии Y по х.

Замечание. Если бы была возможность неограниченного уве­личения объема выборки, то влияние всех факторов, кроме X, на изменение Y взаимно погашалось бы, и в пределе опытная линия регрессии перешла бы в плавную линию, представляющую собой теоретическую линию регрессии. Аналогично могла бы быть по­строена опытная линия регрессии X по у.

3. Найти выборочный коэффициент корреляции, по его величи­не сделать вывод о том, можно ли опытную линию регрессии заме­нить прямой линией регрессии.

4. Найти выборочное уравнение прямой линии регрессии У по х. преобразовать его к виду у = kx ±в, построить на поле корреля­ции.

Решение.

1. Найдем опытную линию регрессии Y no х

y20 = 16,0

y25 = 16-6 + 26-8 = 21,57 21,6

14

y30 = 26-10 + 36-32 + 46-4  34,7

46

y35 = 36 3 + 46 12 + 56 44,8

16

y40 = 36-9+46-6 + 56-5  44,0

20

Таблица 3.3а

X

20

25

30

35

40

yx

16,0

21,6

34,7

44,8

44,0

Построим опытную линию регрессии на поле корреляции (рис.3.12).

Y

56 47,64

46

36

26

18,64

M (20;16)

M

25 30 35 40 X

Рис. 3.12. Опытная линия регрессии

2. Найдем выборочный коэффициент корреляции по формуле (6). Дчя этого составим корреляционную табл. 2, переходя к услов­ным вариантам ui и vj, по формулам:

ui = xi - C1 vj = yi - C2

h1 h2

С, = 30 и С2 = 36 - ложные нули,

h1 = 5 и h2 = 10 - разность между двумя соседними вариан­тами X и У.

Например:

u 1 = x1 - C1 = 20 - 30 = - 2

h1 5

v j = yi - C2 = 16 -36 = - 2

h2 10

и так далее перейдём к условным вариантам. Полученные результаты сведём с таблицу 3.4.

Таблица 3.4.

v

u

-2

-1

0

1

2

ni

-2

4

4

-1

6

8

14

0

10

32

4

46

1

3

12

1

16

2

9

6

5

20

nj

10

18

44

22

6

n = 100

Найдём u и v

u = 1/n ni ui =1/100 (4(-2) + 14(-1) + 46· 0 +16·1 + 20·2) = 0,34

v = 1/n nj vj =1/100 (10(-2) + 18(-1) + 44 · 0 +22·1 + 6·2) = - 0,04

Найдеми² и v2 :

и² = 1/n ni ui² = 1/100 (4·4 + 14 ·1 + 16 ·1 + 20 ·4) = 1,26

(i)

v² = 1/n nj v= 1/100 (10·4 + 18 ·1 + 22 ·1 + 6 ·4) =1,04

(j)

Найдём в(u),в(v)

в(u) = u² - (u)² =  1,26 – 0,34² = 1,07

в(v) = v² -(v)² =  1,04 – 0,04² = 1,02

Найдём nij ui vj, для чего составим расчётную таблицу 4

(ij)

1). Произведения частоты ntj на варианту vj то есть ntj vj записываем в правом верхнем углу клетки, содержащей значение частоты.

2). Складываем все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещаем в клетку этой же строки "столбца v".

3). Умножаем варианту ui на v и полученное произведение за­писываем в соответствующую клетку "столбца ui v ".

4). Суммируя числа последнего столбца табл. 3, находим nij ui vj

(i,j)

Таблица 3.5.

Для контроля вычислений аналогично находим сумму чисел по­следней строки. Совпадение сумм свидетельствует о правильности вычислений.

Найдем выборочный коэффициент корреляции

nij ui vj – n u v

r в = (ij) = 82 -100 0,34 (-0.04)  0,76

n в(u)в(v) 100 •1,07•1,02

Вывод. Так как rв достаточно велико, то опытную линию рег­рессии можно заменить прямой линией.

3. Найдем выборочное уравнение прямой линии регрессии Y по х по формуле (4).

1) Найдем х и у, учитывая, что С1, =30, h1=5, С2 =36, h2=10.

х = uh1 + С1= 0,34 • 5 + 30 = 31,70

у = vh2 + С2 =(-0,04) •10 + 36 = 35,60.

2) Найдем в (х) и в (у):

в(х) = h1· в(u) = 5· 1,07 = 5,35;

в(y) = h1· в(v) = 10 ·1,02 = 10,20

Следовательно, уравнение прямой линией регрессии У по х будет иметь вид:

10,20

уx -35,60 = 0,76 · (х - 31,70)

5,35

или окончательно:

yx = 1,45x –10,36