logo search

4.1.4. Коэффициент корреляции

При расчете погрешности измерительного канала возникает задача суммирования погрешностей средств измерений, которые являются случайными величинами. Способ суммирования будет различным в зависимости от того, являются ли случайные величины статистически зависимыми. Понятие статистической зависимости иллюстрируется рис. 4.2: если с ростом одной случайной величины Хв среднем увеличивается (или уменьшается) и вторая (Y), то между этими величинами имеется статистическая зависимость. Для ее количественного описания используется понятие ковариации или коэффициента корреляции.

Рассмотрим суммирование двух случайных погрешностей   и   с нулевым математическим ожиданием (т. е. центрированных случайных величин). Дисперсия суммы двух случайных величин по определению равна математическому ожиданию квадрата их суммы:

=  ,

(4.25)

где   и   - операторы дисперсии и математического ожидания;  ,   - среднеквадратические отклонения случайных величин  и  . Величина

(4.26)

называется ковариацией ("совместной вариацией") случайных величин   и  .

Ковариацию дискретных случайных величин можно оценить по их дискретным значениям   и   с помощью формулы среднего арифметического:

.

(4.27)

Коэффициентом корреляции   называют отношение ковариации к произведению среднеквадратических отклонений   и  случайных величин   и  :

.

(4.28)

Когда случайные величины независимы, их коэффициент корреляции равен нулю,   [Гмурман] и такие величины называются некоррелированными. Если коэффициент корреляции равен единице  , то между величинами   и   имеется не статистическая, а функциональная зависимость.

Используя понятие среднеквадратического отклонения  , уравнение (4.25) можно записать в виде

.

(4.29)

Здесь знак "-" используется когда случайные величины вычитаются, например, если находится разность напряжений двух измерительных каналов. При этом наличие корреляции между каналами частично уменьшает погрешность разности.

В случае, когда случайные величины статистически независимы ( ), предыдущее выражение упрощается:

.

(4.30)

Такое суммирование называют геометрическим, поскольку оно выполняется аналогично нахождению гипотенузы прямоугольного треугольника.

Если коэффициент корреляции  , то

.

(4.31)

Если коэффициент корреляции равен  , то

,

(4.32)

т.е. при нахождении суммы случайных величин отрицательный коэффициент корреляции уменьшает итоговую погрешность, а при нахождении разности - увеличивает.

Если случайные величины не центрированы и имеют математические ожидания   и  , то коэффициент корреляции можно оценить как

.

(4.33)

На рис. 4.2 показаны примеры статистической зависимости между случайными величинами при сильной (а) и слабой (б) корреляции. Точки на графике (значения случайной величины) могут группироваться очень близко к прямой линии, которая аппроксимирует эту зависимость, и тогда статистическая зависимость приближается к детерминированной. Степень отличия статистической зависимости от детерминированной характеризуют коэффициентом корреляции  .

(а)

(б)

Рис. 4.2. Примеры сильной (а),   и слабой (б),  корреляции случайных величин   и  . Показана также прямая линия среднеквадратической регрессии

Прямая линия, проведенная таким образом, что сумма квадратов отклонений значений случайной величины от этой линии минимальна, называется линией среднеквадратической регрессии. Тангенс угла наклона линии называется коэффициентом регрессии. Уравнение линии регрессии можно получить методом наименьших квадратов; оно имеет вид [Кремер]

,

где  - коэффициент регрессии. Коэффициент регрессии вычисляется через коэффициент корреляции   и среднеквадратические отклонения   и   как

.

(4.34)

Коэффициент корреляции приобретает ясный физический смысл, если статистические переменные центрировать (вычесть математическое ожидание) и нормировать на величину среднеквадратического отклонения. Поскольку среднеквадратические отклонения нормированных величин равны единице, то коэффициент корреляции (4.33) становится равен тангенсу наклона линии среднеквадратической регрессии.

Статистическая зависимость между погрешностями средств измерений в общем случае нелинейная, однако этой нелинейностью обычно пренебрегают.