logo
Информатика Лекции ЭК 1курс

3.Розрахунок коефіцієнта кореляції

Якісне оцінювання ступеня зв'язку випадкових ве­личин може бути виконане з використанням коефіцієн­та детермінації за шкалою Чеддока:

0,1...0,3 — незначний; 0,7 ... 0,9 — високий;

0,3...0,5 — помірний; 0,9 ... 0,99 — дуже високий;

0,5... 0,7 — істотний; 1,0 — функціональний. Якщо коефіцієнт детермінації R2 > 0,7, то варіація залежної змінної в основному обумовлена впливом факторів, і для прогнозування можна використовувати одержані регресійні моделі.

Якщо аналізується невелика сукупність даних (п < < 30), то для визначення їх довірчого інтервалу використовується t-критерій Стьюдента. Розраховане значення t-критерію t для коефіцієнта кореляції порівнюється з критичним з урахуванням прийнятого рівня значущості, а також кількості ступенів вільності та вважається типовим, якщо tp > tк. Аналогічне оцінюється значущість факторів х на основі t-критерій:

параметрів моделі ;

Табличний редактор Excel дає змогу використати різні інструменти Анализа данных (Корреляция, Ковариация, Регрессия) для одержання параметрів ліній­ної парної та множинної регресій, а також оцінки ступе­ня зв'язку.

Аналіз правових даних є досить складною задачею, тому під час проведення кореляпійно-регресійного аналізу слід дотримуватись наступних вимог до вхід­них даних для одержання вірогідного результату:

• статистична сукупність даних має включати дос­татню кількість спостережень або однорідних об'єктів (не менше п’яти) — чим більша кількість спостере­жень, тим точнішими будуть результати одержаних рівнянь залежності;

• статистичні дані мають бути відібрані за однакові періоди часу (місяць, квартал, рік) або для однорідних об'єктів;

• при проведенні множинної регресії кількість фак­торів має бути меншою (хоча б на два), ніж кількість спостережень.

Розглянемо процедуру проведення багатофакторного кореляційного аналізу із застосуванням засобу Анализ данных Excel.

Етап 1. Визначаємо фактори, що впливають на результативний показник, і відбираємо найістотніші них. Основні правила відбору факторів:

• результативним фактором, як правило, визначається якісний показник ефективності певної сфери діяльності підприємства (прибуток, рентабельність, дохідність, обсяг реалізації, собівартість тощо);

• слід ураховувати наявність причинно-наслідковог' зв'язку між показниками, що дає змогу розкрити сутність явищ, які досліджуються;

•треба відбирати найбільш значущі фактори, ос кільки охопити всі умови та обставини впливу на результативний показник неможливо;

• усі фактори мають бути кількісними з одиницями виміру;

• не рекомендується включати в кореляційну модель взаємопов'язані фактори, для чого їх слід перевірити на мультиколінеарність;

• не можна включати в кореляційну модель фактори, зв'язок яких з результативним показником ма функціональний характер.

Перевірка на мультиколінеарність передбачає оцінювання взаємозв'язку між окремими факторами-ознаками. За наявності лінійної залежності між факторам] система нормальних рівнянь не матиме однозначною розв'язку, внаслідок чого коефіцієнти регресії та інші оцінки будуть нестійкими. Крім того, наявність взаємозв'язку факторів утруднює економічну інтерпретацію рівняння зв'язку, оскільки зміна одного фактор, спричиняє, як правило, зміну іншого, який з ним пов'язаний.

Існує кілька методів виключення мультиколінеарності, проте найчастіше застосовується метод оцінювання парних коефіцієнтів кореляції. Критерієм мультиколінеарності вважається виконання двох нерівностей:

rxjy >rxjxk; rxky>rxjxk

Якщо ці нерівності або хоча б одна з них не виконується, то виключається той фактор х, зв'язок якого результативним показником у буде менш тісним.

Для оцінювання парного кореляційного зв'язку між факторами можна використати інструмент Корреляция з Анализа данных або статистичну функцію КОРРЕЛ. У першому випадку дістанемо таблицю парних коефіцієнтів кореляції для кількох факторів одночасно (але без зворотного зв'язку з вхідними даними) у другому випадку можемо виконати обчислення лише для двох масивів.

Розглянемо спочатку процедуру застосування інструмента Корреляция. Показники, відібрані для про ведення аналізу, оформляємо у вигляді таблиці-спис ку, дані якої можуть бути розміщені по рядкам або ш стовпцям; першим рядком (стовпцем) списку є рядої назв показників. Після подачі команди Анализ данних.../Корреляция з меню Сервис на екрані монітора з'явиться діалогове вікно, в якому потрібно вказати такі параметри:

• вхідний інтервал — посилання на діапазон аналізо­ваних даних;

• групування — визначення послідовності розміщен­ня даних (по рядках або по стовпцях);

• мітки — параметр для автоматичного формування рядка (стовпця) назв показників;

•вихідний діапазон — посилання на ліву верхню клітинку вихідного діапазону активного робочого лист­ка, нового робочого листка або нової робочої книги. При цьому можна задати ім'я нового робочого листка, де ви­хідний діапазон почнеться з клітинки А1.

• множина регресії включатиме аналіз впливу трьох факторів — виробітку одного робітника, матеріаловіддачі та витрат на 1 грн. реалізації.

Одержати парні коефіцієнти кореляції можна такої за допомогою статистичної функції КОРРЕЛ. Для цього поетапно розраховуємо кожну пару коефіцієнтів, копіюванні формули фіксуємо посилання на адреси першого масиву відповідної пари (абсолютна адресація) В результаті дістанемо таку матрицю коефіцієнтів:

уу ух1 ух2 ..... ухт

ух1 х1х1 х1х2 ..... х1хт

ух2 х2х1 х2х2 ..... х2хт

..... ..... ...... .... ......

ухт х1хт х2хт .... хтхт